Теория положительного подкрепления. Методы формирования позитивного поведения

Позитивное подкрепление - это некоторые приятные для человека последствия или результаты деятельности (вознаграждение, похвала, успех и др.), которые побуждают его к выполнению какой-либо деятельности.

Человек после выполнения определенной деятельности может получить одобрение, позитивную оценку, материальное вознаграждение, т.е. позитивное подкрепление. Удовольствие вследствие позитивного подкрепления связывается с деятельностью, таким образом устанавливается связь "деятельность - удовольствие". У человека, согласно принципу удовольствия Фрейда, возникает стремление и в будущем получить удовольствие (похвалу, материальное вознаграждение и т.п.), что побуждает его к выполнению той деятельности, которую подкрепляли, т.е. которая связывалась с удовольствием.

Если процесс деятельности или его результат не подкрепляется (т.е. когда не было ни одобрения, ни вознаграждения и соответственно удовлетворения), то в таком случае менее вероятно, что в будущем человек будет выполнять эту деятельность по собственному желанию. Следовательно, при отсутствии связи "деятельность - удовольствие" субъект не будет стремиться к ее выполнению.

Позитивные переживания, которые связываются с определенной деятельностью, выполняют роль эмоционального подкрепления того, что происходило до или во время переживания. Вследствие этого человек будет стремиться выполнять то, что вызвало удовольствие или то, что предоставило возможность избежать неудовольствия. Если какое-то действие сочеталось с приятным переживанием, то сочетание позитивных эмоций с деятельностью усиливает мотивацию (интерес) к этой деятельности.

Приведем несколько примеров позитивного подкрепления.

1. Вследствие успешных занятий физикой ученик получает одобрения от учителей, родителей и друзей (подкрепление 1), высокие оценки (подкрепление 2), призовые места на олимпиадах (подкрепление 3), одобрения друзей за интересные опыты и помощь в решении задач (подкрепление 4). Удовольствие, которое возникает вследствие подкрепления, будет побуждать его к занятиям физикой. Предвкушая получение удовольствия, ученик будет усиленно заниматься этим предметом. Физика связывается с удовольствием и в будущем сама по себе будет приятна для ученика. Чем сильнее подкрепление (большее число подкреплений и соответственно большее удовольствие), тем более привлекательной становится физика для ученика.

2. Ребенок за определенные действия (например, за помощь старшим) получает похвалу от взрослых (подкрепление 1), материальное вознаграждение, например конфеты, шоколад (подкрепление 2), определенные поблажки (подкрепление 3).

Стремление получить удовольствие (похвалу, конфеты, поблажки и т.п.) будет побуждать ребенка и в будущем к выполнениюэтих действий.

3. Если изготовив, например, полку или стул, человек почувствовал удовольствие вследствие успешного завершения работы и пользы от него (подкрепление 1), материального вознаграждения (подкрепление 2), одобрения жены или родителей (подкрепление 3), то, предвкушая возможность получить подкрепление (и удовольствие), он и впредь будет стремиться что-либо изготавливать.

Определенные формы поведения закрепляются (и повторяются в будущем) тогда, когда они сопровождаются позитивными последствиями (вознаграждением, одобрением, возможностью самоутвердиться). И вероятность их повторения, как правило, уменьшается, если эти действия не связаны с приятными эмоциями, или же, наоборот, сопровождаются чем-то негативным (наказанием, неодобрением и т.п.).

Эти закономерности часто используют учителя и родители: регулярно прибегая к похвале, они формируют у детей соответствующую мотивацию и поведение. А чтобы удержать детей от нежелательных действий и поступков, применяют наказание, неодобрение, выражая неудовлетворенность действиями ребенка. Если человек получает позитивное подкрепление (одобрение, вознаграждение) за определенные формы поведения, то такие действия закрепляются и в будущем воспроизводятся. А прибегая к наказанию, человека заставляют избегать определенных действий: например, наказывая ребенка за кражу, стремятся принудить его не воровать в будущем.

Родители, по мнению Скиннера, могли бы целиком полагаться на позитивное подкрепление (например, на одобрение), никогда не наказывая ребенка. Вследствие использования одобрения воспитание ребенка является высокоэффективным и гуманным. Однако в воспитательном процессе нередко прибегают к наказанию, которое не всегда является эффективным, а часто и вредит воспитанию личности. Подвергаясь наказанию за определенные действия или бездеятельность, человек впредь будет действовать "так, как нужно" не потому, что ему так хочется, а потому, что боится наказания. И когда угроза наказания исчезает, то предыдущие нежелательные формы поведения восстанавливаются.

Наиболее распространенным методом формирования желательного поведения является подкрепление. В его основе лежит преимущественно оперантный принцип обусловливания. Следует отметить, что как положительное, так и негативное подкрепление усиливают вероятность возникновения реакции. Положительные подкрепляющие стимулы предполагают предъявление чего-то, а отрицательные подкрепляющие стимулы - удаление чего-то в данной ситуации.

Позитивное подкрепление - главный метод изменения поведения. Условия успеха: » подкрепление должно быть индивидуально значимым; » подкрепление должно применяться систематически и немедленно вслед за желательным поведением; » связь между желательным поведением и используемым при этом подкреплении должна быть достаточно четкой.

Подкрепление можно осуществлять непосредственно (с помощью реальных подкрепляющих стимулов) или косвенно (с помощью символов, жестов). Кроме того, подкрепление может быть опосредованным, когда клиенты наблюдают за моделями - людьми, которые получают награду за желательное поведение.

Иногда положительное подкрепление может вознаграждать неправильное поведение. Например, подросток в ответ на суицидальную попытку может получить награду - повышенное внимание и заботу семьи, вместо того чтобы подкреплялось его независимое поведение.

Многие подкрепляющие стимулы, такие, как похвала или проявление интереса, люди непроизвольно используют в ходе повседневной жизни. Метод подкрепления предполагает целенаправленное его применение с целью усиления адаптивных видов поведения и ослабления и устранения неадекватных его форм. Первоначально проводится идентификация подкрепляющих стимулов. Для этого необходимо выяснить, что именно является подкрепляющими стимулами для конкретного человека. Также можно предложить клиенту составить шкалу "приятных событий" или список условий, улучшающих настроение. При работе с детьми для представления подкрепляющих стимулов вместо слов можно использовать картинки, на которых изображены потенциально приятные деятельности.

Подкрепляющие стимулы соотносятся с тремя жизненно важными сферами: » взаимодействие (отношения); » переживания, несовместимые с депрессией (агрессией); » действия, повышающие самооценку с помощью ощущений адекватности и компетентности (творчество, успех, любимое занятие и т.д.).

Консультант и ближайшее окружение могут широко использовать выявленные стимулы для подкрепления желательного поведения личности с девиацией. Также клиента побуждают использовать подкрепляющие стимулы каждый раз при действиях, соответствующих его целям.

С целью формирования более позитивного поведения также используют программы жетонного подкрепления. Жетоны - это вещественные условные подкрепляющие стимулы (очки, значки, фишки), которые могут быть обменены на подкрепляющие стимулы. Последние могут выглядеть как право участия в интересной деятельности, ценные призы, лакомства и т.п. Программы жетонного подкрепления должны включать в себя четкие правила обмена, определяющие, какое количество жетонов требуется для получения подкрепляющих стимулов. Данный метод широко используется в различных учреждениях (больницах, местах заключения). Он достаточно популярен среди детей.

При применении жетонов частота дурного поведения существенно уменьшается. Однако вслед за отменой жетонного подкрепления может наблюдаться и уменьшение случаев желательного поведения. В связи с этим целесообразно постепенно сводить на нет жетонное подкрепление, заменяя его, например, похвалой и самоподкреплением. Клиентам не следует пассивно полагаться на окружающих, они должны определять и активно разыскивать людей, виды деятельности и ситуации, которые могли бы обеспечить им желательное подкрепление.

Программы подкрепления и жетонная система могут включать в себя работу со значимыми другими, например обучение преподавателей или родителей процедурам подкрепления (для отдельных детей или для детских групп). Кроме того, как преподаватели, так и родители должны отдавать себе отчет в том, что они могут по неосторожности подкрепить некоторые виды поведения, который по их словам, они пытаются устранить.

Формирование желательного поведения может осуществляться в форме активного социального обучения адаптивным поведенческим реакциям. Нередко уже при проведении поведенческой оценки выявляется дефицит ведущих социальных навыков. Клиенты не умеют выслушивать собеседника, предоставлять обратную связь и самораскрываться, демонстрировать уверенность, разрешать конфликты, сопротивляться негативному влиянию среды или принимать решения. Репетиция поведения - это один из методов профессионального консультирования, широко используемый в случаях отклоняющегося поведения. Данный метод может иметь форму тренинга, групповых игр, моделирования и разыгрывания ситуаций.

На первых этапах работы выявляются области, в которых клиенты испытывают трудности, и стимулируется мотивация к обучению. Далее определяются виды желательного поведения, наиболее адекватного в проблемных ситуациях. Затем клиентам предоставляется возможность потренироваться, реагируя на определенные ситуации в процессе ролевой игры (консультанты, как правило, играют роль "оппонентов"). Наконец, клиентов побуждают применять репетируемое поведение в реальных жизненных ситуациях, одобряя их в случае успеха и подкрепляя адаптивное поведение.

Тренинг ассертивности, пожалуй, имеет наибольшее значение при проведении репетиции поведения. Д. Вольпе определил ассертивное поведение как "приемлемое выражение любой отличной от тревоги эмоции, имеющей отношение к другому человеку" .

На первых порах использования методики тренинг ассертивности был направлен на отстаивание человеком своих прав и интересов. В последнее время его направленность несколько изменилась. Область его применения расширилась в связи с включением в тренинг развития навыков проявления и точной передачи эмоционально теплого поведения там, где это уместно. Таким образом, ассертивное поведение теперь включает в себя социально-приемлемое выражение как положительных, так и отрицательных чувств.

Тренинг ассертивности основан на выделении трех видов поведения: » неассертивное, или заторможенное, поведение, при котором люди жертвуют своими интересами; » агрессивное поведение, при котором люди "усиливаются" за счет других; » ассертивное поведение, при котором выигрывают обе взаимодействующие стороны.

Недостаток уверенности в себе или агрессивность могут быть либо общеличностным свойством, либо чертой, проявляющейся лишь в специфических ситуациях. На первом этапе поведенческой оценки решается вопрос, в каком виде тренинга клиент нуждается - в общем или в специфическом. На втором этапе Формируется мотивация клиентов на сотрудничество. Полезно изучить взгляды и убеждения клиентов, чтобы опираться на них впоследствии. Например, нужно помочь членам религиозных культов понять, что они станут более эффективными и как люди, и как верующие, если перестанут отвергать свои потребности и чувства (что всегда связано с психологическими потерями).

На третьем этапе определяют, какой вид альтернативного поведения может быть подходящим в определенных ситуациях например при необходимости оказать сопротивление негативному влиянию референтной группы. Клиентам можно порекомендовать наблюдать за людьми, которые действуют эффективно. При этом следует принимать во внимание индивидуальные стили поведения клиентов и помогать им формировать такое поведение, которое будет как можно более "естественным" для них. Реакции, которые представляются уместными консультантам, могут оказаться неподходящими для конкретного клиента. Важен также правильный выбор времени: клиентов не следует побуждать к решению ассертивных задач тогда, когда они еще к этому не готовы. Следовательно, может возникнуть необходимость построения иерархии ассертив-ных задач, сложность которых постепенно повышается.

На четвертом этапе осуществляется репетиция ассертивного поведения. Важно фокусировать внимание клиентов не только на вербальных составляющих поведения, но и на других его компонентах, таких, как контакт глаз, позы, жесты, выражение лица, тон и громкость голоса, интонации, плавность речи.

На пятом этапе клиентов побуждают применять приобретенные на занятиях знания в реальной жизни, например с помощью домашнего задания соответствующего уровня сложности. В интервалах между занятиями обучающиеся также могут самостоятельно пытаться применять адаптивные социальные навыки в реальной жизни. Наличие таких попыток указывает на адекватность поведения клиентов. Кроме того, пробуя и экспериментируя, клиенты определяют, какие еще поправки следует внести в поведение.

Тренинг ассертивности можно применять в форме индивидуальной, групповой работы или в форме самопомощи. Группы могут быть гетерогенными (например, группа из подростков без проблемного поведения и с делинквентным поведением) или гомогенными (например, группа наркозависимых подростков). Следует иметь в виду: вследствие сопротивления клиентов позитивным изменениям могут возникать конфликты между консультантом и клиентами, что всегда следует предвидеть как возможную трудность.

В практике поведенческого консультирования наряду с тренингом ассертивности используются и другие технологии, позволяющие расширять позитивный поведенческий репертуар личности. Это - тренинги уверенности, коммуникативных навыков, принятия решения, резистентности к социальному давлению, разрешения конфликтов. При этом используются самые разнообразные приемы поведенческой психологии, например ролевые игры и игровые упражнения, тренинг в повседневных ситуациях, обучение на додели, позитивное подкрепление, видеотехники, групповые дискуссии, способы самоконтроля и т.д.

Методы, используемые консультантом в профессиональной деятельности, должны быть адекватны как проблемам клиента, так и возможностям консультанта. В настоящее время в работе с личностью, имеющей отклоняющееся поведение, чаще используется интегративный подход, предполагающий комбинацию взаимодополняющих теорий и методов. Интегративный подход также определяет сочетание различных форм работы. Например, для подростка с зависимым поведением может быть адекватной следующая схема психологической помощи: семейное консультирование - семейная системная психотерапия - социально-психологическая реабилитация подростка и групповая психотерапия - индивидуальная психотерапия в сочетании с семейным консультированием.

Хочется еще раз подчеркнуть, что семейное консультирование и семейная психотерапия являются приоритетным направлением в работе с детьми и подростками . Если сотрудничество с семьей по каким-либо причинам затруднено, если семья не может выполнять воспитательных функций, подросток с девиантным поведением должен включаться в другую социальную группу - тренинговую, психотерапевтическую или реабилитационную. Работа с девиантным поведением - это работа с нарушенным социальным поведением, поэтому его изменение возможно только через включение личности в поддерживающие и конструктивные социальные системы. Одна из ведущих задач психолога состоит в проектировании социотерапевтической среды, а также новых конструктивных отношений личности.

Разнообразие методов и методик не может преуменьшить роль личности консультанта. На всех этапах совместной работы поведение специалиста остается ведущим источником подкрепления позитивных изменений в поведении клиента, а личность консультанта - основным инструментом его профессиональной деятельности. Считается, что консультанты, проявляющие высокий уровень таких профессионально важных качеств, как эмпатия, внимание, бескорыстная сердечность и искренность, работают более эффективно. Это объясняется тем, что искренне сопереживающие своим клиентам консультанты оказывают на них положительное воздействие независимо от используемого метода.

Рекомендуемая литература

Раттер М. Помощь трудным детям. - М., 1987.

Рыжова Н.А. Поведенческие расстройства у детей: Диагностика, коррекция, психопрофилактика. - М., 1998.

Федоров А.П. Методы поведенческой психотерапии: Учеб.-метод. пособие. - СПб., 1987.

Федоров А.П. Когнитивная психотерапия: Учеб. пособие. - СПб., 1991.

Черников А. Системная семейная терапия. - М., 2001.

Эйдемиллер Э.Г., Юстицкис В. Психология и психотерапия семьи. - СПб., 1999.

Энциклопедия глубинной психологии / Под ред. А. М. Боковикова. - М., 2001.

Джонсон В. Как заставить наркомана или алкоголика лечиться. 2000.

Игумнов С.А. Клиническая психотерапия детей и подростков: Справ, пособие. - Минск, 1999.

Кинг М., Коэн У., Цитренбаум Ч. Гипнотерапия вредных привычек. - М., 1998.

Кулаков С.А. Диагностика и психотерапия аддиктивного поведения у подростков: Учеб.-метод. пособие. - М., 1998.

Кулаков С.А. На приеме у психолога - подросток: Пособие для практ. психол. - СПб., 2001.

Мак-Вильяме Н. Психоаналитическая диагностика. - М., 1998.

Мейер В., Чессер Э. Методы поведенческой терапии. - СПб., 2000.

Морли С, Шефферд Дж., Спенс С. Методы когнитивной терапии и тренинга социальных навыков. - СПб., 1996.

Моховиков А.Н. Телефонное консультирование. - М., 1999.

Нельсон-Джоунс Р. Теория и практика консультирования. - СПб., 2000.

Психология деструктивных культов: Профилактика и терапия культовых травм //Журнал практического психолога. Спец. вып. - М., 2000. - № 1-2.

Психология и лечение зависимого поведения / Под ред. С. Даулинга. - М., 2000.

Психосоциальная коррекция и реабилитация несовершеннолетни* с девиантным поведением / Под ред. С.А. Беличевой - М., 1999.

Психотерапевтическая энциклопедия / Под ред. Б. Д. Карвасарско- го. - СПб., 1998.

Психотерапия детей и подростков: Пер. с нем. / Под ред. шмидта. - М., 2000.

Когда ребенок делает что-то нехорошее – врет, не хочет умываться, плохо учится, – родители реагируют немедленно. Но сделанное как надо нередко остается без внимания. Один из самых авторитетных психологов мира, руководитель Центра по воспитанию детей в Йеле Алан Каздин считает, что похвала может быть исключительно действенной. Однако, чтобы она повлияла на изменение поведения, необходимо применять ее особым образом.

Бесполезно по сто раз в день просто говорить: «Прекрасно! Молодец!» О том, как хвалить правильно, и рассказывает эта книга.

Книга:

Основные методы позитивного подкрепления

Позитивное подкрепление связано со стимулированием желательного поведения – это так. Однако большинство родителей хотят исправить или прекратить нежелательное поведение. Их раздражает, что дети прерывают взрослых, балуются за столом, ругаются с братьями и сестрами, огрызаются, лгут, воруют и т. п. Может ли в этом случае помочь позитивное подкрепление? Да. На самом деле это единственный надежный способ исправления подобного поведения. Поэтому я расскажу о некоторых методиках, основанных на позитивном подкреплении.

1. Подкрепление позитивных противоположностей. Если вы хотите прекратить нежелательное поведение, неважно – ребенка, супруга или коллеги, начните с определения позитивной противоположности. Это будет целью вашей работы. Вы должны точно описать, какое поведение хотите видеть вместо нежелательного. Имея в виду эту цель, вы можете использовать временную линию – предшествующие события, поведение в настоящее время и результаты. Эти методы помогут вам подкрепить желательное поведение и при этом не поощрять случайно нежелательных действий. Но вся ваша работа основана на определении желательного поведения: что вы хотите увидеть ?

Это жизненно важно. Родителям, окончившим «курс обучения», мы предлагаем тест. Мы разработали несколько довольно распространенных гипотетических ситуаций и спрашиваем родителей, как бы они исправили нежелательное поведение – грубые выходки за обедом, капризы в магазине и т. д. Мы считаем, что поработали с родителями успешно, если они говорят примерно так: «Думаю, что позитивной противоположностью этого поведения было бы…» Если родители пропускают этот первый этап и сразу переходят к результатам, например, к наказаниям или игнорированию действий ребенка, мы понимаем, что не слишком помогли этой семье – т. е. научили методикам, но родители не до конца разобрались, с чего начинать, и не очень преуспели в работе над исправлением поведения. Нельзя прекратить нежелательные действия и подкрепить позитивное противоположное поведение, не определив его. Вам не нравится, как супруг выдавливает пасту из тюбика? Жалуйтесь, ворчите, кричите, повторяйте без конца: «Неужели трудно выдавливать пасту из конца тюбика? Сколько можно просить тебя?» Все будет бесполезно. Но через 5 или через 25 лет, когда вы все-таки определите позитивную противоположность и обратитесь к временн?й линии, вы добьетесь желаемого результата. И первый шаг для этого – определение желательного поведения: в данном случае это выдавливание зубной пасты из конца тюбика.

Рэй работал на дому. Большую часть времени у него занимали телефонные переговоры с клиентами. Старшему ребенку Рэя было уже 6 лет, и большую часть дня он проводил в школе. Но у 4-летней Анны была привычка обращаться к отцу с вопросами, когда он говорил по телефону. Она постоянно перебивала его. «Можно на улицу? Я хочу есть. Поиграй со мной!» Создавалось впечатление, что Анна только и ждет телефонного звонка, чтобы подойти к отцу. В выходные к ней присоединялся и брат.

Вмешательство детей в разговор взрослых – интересная проблема. Когда дети прерывают взрослых, это трудно игнорировать, а если это игнорировать, дети продолжают вторжение, пока становится невозможным не обращать на них внимание. В этот момент взрослый либо выполняет то, о чем просит ребенок, либо орет на него, или же истерически взывает к супругу… Это прекрасный пример, который показывает, насколько силен стимул – внимание к неподобающему поведению и формирование нежелательного навыка. Ребенок добился, что вы обратили на него внимание, и дальше будет продолжать в том же духе. Так было и с Рэем. Деловые звонки приводили к скандалам, которые часто заканчивались нервным срывом.

Рэй хотел, чтобы Анна не подходила к нему, когда он разговаривал по телефону, и обращалась со своими просьбами только до или после звонка. Теперь поставьте себя на место Рэя и вспомните временную линию. Начните с предшествующих событий. Что вы можете сделать, пока не зазвонил телефон? Когда вы не говорите по телефону, то можете спокойно сказать ребенку, чтобы он не мешал, когда раздастся звонок. Вам следует точно объяснить, что значит «мешать». Скажите ребенку, что во время разговора по телефону, ваш ответ на любой его вопрос – «нет». Но если он подождет, пока вы закончите разговор, и обратится с вопросом или просьбой, то может получить желаемое (или не получить – все зависит от конкретного случая). Но вы постараетесь разобраться в проблеме ребенка и помочь ему.

Работая над желательным поведением, инструктируйте ребенка непосредственно перед тем, как он будет выполнять желаемое действие. Такая подсказка особенно эффективна. Но Рэй не мог сказать точно, когда зазвонит телефон. Поэтому он объяснил все дочери в самом начале рабочего дня. Когда раздался первый звонок и Анна оказалась рядом, он сказал: «Ну вот, Анна, можешь посмотреть, дождешься ли ты окончания моего разговора». (Это очень хорошая формулировка – небольшое задание.)

Мы полагали, что в этой ситуации Рэй может применить также метод формирования навыка – за частичное проявление желательного поведения хвалить дочь. Мы решили, что Рэю следует оказывать внимание Анне. Через 2 минуты разговора по телефону в начале дня Рэй будет улыбаться Анне, показывать ей знаками, что она – молодец, шепотом скажет пару ободряющих слов и погладит по голове, если будет возможно. Достаточно будет проделать такие вещи во время нескольких первых звонков. Мы хотели, чтобы Рэй сразу похвалил Анну за то, что она не прерывает его, и похвалил с энтузиазмом. Если же Анна вмешивалась в каждый разговор, не оставляя Рэю шанса вознаградить желательное поведение, то следовало найти время и смоделировать ситуацию – поиграть в «Не мешай». Во время игры Рэй мог бы хвалить дочь, награждать ее призами и жетонами и т. д.

Что делать, если поведение ребенка вас не устраивает? Вы знаете, с чего начинать: понять, какое именно поведение вы хотите увидеть.

А теперь – результат. Мы рекомендовали Рэю подкреплять позитивное противоположное поведение Анны: обращения и вопросы до или после телефонного звонка. Если Анна демонстрирует нежелательное поведение, не обращать на нее внимания. Рэй должен отвернуться или строго посмотреть на ребенка. Если Анна обращалась к нему, когда он был свободен, следовала похвала: «Молодец! Ты просишь у меня печенье, когда я не говорю по телефону!» Рэй не должен был забывать и о других поощрениях (например, обнять или погладить дочь по спине). Между телефонными звонками следовало хвалить Анну за то, что она не мешала или почти не мешала.

Рэю и его жене понравилась программа исправления поведения, потому что она была совершенно реальной. Иногда мать могла похвалить Анну или, если был выходной, то обоих детей за то, что они тихо играли и не мешали отцу говорить по телефону.

Рэю приходилось звонить не менее 20 раз в день. До начала работы над поведением Анна прерывала Рэя около 30 раз; в первые же два дня количество ее вмешательств сократилось до 5, а через 5 дней нежелательное поведение прекратилось вообще. Нам понадобилось два выходных, чтобы научить тому же ее 6-летнего брата – в будни у него не было достаточно времени для отработки желательного поведения. Через 8 дней работы родители перестали хвалить детей: они целую неделю не вмешивались в разговоры, и стало понятно, что вознаграждения больше не требуются. Через две недели проблема, казалось, была решена. Через 4 недели Рэю опять помешали, через 8 недель единичный случай повторился. Оба раза Рэй просто игнорировал ребенка, и помехи прекратились навсегда.

Это очень типичная ситуация. Ребенок дразнит собаку или кошку, не относит грязную одежду в стирку, рано утром в воскресенье врывается в вашу в спальню, роняет еду на пол… Список бесконечен. Чтобы прекратить это, в первую очередь спросите себя: «Какую позитивную противоположность я хочу увидеть?»

Подкрепление позитивного противоположного поведения – универсальный инструмент, который можно использовать почти всегда. Но существует два более узкоспециализированных способа его применения.

2. Подкрепление действий, которые не совсем точно соответствуют позитивной противоположности. Как быть, если ребенок никогда не совершал ничего похожего на позитивную противоположность? Как подкрепить нужное поведение? Первый вариант – смоделировать ситуацию, чтобы отработать желательное поведение – это поведение в настоящем (середина временной линии), которое мы обсуждали в предыдущей главе. Мы говорили и о формировании навыка, тоже стратегии настоящего времени. Но в данном случае нет основы для формирования навыка. Проблему нужно решать иначе. Ключ к решению находится в Будущем (это последствие).

Метод состоит в том, что вы подкрепляете все или почти все, что ребенок делает иначе , – все, что отличается от нежелательного поведения. Фактически в любой момент времени ребенок совершает: или (1) нежелательное действие, или (2) другое действие. Последнее – это поведение, которое отличается от нежелательного. Мы принимаем это другое поведение, если необходимо немедленно исправить нежелательное.

Я на всю жизнь запомнил, как впервые применил этот метод. Это произошло благодаря одному 10-летнему мальчику по имени Эван. Учительница попросила меня поработать с ним прямо в школе. Эван был чрезмерно активным и сильно мешал на уроках. Активный – это еще мягко сказано. Во время урока Эван ходил по партам, наступая на вещи других учеников, громко разговаривал, со всеми пререкался и т. д. Учительница сказала, что он никогда не садится на свое место, и она ничуть не преувеличивала.

Какое действие подкреплять? Позитивное противоположное поведение – тихо сидеть за партой, работать, внимательно слушать учителя. Но Эван никогда не делал ничего подобного! Поначалу казалось, что формирование навыка невозможно. Поэтому мы решили начать с того, что хвалили Эвана за любое действие, кроме хождения по партам и громкого разговора. Иногда он на некоторое время замолкал. На самом деле иногда он останавливался около своей парты, но не работал. Тем не менее в эти моменты он не совершал ни одного из двух нежелательных действий, которые мы хотели прекратить: он не ходил по партам и не говорил вслух. Это не совсем соответствовало описанию позитивной противоположности его разрушительного поведения, но было лучше, чем ничего. С этого мы начали.

В течение двух дней я работал в классе по 30 минут, подсказывая учительнице, что делать. У меня был лист цветной бумаги (точнее, два листа, скрепленных вместе): одна сторона красная, другая зеленая. Когда Эван демонстрировал поведение, отличное от нежелательного, я немедленно показывал учительнице зеленую сторону. Это означало, что она должна была похвалить Эвана, если могла (это зависело от того, в каком месте класса она находилась в этот момент): подойти ближе, спокойно сказать ободряющие слова и погладить по голове. Если она не могла подойти ближе, то лишь громко хвалила Эвана. Было очень важно помочь учителю увидеть желательные действия Эвана, потому что обычно она реагировала на нежелательное поведение. Это нормально, поскольку человек устроен так, что немедленно реагирует на отрицательные стимулы и пропускает положительные. Эволюция сделала нас такими.

Учительница быстро овладела предложенным методом. За 30 минут, которые я находился в классе, она похвалила Эвана трижды – я подсказал только первые два раза, а третий она отметила сама. (Я ослабил подсказку; об этом приеме мы говорили в первой главе.) На второй день учительница похвалила Эвана дважды, без моей подсказки. Она пропустила третью возможность похвалить мальчика за поведение, отличающееся от обычного, чудовищного, – но в этот момент она отвернулась к доске. Поэтому, как только она опять повернулась к классу, я показал зеленый лист, и она похвалила Эвана. Мы решили, что попробуем наш метод на первых уроках и, если он сработает, то после обеда продолжим – главным образом потому, что корректное и своевременное подкрепление было очень трудно обеспечить, ведь в классе шел учебный процесс.

Через пару дней стало ясно, что метод работает. Эван меньше ходил по партам и почти не кричал. Теперь он даже время от времени садился на место – чего раньше никогда не наблюдалось. Поэтому мы перешли от вознаграждения любого поведения, отличного от желательного, к поощрению Эвана, сидящего за своей партой. Когда Эван сидел на своем месте, он частично демонстрировал желательное поведение, которое мы и хотели развить. Каждый раз, когда он просто садился на место, даже если он не работал и не слушал учителя, его поведение особо отмечалось. Если же Эван выполнял задание, то получал дополнительную похвалу. Процесс шел медленно (в конце концов у учителя был полный класс учеников) и занял несколько недель. Но мы добились, что большую часть урока Эван проводил на своем месте и больше не ходил по партам – именно последнее было наиболее нежелательно. Мало того, его привычка громко говорить в классе пропала сама собой. Очевидно, она была непосредственно связана с хождением по партам и тоже прекратилась.

Результативность метода поощрения поведения, близкого к желательному, подтверждает не только этот пример. Мы применяли его и в домашних условиях. Например, в одной семье два брата, 4 и 5 лет, постоянно ссорились, дразнились и задирали друг друга. Передышка наступала, только когда старший мальчик уходил на занятия. Сначала я подробно расспросил родителей, какое именно поведение они хотят увидеть. Они хотели, чтобы дети играли в одной комнате (пусть не вместе, но без драки); занимались чем-то вместе (например, играли в кубики или смотрели телевизор); мирно сосуществовали в других ситуациях (за обедом, в машине и т. д.). Из инструментов настоящего времени (поведение в настоящем) можно было бы выбрать моделирование и поиграть с ребятами в игру «Живем дружно». Но был и другой путь – инструменты будущего времени, т. е. последствия, использующие подкрепление другого поведения.

Под «другим поведением» мы понимали любые действия, кроме драки, которые мальчики совершали, находясь в пределах видимости друг друга (в одной комнате, в машине). Программа была разделена на две части. Когда братья были вместе и не ругались, один из родителей хвалил их. Кроме того, мальчиков предупредили, что за 2 минуты мирного поведения они получат очко. Так что на самом деле мы не подкрепляли позитивное противоположное поведение. Вместо этого мы поощряли поведение, отличающееся от потасовок, перебранки и т. п. «Отличающееся поведение» и есть «другое», поэтому наш метод и назывался подкреплением другого поведения.

Очки назначались не каждому мальчику, а команде. Не было случая, чтобы один брат заработал очко, а другой нет. И приз, на который они могли обменять очки, также предназначался для двоих. Например, они могли потратить 4 очка на то, чтобы поиграть лишних 15 минут перед сном; оба мальчика могли лечь спать позже. Заработав 4 очка, братья могли потратить их или сберечь, чтобы накопить на другой приз. Родители хорошо знали своих детей и спросили нас, что будет, если братья не смогут договориться насчет приза. Мы объяснили, что это обязательное условие: одинаковый приз для обоих. Если они не придут к согласию, то в этот вечер не получат приза, но смогут сохранить очки до следующего дня. (Очень важно, чтобы вы предложили ребенку приз, действительно ценный для него, а не просто вещь, которую, как вы думаете, он должен оценить.) Предложенный метод заработал прекрасно. Оба мальчика высоко оценили возможность подольше не ложиться спать и поиграть во дворе с отцом. Поэтому они не спорили о том, на что потратить заработанные очки.

Когда дети получили заслуженное вознаграждение, родители сказали: они очень рады, что мальчики повзрослели. Они подчеркнули, что именно «взрослого» сделали братья: «Вы сидели рядом и не ругались». Они не забыли обнять и приласкать детей. Спустя три дня мальчики все еще задирали друг друга, но не все время, и даже были моменты, когда они нормально общались. Родители отметили это, похвалили детей и наградили их дополнительными 5 очками. Через некоторое время родители перешли от поощрения другого поведения (отличного от нежелательного) к подкреплению некоторых позитивных противоположностей, которые они определили с самого начала – например, нормального разговора. Уже на следующей неделе родители отметили значительные изменения, продолжали хвалить детей, но перестали назначать очки за хорошее поведение. (Они разрешили братьям собрать все полученные очки, чтобы потратить их на суперприз – поездку за город.) Потасовки не прекратились, но остались на приемлемом уровне, и родители посчитали, что это их устраивает. Братья теперь играли вместе, а не просто терпели присутствие друг друга.

Это был другой пример подкрепления поведения, отличающегося от нежелательного. Когда «другое» поведение будет закреплено и мы увидим проявления позитивных противоположностей, то можем двигаться дальше и переходить к поощрению собственно желательного поведения.

3. Подкрепление более редких проявлений нежелательного поведения. Это звучит совсем уж парадоксально, но поверьте, это работает. Допустим, какие-то действия – вопли, ругательства, агрессия и т. д. – происходят по 10 раз в день, а то и по 10 раз в течение одного утра. Единственный способ устранить проявления подобного поведения – сделать так, чтобы оно проявлялось все реже, пока совсем не прекратится. Ребенка следует похвалить, если он выругается не 10, а только 8 раз. Многие родители не могут поверить, что это необходимо: «Я не ослышался? Мой ребенок бранится, а я должен его хвалить за это?» Именно так, и вы делаете это потому, что формируете процесс ослабления потока брани, который в конце концов должен иссякнуть.

Вот пример. Я работал с 7-летним Тедом, который задирал и толкал других учеников, портил их тетради и мешал работать. Кроме того, он обзывал их дураками, идиотами и т. д.

Мы хотели подкрепить позитивное противоположное поведение, нормальное общение с одноклассниками, но казалось, что Тед может либо издеваться над ними, либо молчать. Мы сказали, что он может заработать специальное вознаграждение для себя и для всего класса. Если Тед сделает то, о чем его просят, то у всего класса будет дополнительная перемена или же учитель расскажет им что-нибудь интересное перед обедом. Каждый день Тед может выбирать, на что потратить заработанное вознаграждение – на свободное время или на рассказ. Чтобы получить награду, Тед не должен никого пинать в течение 15 минут после начала уроков в 8:30. (Естественно, мы четко определили, что такое «пинать».) Если Тед никого не тронет до 8:45, он получит вознаграждение. Мы сказали, что это очень трудно, и выразили сомнение, что Теду такое по силам. (Очень сильный предшественник; см. главу 1.) Но мы предложили мальчику попробовать.

Тед был хорошо подготовлен, и в первый же день в 8:45 учитель подошел и радостно сказал ему: «Ты выиграл! Поскольку ты не сказал ни одного плохого слова, класс получает награду, и не имеет значения, что ты будешь делать в остальное время. Можешь выбрать приз!» Все утро Тед вел себя необычно тихо: он почти не задирал ребят. (Мы просили учителя защищать жертв издевательств Теда. Он должен был немедленно подозвать обиженного к себе. Мы хотели, чтобы он (конечно, временно) не обращал внимания на Теда – был огромный риск случайно поощрить его нежелательное поведение.) Работа продолжалась в течение следующих трех дней. В один из дней Тед ничего не заработал, но затем получил награду два дня подряд. Потом мы сказали ему: «Ты молодец; но посмотрим, сможешь ли ты не ругаться целых полчаса?» Это усложнение задачи, хороший предшественник.

Три с половиной недели мы работали над желательным поведением, и теперь Тед мог получить дополнительный приз в конце дня, помимо обещанного вознаграждения перед обедом. Если он хорошо вел себя весь день, то класс получал дополнительную перемену и учитель рассказывал историю. Затем мы стали награждать его за правильное поведение в течение двух и трех дней подряд. Он почти прекратил издеваться и обзываться. Кроме того, он стал вести себя так, как положено в коллективе.

Мы старались отмечать каждое проявление позитивного противоположного поведения. Это сделало нашу работу еще более эффективной. Тед стал проявлять не только нежелательное или «другое» поведение (молчать либо издеваться), его действия стали разнообразнее. Как и большинство хулиганов, он на самом деле много общался с одноклассниками: обсуждал телешоу, компьютерные игры и т. д. Мы рассматривали эти регулярные нейтральные действия как желательные и старались вознаграждать их. Мы его «ловили на социальном поведении» и подкрепляли нужные действия.

Таким образом, помимо систематической работы над устранением нежелательного поведения Теда, увеличении периодов его нормального поведения, мы также подкрепляли позитивную противоположность – социальные взаимодействия с одноклассниками. Мы работали над тем и над другим одновременно, потому что просто социальные взаимодействия не устраняли издевательств; у Теда было достаточно времени в течение дня, чтобы успеть и пообщаться, и обидеть. Поэтому мы работали над прекращением издевательств и над формированием их позитивной противоположности.

В этом примере показано, как постепенно снижать частоту проявления поведения. Он также говорит о том, что поведение состоит из массы компонентов – я уже упоминал, что истерика может проявляться дракой, руганью, криками и рыданиями. Чтобы ослабить истерику, устраняют один из компонентов, потом другой или стараются ослабить их проявление. В конце концов от первоначальной истерики ничего не остается. Это значит, что некоторое время вы вынуждены хвалить ребенка за «правильную» истерику. Надеюсь, что теперь эта идея не кажется вам сумасшедшей?

Метод положительного подкрепления можно применять при дрессировке любых животных, но особенно он подходит для собак. Это система, целиком опирающаяся на побудительный мотив (стимул) и отвергающая физическое воздействие или силу в любых их проявлениях. Этим методом могут пользоваться даже дети. Он не требует какого-либо природного дара (таланта) дрессировщика. Он не связан с каким-то особым тоном, выбором подходящего времени, не основан на регулярной практике и не опирается на какую-либо из традиционных теорий дрессировки собак. Все, что требуется – ваш разум и какой-нибудь лакомый кусочек.

Как научить собаку, чтобы она по команде ложилась в каком-нибудь определенном углу комнаты? Для этого существует два способа:

1. Можно бить собаку плеткой всякий раз, когда она пойдет в какой-либо другой угол и вообще бить до тех пор, пока она не усвоит, что указанное вами место – единственное безопасное убежище.

2. Можно дать собаке особенно вкусный кусочек в этом уголке и полностью ее игнорировать, когда она пойдет в какую-то другую часть комнаты.

Я совершенно уверен, что, прочитав эти строки вы сказали себе: «Ну, это рассуждения на уровне здравого смысла. Что тут такого нового?» Разумеется, это здравый смысл. Каждый владелец собаки ежедневно поступает подобным образом и дома, и вне его стен, не задумываясь о том, что и как он делает. Хотя почему-то, когда требуется сделать некоторое усилие и чему-нибудь научить свою собаку, мы становимся в позу дрессировщика и вспоминаем стародавний подход: «Ты собака, я хозяин. Я приказываю, ты подчиняешься».

Когда дома вы подзываете собаку, вы обычно намерены покормить ее или взять на поводок и повести на прогулку, или показать, что вы уронили еду на пол в кухне и хотите, чтоб она все подчистила. Действительно, дома мы редко зовем собаку просто так, обычно это происходит по какой-то причине, и в большинстве случаев выполнение команды сулит собаке что-то приятное. В результате лишь немногие люди жалуются, что собака не идет на зов дома. А в ближайшем парке дело обстоит совсем иначе. Вы гуляете, она свободно бегает, играя с другими собаками, охотится за белками, роется в мусорных урнах, в то время как вы погрузились в собственные мысли. У ворот парка вы зовете ее, чтобы вести домой. И тут она, бросив на вас взгляд, направляется в противоположную сторону. (Такое все мы видим на улице чуть не каждый день.) В этот момент вы говорите себе: «Я должен наконец выдрессировать свою собаку». Вы ее уже выдрессировали. Вы преуспели в том, что научили ее не подходить к вам. Как? Очень просто. Собака быстро усвоила: если она не подойдет, то будет вознаграждена более длительной прогулкой. Если же она к вам подойдет, то лишится удовольствия: ее отведут домой.

Если бы вы применили ваши «домашние приемы» дрессировки команды «Ко мне!», подзывая пса около ворот, давая лакомство и затем делая еще круг по парку, то вскоре, услышав зов, он летел бы к вам пулей. Подкуп? Я называю это здравым смыслом. Сколько раз уже мне приходилось прятать улыбку, когда ко мне обращались люди, которые сталкиваются с проблемами нежелательного поведения своих собак, и я в ответ предлагаю им попробовать награждать собаку за хорошее поведение, вместо того чтобы думать, каким образом наказать ее за нежелательное поведение. Хозяева недоумевают: «Вы хотите сказать, что я должен его подкупать?» По-моему, это довольно забавно: то, чему ученые, психологи и бихевиористы (специалисты по проблемам поведения) придумали замысловатые названия вроде «модификации поведения», «реабилитационная психотерапия», «психология поведения» и так далее, широкой публикой все еще расценивается как подкуп.

Впрочем, на самом деле важно другое – при правильном применении положительное подкрепление весьма эффективно: оно изменяет нежелательное поведение. Существует ряд основополагающих принципов, которые определяют успех применения положительного подкрепления как метода дрессировки. Но прежде чем начать применять эти принципы или законы с помощью специальных обучающих упражнений в процессе дрессировки собак, необходимо рассмотреть отдельно каждую стадию обучения, ее цель и желаемый результат.

Как действует положительное подкрепление

Прежде всего мы вообще должны забыть об упражнениях. Все, что нас интересует для начала – это первый шаг в нужном направлении. Представим себе, например, что мы хотим научить касатку выпрыгивать из воды. Мы даем свисток (команду) и ждем. Затем ждем еще немного, а зачастую бывает, что ждем еще и еще. Очевидно, сначала касатка не имеет представления о том, что от нее требуется, когда звучит свисток. Поэтому нам приходится ждать, чтобы она зачем-нибудь высунула нос из воды. Точно в этот миг мы снова свистим в свисток и даем ей рыбу. Когда она проплывает внизу, мы снова свистим и ждем. Процедура повторяется до тех пор, пока касатка не выйдет на уровень «ага!»: «Ага! Когда я слышу звук свистка, я получаю рыбу». Этот уровень понимания – уровень «ага!» – не может считаться закрепленным, до тех пор вы не добьетесь, чтобы происходило десять из десяти возможных немедленных реакций на свисток. Пока это не достигнуто, не следует переходить к следующему этапу дрессировки.

На первом ее этапе кажется, что прогресс не очень заметен, однако для успеха обучения крайне важно, чтобы каждый этап заканчивался достижением уровня полного понимания. Если вы этого добьетесь, то обнаружите, что, по мере перехода к каждому следующему этапу превращение первоначальной реакции в распознаваемую цепочку движений идет очень быстро. Теперь мы подходим к этапу дрессировки, который называется «формирование». Нам нужно заменить уже сложившуюся цепочку: «свисток – появление носа – обязательная рыбка», новой цепочкой: «свисток – касатка выпрыгивает из воды – рыбка дается иногда». Достигается это следующим образом. Формирование поведения означает, что мы делаем один маленький шаг в нужном направлении и продвигаемся к конечной цели, подкрепляя каждый сделанный шаг. Так мы обеспечиваем безусловное выполнение этой части цепочки, прежде чем двигаться дальше.

Здесь наблюдается интересное явление: выполнение определенных действий, надежно затренированное с помощью вознаграждения, можно сделать еще более четким, если вознаграждение задерживать. Предположим, затренирована такая реакция касатки: на десять свистков она десять раз немедленно высовывает нос из воды. На одиннадцатый раз говорим: «Недостаточно хорошо, рыбы ты не получишь». Можно предположить, что теперь касатка подумает: «Но я всегда получаю рыбку. Наверное, кто-то ее стащил раньше меня. В следующий раз надо живее пошевеливаться». И на двенадцатый раз вы получите более быструю и энергичную реакцию касатки: она высунет из воды всю голову целиком. За это безусловно полагается рыбка, но теперь и в дальнейшем – только за это.

Дальше будем формировать цепочку: «свисток -появление из воды всей головы целиком – при немедленной реакции рыбка в награду в десяти случаях из десяти». Лишь затем можно будет перейти к следующему этапу. Кажется, что обучаемый с каждым этапом все скорее понимает, что от него требуется и возникает эффект снежного кома.

Я намеренно воспользовался примером касатки чтобы подчеркнуть главное: весь процесс обучения может осуществляться без какого-либо физического воздействия. Сначала мы ждем верного шага в нужном направлении и вознаграждаем его, затем закрепляем и придаем законченную форму.

Хозяин: «Какая разница между всем этим и подкупом?» Я: «Подкуп – это использование награды в качестве соблазна, для того чтобы стимулировать движение. Подкрепление – это вознаграждение, получаемое за добровольное движение». Хозяин: «Всегда ли давать награду?» Я: «Прием действует лучше, если вы даете награду не всегда. Когда модель поведения сформирована, только самая быстрая, ярко выраженная и сильная реакция вознаграждается. Иногда ученику придется выполнить отработанную цепочку шесть или семь раз, прежде чем последует вознаграждение». Хозяин: «Обязательно ли давать в награду что-то съедобное?» Я: «Наградой может быть что-то другое, ради чего, с точки зрения ученика, стоит выполнять определенные действия. Было бы бессмысленно пытаться сформировать мое поведение с помощью тарелки капусты, если я терпеть не могу капусту!

Как применять положительное подкрепление

В главе «Как учатся собаки» я рассказал о том, как научил свою первую собаку искать и приносить вещь (соответствует команде «Аппорт!»). Теперь я расскажу вам, как я научил выполнять это задание свою нынешнюю собаку. На обучение моей первой собаки ушло несколько недель, и она так и не научилась выполнять команду по-настоящему хорошо. Это была немецкая овчарка – порода славится хорошей обучаемостью. Моя теперешняя собака выполняет то же задание с огоньком в глазах и невероятной для собаки ее размеров быстротой. Это – японская акита, порода, известная своим упрямством.

Я провел много времени на дрессировочной площадке, в течение ряда недель обучая мою немецкую овчарку. В течение нескольких дней, затрачивая по несколько минут в день, я обучил акита, ни разу даже не встав с кресла. Используя этот метод, я недавно помог проводнику полицейской собаки достичь того же результата при дрессировке немецкой овчарки. Фактически нам потребовалось меньше обычного времени, чтобы довести совершенно необученную собаку до стандарта министерства внутренних дел, причем достигнутые результаты были гораздо выше тех, которых добиваются, применяя обычные методы дрессировки.

Кличка моей собаки – Йоко. Поняли? Джон Йоко. Ей было пятнадцать месяцев, когда я реши научить ее искать и приносить брошенный предмет. Сейчас у меня не остается времени, чтобы самому участвовать с моими собаками в соревнованиях, где собаки демонстрируют свои умения, но я все еще сужу такие состязания. И вот однажды один хозяин-участник обронил мимоходом замечание, которое побудило меня учить мою собаку искать и приносить брошенный предмет. Парень сказал: «Вы никогда не научите акита выполнять эту команду как следует». Когда мне бросают вызов, я загораюсь.

Я сидел за письменным столом в своей приемной, рядом на столе я поставил коробочку с лакомством. Протягивая собаке гантель, я говорил: «Возьми!» Йоко нюхала перекладину, а я говорил: «Хорошая девочка!» – и давал ей угощение. Первое занятие продолжалось около пяти минут, и она получила вознаграждение сразу после быстрой реакции примерно в 60% случаев. В остальных случаях за правильные реакции иногда тоже давалось вознаграждение, но только после того, как собака нюхала стол, карабкалась на меня, лаяла или делала еще что-нибудь, стараясь получить вознаграждение. На следующем занятии в тот же день был достигнут уровень понимания (уровень «ага!»). Йоко тыкалась носом в гантель всякий раз, когда я давал команду. На формирование действия и переход к следующей стадии потребовалось несколько больше времени. В течение четырех занятий по пять минут каждое она пробовала делать самые разные вещи чтобы получить награду. Отношение было: 15%; 25%; 70%; 100%. Теперь я уже требовал, чтобы она не тыкалась в гантель носом, а лизала ее. Не дав ей угощения, когда она в очередной раз лизнула гантель, я попал в точку, что вызвало эффект снежного кома гораздо раньше, чем я сам того ожидал. Она решительно выхватила гантель у меня из рук смотрела на меня, как будто говоря: «Смотри, глупыш, я ее взяла... Давай еду!»

Никто не может заранее определить модель формирования поведения при выполнении задания. Мы можем запланировать известную структурированную последовательность, но при обучении нам придется руководствоваться темпом, который установит само животное. После того как вы вознаградили собаку за определенное движение, оно должно стать единственным движением, за которое дается награда, пока оно не будет затренировано. Йоко сделала больший шаг вперед, чем я ожидал, и, поскольку я ее с энтузиазмом наградил, мне пришлось ждать, чтобы она его повторила. Это отняло меньше времени, чем я ожидал, но надо учесть, что Йоко очень прожорливая собака.

После такого огромного рывка вперед вся цепочка действий формировалась очень легко. Прошло совсем немного времени, и я уже бросал гантель на кушетку в дальнем конце приемной, а Йоко приносила ее по команде и садилась передо мной, держа ее в зубах, гордая. В первый же раз, когда на свежем воздухе я опробовал дать одно из тех упражнений, что предлагаются на состязаниях, она получила бы у меня за их выполнение все десять баллов из десяти. Но кажется, я несколько пристрастен.

Возьмем теперь два простых действия: выполнение команд «Сидеть!» и «Лежать!». Попытаемся, используя наш метод и не применяя силу, научить собаку четко реагировать на данные команды. Чтобы ускорить процесс, необходимо прибегнуть к подкупу. Иными словами, мы показываем награду, чтобы стимулировать движение. Как только достигается этот уровень понимания, мы обращаемся к команде и подаем ее только голосом, затем ждем, чтобы было сделано верное движение. Тогда мы придаем этому движению законченный вид. Для отработки команды «Сидеть!» покажите собаке лакомство, даже дотроньтесь им до кончика ее носа. Скажите: «Сидеть!» – и медленно переместите лакомство вверх и назад, чуть дальше линии глаз собаки. Сложение у собак такое, что если голова поднимается вверх и назад, то задняя часть туловища непременно опускается.

Для отработки команды «Лежать!» выберите такое препятствие, чтобы для его преодоления собаке нужно было лечь на брюхо. Это будет зависеть от размера собаки. Например, для немецкой овчарки подошел бы кофейный столик. Подведите к нему собаку и предложите ей лакомство, держа его в руке под столиком, то есть под препятствием. Когда собака потянется за лакомством, медленно отодвигайте его под препятствием, побуждая собаку двигаться следом и командуя при этом: «Лежать!» В тот момент, когда ее брюхо коснется пола, дайте вознаграждение.

Теперь, когда мы научили свою собаку делать то, чего мы от нее добиваемся, остается отучить ее делать то, что нам не нравится. Для достижения этой цели используем систему отрицательного подкрепления.

Вы хотите узнать что-то новое о позитивном подкреплении? Это хорошо! Позитивное подкрепление является ключевой психологической идеей в сфере анализа поведения. Этот метод был впервые определен Б. Скиннером, к нему было привлечено внимание после написания книги Карен Приор «Не стреляйте в собаку! Новое искусство обучения и тренировки». Приор дает следующее определение: «позитивное подкрепление – это то, что происходит одновременно с действием, увеличивая вероятность того, что действие повторится».

Согласно этому размытому определению, позитивное подкрепление могло считаться методом тренировки, в основе которого была система вознаграждения. Но техническая сторона категории поведения и ее результатов привела к тому, что значение позитивного подкрепления стало несколько запутанным. Чтобы избежать этой путаницы, статья дает пояснения для лучшего понимания, что такое позитивное подкрепление.

Шаги

Поймите основы установления позитивного подкрепления. Оно похоже на вознаграждение, но является несколько более конкретным. Позитивное подкрепление – это то, ради получения чего человек или животное будет прилагать усилия. Идентифицировать позитивное подкрепление можно при соблюдении трех условий:

Последствия возникают в результате определенного поведения.
Определенное поведение становится более вероятным.
Определенное поведения становится более вероятным лишь потому, что последствия зависят от поведения.

Заставьте себя есть больше фруктов. Осознайте, что позитивное подкрепление имеет место в ежедневной жизни людей и животных. Оно подходит не только для дрессировки животных. Вы тренируете себя и других людей этим методом, даже если не осознаете этого. К примеру, если вы даете ребенку конфету за хорошее поведение или упрекаете супругу за то, что она забыла купить молоко, вы тренируете (или пытаетесь тренировать) их поведение.

Определите положительный стимул. Им является тот, который дает позитивный результат. К примеру, когда вас благодарят за полученный подарок. Обратной стороной положительного стимула является негативный стимул. К примеру, если родители наказывают подростка за непослушание. Скиннер утверждает, что положительный стимул является более сильным чем негативный стимул. К примеру, если вы благодарите человека за подарок, а не критикуете его за то, что этот подарок недостаточно дорог, вероятность получения более дорогого подарка в будущем – выше.

Отличайте, когда следует и не следует применять положительный стимул. Если вы хвалите собаку после выполнения трюка, это является применением позитивного подкрепления. Вы можете определить позитивное подкрепление так же, как и Приор, «позитивное подкрепление – это то, что происходит одновременно с действием, увеличивая вероятность того, что действий повторится». Или же попросту определить это как положительную реакцию на правильное поведение.

Определите негативное подкрепление. Это сложный аспект, но обычно он определяется как негативный стимул, который был проявлен, а затем устранен после появления желаемого поведения. К примеру, лошадь двигается вперед из-за негативного подкрепления: ее хлещут, бьют, кричат на нее до тех пор, пока она не начнет двигаться, после этого негативный стимул тотчас прекращается. Лошадь, движущаяся вперед, демонстрирует желаемое поведение, следовательно, негативное подкрепление в данном случае было успешным.

Понимание функции наказания. Существует две основные формы наказания: позитивное и негативное наказание.

Определите преимущества позитивного подкрепления. Тренировка позитивного подкрепления основывается на позитивном опыте – на получении позитивного стимула, другими словами, вознаграждения. Если вы тренируете свою собаку сидеть или сами хотите начать заниматься физкультурой, позитивное подкрепление станет для вас мощным и приятным инструментом. Тренировка с использованием позитивного подкрепления станет для вас более веселой и эффективной, нежели тренировка, в основе которой лежит наказание.
Поймите, как использовать позитивное подкрепление. Как сказано выше, позитивное подкрепление очень полезно для достижения разных целей, но есть некоторые правила его использования:
- Правильно подобранное время. Позитивное подкрепление эффективно лишь тогда, когда применяется сразу после проявления поведения – если вы дрессируете собаку сидеть, хвалить ее можно лишь тогда, когда она пребывает в сидячем положении. Если вы хвалите ее, когда она встает, получается, что вы хвалите ее за то, что она встала. Если вы говорите своей супруге, что она выглядела прекрасно прошлым вечером, вы делаете это слишком поздно и уже неэффективно. Вознаграждение наперед тоже неэффективно. К примеру, если вы дрессируете собаку заходить в будку, при этом пытаетесь задобрить ее еще до того, как она туда зашла, это будет своеобразный подкуп, но не дрессировка собаки.
- Правильные вознаграждения. Вознаграждения должны быть небольшими: дайте ребенку конфетку, а не мороженное с сиропом. Они должны быть непредсказуемыми. К примеру, людям может понравиться использование лототрона. При его использовании существует непредсказуемый выигрыш – даже при выигрыше совсем небольшой суммы многие люди поддавались эффективной тренировке, ведь каждый раз они хотели победить. Вознаграждение без причины тоже может быть эффективным в минимальных количествах, также эффективным будет большое вознаграждение, к примеру, джек-пот.
- Высокий энтузиазм. Позитивное подкрепление зависит от того, сколько энтузиазма и радости испытывает тот, кого тренируют. Будь то ребенок, которого вы учите читать, или собака, которую вы дрессируете для подчинения, занятия должны быть частыми и короткими, а цели – легко достижимыми, чтобы вознаграждение выдавалось регулярно. Если вы чувствуете стресс или фрустрацию, сделайте перерыв, прервав занятие на положительном этапе.
- Последовательность. Если вы сначала вознаграждаете собаку за сидение, а в следующий раз, когда она садится, этого не делаете, то вы ведете себя непоследовательно. Впрочем, если вы используете косточку в первый раз и кусок хот-дога во второй раз – это будет последовательно. Чтобы быть последовательным, вам нужно определиться с критерием и далее следовать ему до тех пор, пока поведение не станет достаточно хорошим. К примеру, если вы дрессируете попугая подниматься по лестнице:
  - Изначально вашим критерием будет желание того, чтобы птица оставалась спокойной, когда ваш палец находится в клетке. Каждый раз, когда попугай остается спокойным в такой ситуации, вам нужно его вознаграждать.
  - После этого вам следует усложнять задачу. Ваш критерий – попугай должен оставаться спокойным, когда ваш палец находится рядом с ним. Вы вознаграждаете попугая каждый раз, когда он остается спокойным. Критерий становится более трудным, но вы последовательны в своем вознаграждении попугая. Дрессировку следует продолжать в такой же манере.
- Позитивное подкрепление не является подкупом. Во-первых, подкуп недопустим и незаконен. Во-вторых, позитивное подкрепление имеет за цель достижение желаемого поведения. В случае с людьми, это достигается путем обучения ответственности за свое поведение.
- Поищите хороший университетский онлайн-семинар по позитивному подкреплению, если хотите проверить свое понимание этого предмета.
- Чтобы подкрепление работало, оно должно касаться чего-то, что ценится человеком или животным. Это означает, что вам нужно будет соотносить его с конкретной индивидуальностью. Это требует больших усилий, но при тренировке в группе результат будет стоить того.