Процесс оперантного обусловливания 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Процесс оперантного обусловливания



Ключевая структурная единица бихевиористского подхода в целом и скиннеровского подхода в особенности — это реакция. Реакции можно ранжировать от простых рефлекторных реакций (например, слюноотделение на пищу, вздрагивание на громкий звук) до сложного паттерна поведения (например, решение математической задачи, скрытые формы агрессии). Что же такое реакция? Реакция – это внешняя, наблюдаемая часть поведения, которую можно связать с событиями окружающей среды. Сущность процесса научения — это установление связей (ассоциаций) реакций с событиями внешней среды.

В своем подходе к научению Скиннер проводил различие между реакциями, которые вызываются четко определенными стимулами (например, мигательный рефлекс в ответ на дуновение воздуха), и реакциями, которые нельзя связать ни с одним стимулом. Эти реакции второго типа порождаются самим организмом и называются оперантами. Скиннер считал, что стимулы среды не принуждают организм вести себя определенным образом и не побуждают его действовать. Исходная причина поведения находится в самом организме. «Не существует внешнего побуждающего стимула к оперантному поведению, оно просто происходит, осуществляется. С точки зрения теории оперантного обусловливания операнты порождаются организмом. Собака идет, бежит, "возится" с кем-то; птица летит; обезьяна прыгает с дерева на дерево; человеческий детеныш лепечет. В любом случае поведение происходит без воздействия какого-то специального побуждающего стимула. Производить оперантное поведение — это заложено в биологической природе организма».

Процесс оперантного обусловливания

Оперантное поведение (вызванное оперантным научением) определяется событиями, которые следуют за реакцией. То есть за поведением идет следствие, и природа этого следствия изменяет тенденцию организма повторять данное поведение в будущем. Например, катание на роликовой доске, игра на фортепиано, метание дротиков и написание собственного имени — это образцы оперантной реакции, или операнты, контролируемые результатами, следующими за соответствующим поведением. Это произвольные приобретенные реакции, для которых не существует стимула, поддающегося распознаванию. Скиннер понимал, что бессмысленно рассуждать о происхождении оперантного поведения, так как нам неизвестны стимул или внутренняя причина, ответственная за его появление. Оно происходит спонтанно.

Если последствия благоприятны для организма, тогда вероятность повторения операнта в будущем усиливается. Когда это происходит, говорят, что последствия подкрепляются, и оперантные реакции, полученные в результате подкрепления (в смысле высокой вероятности его появления) обусловились. Сила позитивного подкрепляющего стимула таким образом определяется в соответствии с его воздействием на последующую частоту реакций, которые непосредственно предшествовали ему.

И напротив, если последствия реакции не благоприятны и не подкреплены, тогда вероятность получить оперант уменьшается. Например, вы скоро перестанете улыбаться человеку, который в ответ на вашу улыбку всегда бросает на вас сердитый взгляд или вообще никогда не улыбается. Скиннер полагал, что, следовательно, оперантное поведение контролируется негативными последствиями. По определению, негативные, или аверсивные последствия ослабляют поведение, порождающее их, и усиливают поведение, устраняющее их. Если человек постоянно угрюм, вы, вероятно, попытаетесь совсем избегать его. Подобным же образом, если вы паркуете свою машину в том месте, где есть надпись «Только для президента» и в результате на ветровом стекле машины находите штрафной талон, вы, несомненно, скоро прекратите парковаться там.

Эксперименты Скинера

Для того, чтобы изучать оперантное поведение в лаборатории, Скиннер придумал на первый взгляд простую процедуру, названную свободным оперантным методом. Полуголодную крысу поместили в пустую «свободно-оперантную камеру» (известную как «ящик Скиннера»), где был только рычаг и миска для еды. Сначала крыса демонстрировала множество оперантов: ходила, принюхивалась, почесывалась, чистила себя и мочилась. Такие реакции не вызывались никаким узнаваемым стимулом; они были спонтанны. В конце концов, в ходе своей ознакомительной деятельности крыса нажимала на рычаг, тем самым получая шарик пищи, автоматически доставляемый в миску под рычагом. Так как реакция нажатия рычага первоначально имела низкую вероятность возникновения, ее следует считать чисто случайной по отношению к питанию; то есть мы не можем предсказать, когда крыса будет нажимать на рычаг, и не можем заставить ее делать это. Однако, лишая ее пищи, скажем, на 24 часа, мы можем убедиться, что реакция нажима рычага приобретет, в конце концов, высокую вероятность в такой особой ситуации. Это делается при помощи метода, называющегося научение через кормушку, посредством которого экспериментатор дает шарики пищи каждый раз, когда крыса нажимает на рычаг. Потом можно увидеть, что крыса проводит все больше времени рядом с рычагом и миской для пищи, а через соответствующий промежуток времени она начнет нажимать рычаг все быстрее и быстрее. Таким образом, нажатие рычага постепенно становится наиболее частой реакцией крысы на условие пищевой депривации. В ситуации оперантного научения поведение крысы является инструментальным, то есть оно действует на окружающую среду, порождая подкрепление (пищу). Если далее идут неподкрепляемые опыты, то есть если пища не появляется постоянно вслед за реакцией нажатия рычага, крыса, в конце концов, перестанет нажимать его, и произойдет экспериментальное угасание.

Теперь, когда мы познакомились с природой оперантного научения, будет полезно рассмотреть пример ситуации, встречающейся почти в каждой семье, где есть маленькие дети, а именно — оперантное научение поведению плача. Как только маленькие дети испытывают боль, они плачут, и немедленная реакция родителей — выразить внимание и дать другие позитивные подкрепления. Так как внимание является подкрепляющим фактором для ребенка, реакция плача становится естественно обусловленной. Однако плач может возникать и тогда, когда боли нет. Хотя большинство родителей утверждают, что они могут различать плач от расстройства и плач, вызванный желанием внимания, все же многие родители упорно подкрепляют последний.

Могут ли родители устранить обусловленное поведение плача или ребенку уготована судьба быть «плаксой» на всю жизнь? Уильяме (1959) сообщает о случае, который показывает, как обусловленный плач был подавлен у 21-месячного ребенка. Из-за серьезного заболевания в течение первых 18 месяцев жизни ребенок получал повышенное внимание от своих обеспокоенных родителей. Фактически, из-за его крика и плача, когда он ложился спать, кто-то из родителей или тетя, жившая вместе с этой семьей, оставались в его спальне до тех пор, пока он не засыпал. Такое ночное бодрствование обычно занимало два-три часа. Оставаясь в комнате, пока он не засыпал, родители, несомненно, давали позитивное подкрепление поведению плача у ребенка. Он прекрасно контролировал своих родителей. Чтобы подавить это неприятное поведение, врачи велели родителям оставлять ребенка засыпать одного и не обращать никакого внимания на плач. Через семь ночей поведение плача фактически прекратилось. К десятой ночи ребенок даже улыбался, когда его родители уходили из комнаты, и можно было слышать его довольный лепет, когда он засыпал. Через неделю, однако, ребенок сразу начал кричать, когда тетя уложила его в постель и вышла из комнаты. Она возвратилась и осталась там, пока ребенок не заснул. Этого одного примера позитивного подкрепления было достаточно, чтобы стало необходимым во второй раз пройти через весь процесс угасания. К девятой ночи плач ребенка наконец прекратился, и Уильяме сообщил об отсутствии рецидивов в течение двух лет.

Типы подкреплений

Одним из примечательных идей скинеровской теории обусловливания является понятие подкрепления.

Подкрепление (punishment) – это любое событие (стимул), которое следует за реакцией и увеличивает вероятность ее появления. Когда голубь, например, тычет клювом в диск, то это поведение является оперантным, и если оно сопровождается подкреплением, таким, как еда, то вероятность клевания диска возрастает. В соответствии с этим взглядом, подкреплениие усиливает то поведение, за которым следует, и нет необходимости прибегать к биологическим объяснениям, чтобы определить, почему так происходит. Очень важным является то, что стимулы, которые изначально не являются подкреплениями, могут превратиться в таковые благодаря ассоциированию с другими подкреплениями. Некоторые стимулы, такие, как деньги, становятся генерализованным подкреплением, поскольку они обеспечивают доступ ко множеству других видов подкрепления.

Здесь важно понимать, что подкрепление определяется через его воздействие на поведение — а именно через рост вероятности поведенческой реакции. Часто трудно точно определить, что может послужить таким подкреплением, так как оно варьирует от индивида к индивиду, от организма к организму. Например, исследователь может искать подкрепление путем проб и ошибок. Он может продолжать испытывать разные стимулы, пока не найдется такой, который действительно надежно увеличивает вероятность появления данной реакции.

Теоретики, занимающиеся научением, признавали два типа подкрепления — первичное и вторичное. Первичное подкрепление — это любое событие или объект, сами по себе обладающие подкрепляющими свойствами. Таким образом, они не требуют предварительной ассоциации с другими подкреплениями, чтобы удовлетворить биологическую потребность. Первичные подкрепляющие стимулы для людей — это пища, вода, физический комфорт и секс. Их ценностное значение для организма не зависит от научения. Вторичное, или усвоеное подкрепление, с другой стороны, — это любое событие или объект, которые приобретают свойство осуществлять подкрепление посредством тесной ассоциации с первичным подкреплением, обусловленным прошлым опытом организма. Примерами общих вторичных подкрепляющих стимулов у людей являются деньги, внимание, привязанности и хорошие оценки.

Генерализация и различение стимулов

Логическим расширением принципа подкрепления является то, что поведение, усиленное в одной ситуации, весьма вероятно повторится, когда организм столкнется с другими ситуациями, напоминающими ее. Если бы это было не так, то поведенческий репертуар человека был бы так сильно ограничен и хаотичен, что мы бы, возможно, проснувшись утром, долго размышляли над тем, как реагировать должным образом на каждую новую ситуацию. В теории Скиннера тенденция подкрепленного поведения распространяться на множество подобных положений называется генерализацией стимула. Этот феномен легко наблюдать в повседневной жизни. Например, ребенок, которого похвалили за утонченные хорошие манеры дома, будет обобщать это поведение в соответствующих ситуациях и вне дома, такого ребенка не нужно учить, как прилично вести себя в новой ситуации. Обобщение стимула также может быть результатом неприятного жизненного опыта. Молодая женщина, изнасилованная незнакомцем, может генерализировать свой стыд и враждебность по отношению ко всем лицам противоположного пола, так как они напоминают ей о физической и эмоциональной травме, нанесенной незнакомцем. Подобно этому, единственного случая испуга или аверсивного опыта, причиной которого явился человек, принадлежащий к определенной этнической группе (белый, черный, латиноамериканец, азиат), может быть достаточно для индивида, чтобы создать стереотип и таким образом избежать будущих социальных контактов со всеми представителями данной группы.

Характерным для условного подкрепления является то, что оно генерализуется, если объединяется с более чем одним первичным подкреплением. Деньги — особенно показательный пример. Очевидно, что деньги не могут удовлетворить какое-либо из наших первичных влечений. Все же благодаря системе культурного обмена деньги являются мощным и сильным фактором для получения множества удовольствий. Например, деньги позволяют нам иметь модную одежду, яркие машины, медицинскую помощь и образование. Иные виды генерализованных условных подкрепляющих стимулов — это лесть, похвала, привязанности и подчинение себе других. Эти так называемые социальные подкрепляющие стимулы (включающие в себя поведение других людей) часто действуют очень сложно и едва уловимо, но они существенны для нашего поведения в разнообразных ситуациях. Например, внимание. Все знают, что ребенок может получить внимание, когда притворяется больным или плохо себя ведет. Часто дети назойливы, задают нелепые вопросы, вмешиваются в разговор взрослых, рисуются, поддразнивают младших сестер или братьев и мочатся в постель — и все это для привлечения внимания. Внимание значимого другого — родителей, учителя, возлюбленного – особенно эффективный генерализованный условный стимул, который может содействовать ярко выраженному поведению привлечения внимания.

Социальное одобрение — это еще более сильный генерализованный условный стимул. Например, многие люди проводят массу времени, прихорашиваясь перед зеркалом, в надежде получить одобряющий взгляд супруга или любовника. И женская, и мужская мода — это предмет одобрения, и она существует до тех пор, пока есть социальное одобрение. Студенты высшей школы соревнуются за место в университетской легкоатлетической команде или участвуют в мероприятиях вне учебного плана (драма, диспут, школьный ежегодник) для того, чтобы получить одобрение родителей, сверстников и соседей. Хорошие отметки в колледже — тоже позитивный подкрепляющий стимул, потому что ранее за это получали похвалу и одобрение родителей. Будучи мощным условным подкрепляющим стимулом, удовлетворительные оценки также способствуют поощрению учения и достижению более высокой академической успеваемости.

Скиннер полагал, что условные подкрепляющие стимулы очень важны в контроле поведения человека. Он также отмечал, что каждый человек проходит уникальную науку научения, и вряд ли всеми людьми управляют одни и те же подкрепляющие стимулы. Например, для кого-то очень сильным подкрепляющим стимулом является успех в качестве менеджера или преподавателя; для других важно выражение нежности; а иные находят подкрепляющий стимул в спорте, академических или музыкальных занятиях. Возможные вариации в поведении, поддержанные условными подкрепляющими стимулами, бесконечны. Следовательно, понять условные подкрепляющие стимулы у человека намного сложнее, чем понять, почему крыса, лишенная пищи, нажимает рычаг, получая в качестве подкрепления только звуковой сигнал.

Хотя способность обобщать реакции — важный аспект многих наших повседневных социальных интеракций, все же очевидно, что при адаптивном поведении нужно обладать способностью делать различия в разных ситуациях.

Небольшое изменение в стандартной процедуре оперантного научения демонстрирует, как нейтральный стимул может приобрести подкрепляющую силу для поведения. Когда крыса научилась нажимать на рычаг в «ящике Скиннера», сразу же ввели звуковой сигнал (сразу после осуществления реакции), за которым следовал шарик еды. В этом случае звук действует как различительный стимул (то есть животное учится реагировать только при наличии звукового сигнала, так как он сообщает о пищевом вознаграждении). После того, как эта специфическая оперантная реакция устанавливается, начинается угасание: когда крыса нажимает на рычаг, не появляются ни пища, ни звуковой сигнал. Через какое-то время крыса перестает нажимать на рычаг. Затем звуковой сигнал повторяется каждый раз, когда животное нажимает на рычаг, но шарик пищи не появляется. Несмотря на отсутствие первоначального подкрепляющего стимула, животное понимает, что нажатие на рычаг вызывает звуковой сигнал, поэтому оно продолжает настойчиво реагировать, тем самым ослабляя угасание. Другими словами, установленная скорость нажатия на рычаг отражает тот факт, что звуковой сигнал теперь действует как условный подкрепляющий фактор. Точная скорость реагирования зависит от силы звукового сигнала как условного подкрепляющего стимула (то есть от числа случаев, когда звуковой сигнал ассоциировался с первичным подкрепляющим стимулом, пищей, в процессе научения). Скиннер доказывал, что фактически любой нейтральный стимул может стать подкрепляющим, если он ассоциируется с другими стимулами, ранее имевшими подкрепляющие свойства. Таким образом, феномен условного подкрепления в значительной степени увеличивает сферу возможного оперантного научения, особенно если это касается социального поведения человека. Иначе говоря, если бы все, чему мы научились, было пропорционально первичному подкреплению, то возможности для научения были бы очень ограничены, и деятельность человека не была бы столь разнообразна.

Различение стимула, составная часть обобщения, — это процесс научения реагировать адекватным образом в различных ситуациях окружения. Примеров множество. Автомобилист остается в живых в час пик благодаря тому, что различает красный и зеленый цвета светофора. Ребенок учится различать домашнюю собачку и злобного пса. Подросток учится различать поведение, находящее одобрение у сверстников, и поведение, раздражающее и отчуждающее других. Диабетик сразу обучается различать пищу, содержащую много и мало сахара. В самом деле, практически все разумное поведение человека зависит от способности делать различение.

Способность к различению приобретается через подкрепление реакций в присутствии одних стимулов и неподкрепление их в присутствии других стимулов. Различительные стимулы таким образом дают нам возможность предвидеть вероятные результаты, связанные с изъявлением особой оперантной реакции в различных социальных ситуациях. Соответственно, индивидуальные вариации различительной способности зависят от уникального прошлого опыта различных подкреплений. Скиннер предположил, что здоровое личностное развитие происходит в результате взаимодействия генерализирующей и различительной способностей, с помощью которых мы регулируем наше поведение так, чтобы максимизировать позитивное подкрепление и минимизировать наказание.

Режимы подкрепления

Особый интерес Скиннера был сосредоточен в основном на изучении особенностей (реакций и их связей с процентами подкреплений) и интервалами между ними, т.е. на изучении режимов подкрепления.

Суть оперантного научения состоит в том, что подкрепленное поведение стремится повториться, а поведение неподкрепленное или наказуемое имеет тенденцию не повторяться или подавляться. Следовательно, концепция подкрепления играет ключевую роль в теории Скиннера.

Для исследования связей реакций и подкреплений используется простое экспериментальное устройство — ящик Скиннера. Конструкция ящика позволяет предъявлять несколько стимулов и наблюдать, как крысы давят на рычаг или как голуби стучат клювом по ключу. По Скиннеру, именно в таких условиях лучше всего наблюдать проявления элементарных законов поведения. Эти законы раскрываются через управление поведением, в данном случае через управление поведением крыс, давящих на рычаг, и голубей, бьющих клювом по ключу.

Поведение понятно, если его можно контролировать, внося определенные изменения в условия среды. Понять поведение — значит управлять им. Управление поведением, осуществляется через выбор типа реакции, которую необходимо подкрепить, и определения степени вероятности ее повторного появления.

Скорость, с которой оперантное поведение приобретается и сохраняется, зависит от режима применяемого подкрепления. Режим подкрепления — правило, устанавливающее вероятность, с которой подкрепление будет происходить. Режим подкрепления можно построить, задавая определенный временной интервал или определенный интервал реакций.

Самым простым правилом является предъявление подкрепления каждый раз, когда субъект дает желаемую реакцию. Это называется режимом непрерывного подкрепления и обычно используется на начальном этапе любого оперантного научения, когда организм учится производить правильную реакцию. В большинстве ситуаций повседневной жизни, однако, это либо неосуществимо, либо неэкономично для сохранения желаемой реакции, так как подкрепление поведения бывает не всегда одинаковым и регулярным. В большинстве случаев социальное поведение человека подкрепляется только иногда. Ребенок плачет неоднократно, прежде чем добьется внимания матери. Ученый много раз ошибается, прежде чем приходит к правильному решению трудной проблемы. В обоих этих примерах неподкрепленные реакции встречаются до тех пор, пока одна из них не будет подкреплена.

В случае если задается интервал реакций, т.е. определенное соотношение подкреплений и реакций, подкрепления появляются после того, как выполнено определенное число реакций (например, нажатий на рычаг или на ключ).

Таким образом, подкрепления не обязательно следуют после каждого ответа, а могут подаваться лишь время от времени. Более того, подкрепления могут подаваться в регулярном, или фиксированном, режиме — всегда через определенный интервал времени или всегда после определенного количества реакций, либо их можно подавать в переменном режиме — то через одну минуту, то через две, то после пары реакций, то после серии реакций. Каждая схема, или режим подкрепления, как правило, стабилизирует поведение по-разному.

Скиннер тщательно изучал, как режим прерывистого, или частичного, подкрепления влияет на оперантное поведение. Хотя возможны многие различные режимы подкрепления, их все можно классифицировать в соответствии с двумя основными параметрами: 1) подкрепление может иметь место только после того, как истек определенный или случайный временной интервал с момента предыдущего подкрепления (так называемый режим временного подкрепления), 2) подкрепление может иметь место только после того, как с момента подкрепления было получено определенное или случайное количество реакций (режим пропорционального подкрепления). В соответствии с этими двумя параметрами выделяют четыре основных режима подкрепления.

1. Режим подкрепления с постоянным соотношением (ПС). В данном режиме организм подкрепляется по наличию заранее определенного или «постоянного» числа соответствующих реакций. Этот режим является всеобщим в повседневной жизни и ему принадлежит значительная роль в контроле над поведением. Во многих сферах занятости сотрудникам платят отчасти или даже исключительно в соответствии с количеством единиц, которые они производят или продают. В промышленности эта система известна как плата за единицу продукции. Режим ПС обычно устанавливает чрезвычайно высокий оперантный уровень, так как чем чаще организм реагирует, тем большее подкрепление он получает.

2. Режим подкрепления с постоянным интервалом (ПИ). В режиме подкрепления с постоянным интервалом организм подкрепляется после того, как твердо установленный или «постоянный» временной интервал проходит с момента предыдущего подкрепления. На уровне человека режим ПИ действителен при выплате зарплаты за работу, выполненную за час, неделю или месяц. Подобно этому, еженедельная выдача денег ребенку на карманные расходы образует ПИ форму подкрепления. Университеты обычно работают в соответствии с временным режимом ПИ. Экзамены устанавливаются на регулярной основе и отчеты об академической успеваемости издаются в установленные сроки. Любопытно, что режим ПИ дает низкую скорость реагирования сразу после того, как получено подкрепление – феномен, названный паузой после подкрепления. Это показательно для студентов, испытывающих трудности при обучении в середине семестра (предполагается, что они сдали экзамен хорошо), так как следующий экзамен будет еще нескоро. Они буквально делают перерыв в обучении.

3. Режим подкрепления с вариативным соотношением (ВС). В этом режиме организм подкрепляется на основе какого-то в среднем предопределенного числа реакций. Возможно, наиболее драматической иллюстрацией поведения человека, находящегося под контролем режима ВС, является захватывающая азартная игра. Рассмотрим действия человека, играющего в игральный автомат, где нужно опускать монетку или специальной рукояткой вытягивать приз. Эти аппараты запрограммированы таким образом, что подкрепление (деньги) распределяется в соответствии с числом попыток, за которые человек платит, чтобы управлять рукояткой. Однако выигрыш непредсказуем, непостоянен и редко позволяет получать свыше того, что вложил игрок. Это объясняет тот факт, почему владельцы казино получают значительно больше подкреплений, чем их постоянные клиенты. Далее, угасание поведения, приобретенного в соответствии с режимом ВС, происходит очень медленно, так как организм точно не знает, когда будет следующее подкрепление. Таким образом, игрок принуждается опускать монеты в прорезь автомата, несмотря на ничтожный выигрыш (или даже проигрыш), в полной уверенности, что в следующий раз он «сорвет куш». Такая настойчивость типична для поведения, вызванного режимом ВС.

4. Режим подкрепления с вариативным интервалом (ВИ). В этом режиме организм получает подкрепление после того, как проходит неопределенный временной интервал. Подобно режиму ПИ, подкрепление при этом условии зависит от времени. Однако время между подкреплениями по режиму ВИ варьирует вокруг какой-то средней величины, а не является точно установленным. Как правило, скорость реагирования при режиме ВИ является прямой функцией примененной длины интервала: короткие интервалы порождают высокую скорость, а длинные интервалы порождают низкую скорость. Также при подкреплении в режиме ВИ организм стремится установить постоянную скорость реагирования, и при отсутствии подкрепления реакции угасают медленно. В конечном итоге, организм не может точно предвидеть, когда будет следующее подкрепление.

В повседневной жизни режим ВИ нечасто встречается, хотя несколько его вариантов можно наблюдать. Родитель, например, может хвалить поведение ребенка довольно произвольно, рассчитывая, что ребенок будет продолжать вести себя соответствующим образом и в неподкрепленные интервалы времени. Подобно этому, профессора, которые дают «неожиданные» контрольные работы, частота которых варьирует от одной в три дня до одной в три недели, в среднем одна в две недели, используют режим ВИ. При этих условиях от студентов можно ожидать сохранения относительно высокого уровня прилежания, так как они никогда не знают, в какой момент будет следующая контрольная работа.

Как правило, режим ВИ порождает более высокую скорость реагирования и большую сопротивляемость угасанию, чем режим ПИ.

По сути, теория оперантного научения представляет собой изощренную формулировку основных принципов дрессировки животных. Сложное поведение формируется через процесс последовательных приближений, т.е. сложные действия вырабатываются благодаря подкреплению тех элементов поведения, которые соответствуют той конечной форме поведения, какую хотят получить.

Процесс формирования, или процесс постепенного приближения, наиболее четко просматривается в обучении животных. Сложные трюки, демонстрируемые цирковыми животными, не усваиваются как законченное целое. Вместо этого дрессировщик постепенно выстраивает последовательность выученных реакций с помощью подкрепления определенных действий, которые затем связываются между собой или соединяются в цепочки. То, что начинается с усвоения отдельных движений, в конце концов превращается в демонстрацию цирковой публике сложных последовательностей действий. Животное непременно вознаграждается за свое поведение, но итоговая награда ставится в зависимость от исполнения всей серии первоначально усвоенных действий. Аналогичным образом с помощью последовательных приближений можно выработать сложное поведение у человека.

Однако вскоре стало очевидным, что стандартная методика оперантного научения плохо подходила для большого числа сложных оперантных реакций, которые могли спонтанно встречаться с вероятностью, равной почти нулю. В сфере поведения человека, например, сомнительно, что с помощью общей стратегии оперантного научения можно было бы успешно научить пациентов психиатрического отделения приобретать соответствующие навыки межличностного общения. Для того, чтобы облегчить эту задачу, Скиннер [§1аппег, 1953] придумал методику, при которой психологи могли эффективно и быстро уменьшить время, требуемое для обусловливания почти любого поведения в том наборе, которым располагал человек. Эта методика, названная методом успешного приближения, или формированием поведения, состоит из подкрепления поведения, наиболее близкого к желаемому оперантному поведению. К этому приближаются шаг за шагом, и поэтому одна реакция подкрепляется, а затем подменяется другой, более близкой к желаемому результату.

Виды подкрепления

Как отмечалось ранее, под подкреплением понимается какое–либо действие, призванное усилить определенную реакцию. Хотя оперантное обусловливание опирается в первую очередь на использование подкрепления с положительной валентностью, основанных на приближении организма к такого рода вещам, как пища, деньги или похвала, последователи Скиннера подчеркивают также важность подкреплений, основанных на бегстве организма от, или на избегании им отвращающих (неприятных) стимулов. В таких случаях реакции подкрепляются устранением неприятных стимулов или возможностью их избежать, а не появлением приятных стимулов. Во всех этих случаях результатом должно быть сохранение или усиление реакции. В связи с этим различают два вида подкреплений:

Позитивное подкрепление – это приятный стимул, который следуя за желательной реакцией, усиливает ее или поддерживает на том же уровне, т.е. повышает вероятность ее повторения.

Негативное подкрепление – это неприятный стимул, устранение которого усиливает желательную реакцию.

Вместе с тем существует и множество самих способов подкрепления. К наиболее распространенным относятся поощрение (предъявление приятных стимулов) и наказание (предъявление неприятных стимулов).

Таблица 7-1

Позитивное и негативное подкрепление и наказание

    Позитивное   Негативное  
Поощрение   Предъявление положительного стимула   Удаление аверсивного стимула  
Наказание Предъявление аверсивного стимула Удаление положительного стимула

Как поощрение, так и наказание могут выполняться двумя способами, это зависит от того, что следует за реакцией: предъявление или устранение приятного или неприятного стимула. Обратите внимание на то, что подкрепление усиливает реакцию; наказание — ослабляет ее.

Таким образом, в практике воспитания чаще всего используются четыре разновидности подкрепления:

если вслед за желательной реакцией ребенка следует вызывающее приятные ощущения и переживания подкрепляющий стимул, то результат – положительное поощрение;

если за нежелательной реакцией следует не вызывающий приятные ощущения и переживания подкрепляющий стимул, то результат – положительное наказание;

если вызывающий неприятные ощущения и переживания подкрепляющий стимул устраняется после получения желательной реакции, то результат – отрицательное поощрение;

если приятный стимул устраняется после той или иной нежелательной реакции ребенка, то результат– отрицательное наказание.



Поделиться:


Последнее изменение этой страницы: 2017-02-17; просмотров: 344; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.217.8.82 (0.047 с.)