Руководство научением. Роль подкрепления и наказания в научении 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Руководство научением. Роль подкрепления и наказания в научении



 

При изучении научения используется термин подкрепление для обозначения стимула, предъявляемого после какой-то конкретной деятельности и вызывающего повторение и научение этой деятельности.

Подкрепление - решающий детерминант поведения человека. Когда деятельность имеет не так уж много шансов на успех и существуют действия, ведущие к удаче более лёгким путём, естественно, что первая деятельность, даже если к ней приступили, постепенно сходит на нет.

Вот почему учителя предпочитают прилагать свои усилия к тем ученикам, которых легче учить, а большинство экспериментаторов изучать процесс научения у крыс или других животных, а не у столь неясного организма, каким является человек.

Подкрепления связаны с удовлетворением актуальных потребностей. Теоретики, занимающиеся научением, признавали два типа подкрепления -первичное и вторичное. Первичное подкрепление - это любое событие или объект, сами по себе обладающие подкрепляющими свойствами. Первичные подкрепляющие стимулы у людей - это пища, вода (при жажде), физический комфорт и секс. Вторичное, или условное подкрепление - это любое событие или объект, которые приобретают свойство осуществлять подкрепление посредством тесной ассоциации с первичным подкреплением, обусловленным прошлым опытом организма. Вторичными или условными факторами научения человека являются:

1)Конкретные словесные подкрепления: похвала, одобрение учителя (соотнесение связанного с этим научением задания с возможностями обучающегося, что создаст у него уверенность в правомерности успеха; или дать понять, что учителю очень приятно, когда он видит, как ученик пользуется вновь приобретённым научением), обратная связь от учеников в классе, родителей.

2)Символическая стимуляция другими (уважение, признание, внимание со стороны других людей). Предпочтение сложных задач более лёгким с целью получить признание. С целью получения внимания взрослых ребёнок может притворяться больным, плохо себя вести, становиться назойливым, вмешиваться в разговор взрослых, рисоваться, мочиться в постель, на уроке мешать учителю, смеяться, выкрикивать.

3)Внутренняя стимуляция: чувство удовлетворения, удовольствия от успеха. Мотивационный эффект умения (Уайт, 1969). Личность активно ищет занятий, дающих ей реальную возможность на вознаграждение в виде успеха. 4)Соотнесения своих действий с ценностными установками (понятиями честность, уважение, вежливость, терпимость). Личность, поощряющая честность в других людях, почувствует удовлетворение, сделав в сомнительной, но соблазнительной ситуации честный выбор. Внутренняя удовлетворённость и будет вознаграждением.

5)Фактором подкрепления может выступать и удовлетворение потребности в любопытстве. С любопытством тесно связана потребность в стимуляции. Проведённые эксперименты показали: помещённые в лишённую стимулов ситуацию люди через 1-2 дня набрасывались на самые скучные дела, если им предоставляли такую возможность. Любознательность должна возбуждаться и удовлетворяться. Ученики должны иметь возможность исследовать и отыскивать стимуляцию.

Помня о том, что факторы, выступающие в виде в роли подкрепления, у человека очень сложны, рассмотрим те способы, какими подкрепление может влиять на научение.

Эффективность научения зависит от режима предъявления подкреплений. Режим подкрепления - правило, устанавливающее вероятность, с которой подкрепление будет происходить. Самым простым правилом является предъявление подкрепления каждый раз, когда субъект даёт желаемую реакцию. Это называется режимом непрерывного подкрепления и обычно используется на начальном этапе любого оперантного научения, когда организм учится производить правилыгую реакцию. Скиннер также тщательно изучал режим прерывистого, или частичного, подкрепления, когда для сохранения желаемой реакции используется не всегда одинаковое и регулярное подкрепление. Все возможные режимы подкрепления можно классифицировать в соответствии с двумя основными параметрами: 1) подкрепление может иметь место только после того, как истёк определённый или случайный временной интервал с момента предыдущего подкрепления (режим временного подкрепления); 2) подкрепление может иметь место только после того, как с момента подкрепления получено определённое или случайное количество реакций (режим пропорционального подкрепления). В соответствии с этими двумя параметрами выделяются четыре основных режима подкрепления

1.Режим подкрепления с постоянным соотношением (ПС). Организм подкрепляется по наличию заранее определённого или «постоянного» числа соответствующих реакций. В промышленности эта система известна как плата за единицу продукции. Чем чаще организм реагирует, тем большее подкрепление он получает. Необходимо в процессе нового научения. Действие разбивается на этапы. Учитель подкрепляет каждый правильный шаг на пути овладения новым навыком (максимально часто) и не подкрепляет ошибочные действия. При научении речи у младенца - сначала подкрепляется восторгом любое, даже отдалённо напоминающее «ма» звукосочетание. В результате избирательного подкрепления ребёнок научается отбрасывать неподкреплённые реакции и сохраняет лишь те, которые близки к ожидаемому результату. Этот способ был открыт и описан Б.Скиннером и получил название метода последовательных приближений. Научение происходит кратчайшим путём. Подкрепление незначительных шагов, делаемых в нужном направлении, у многих учителей вызывает трудности. Возможно, это связано с установкой, что ученик не продемонстрировал своих усилий и поощрять его не за что.

2.Режим подкрепления с постоянным интервалом (ПИ). Организм подкрепляется после того, как твёрдо установленный или «постоянный» временной интервал проходит с момента предыдущего подкрепления. Например, университеты работают в соответствии с данным режимом подкрепления. Экзамены устанавливаются на регулярной основе и отчёты об академической успеваемости издаются в установленные сроки. Режим ПИ даёт низкую скорость реагирования сразу после того, как получено подкрепление -феномен, названный паузой после подкрепления. Это показательно для студентов, испытывающих трудности при обучении в середине семестра, так как следующий экзамен будет ещё не скоро.

3. Режим подкрепления с вариативным соотношением (ВС). В этом режиме организм подкрепляется на основе какого-то в среднем предопределённого числа реакций. Иллюстрацией поведения человека, находящегося под контролем режима ВС, является захватывающая азартная игра. Игральные аппараты запрограммированы таким образом, что подкрепление (деньги) распределяется в соответствии с числом попыток, за которые человек платит. Однако выигрыш непредсказуем, непостоянен и редко позволяет получать свыше того, что вложил игрок. Угасание поведения, приобретённого в соответствии с режимом ВС, происходит очень медленно, так как организм точно не знает, когда будет следующее подкрепление. Таким образом, игрок принуждается опускать монеты в прорезь автомата, несмотря на ничтожный выигрыш (или даже проигрыш), в полной уверенности, что в следующий раз он «сорвёт куш». Аналогичный механизм - догадка в математике случайно оказалась правильной - получение правильного ответа действий в поведении ученика.

4.Режим подкрепления с вариативным интервалом (ВИ). В этом режиме организм получает подкрепление после того, как проходит неопределённый временной интервал. Как правило, скорость реагирования при режиме ВИ является прямой функцией применённой длины интервала: короткие интервалы порождают высокую скорость, а длинные интервалы порождают низкую скорость. Преподаватели, которые дают «неожиданные» контрольные работы, частота которых варьирует от одной в три дня до одной в три недели используют режим ВИ. При этих условиях от студентов можно ожидать сохранения относительно высокого уровня прилежания, так как они никогда не знают, в какой момент будет следующая контрольная работа. Ожидание подкрепления, происходящего с постоянным интервалом, обуславливает феномен паузы сразу после подкрепления. Низкая скорость реагирования сразу после того, как получено подкрепление (успешно сдал сессию). Студенты испытывают трудности при обучении в середине семестра, так как следующая сессия (подкрепление) ещё не скоро.

Режим ВИ эффективен, когда научение освоено. Его подкрепление может носить случайный нерегулярный характер (время от времени). Обучающийся может поощряться за правильные действия, но никогда за «неверные». Многие учителя редко поощряют своих учеников похвалой за правильно сделанную работу, желательное поведение после того, как произошло научение. Отсутствие подкрепления в конце концов может привести к исчезновению усвоенного типа поведения, оно может забыться.

С точки зрения Скиннера, в основном поведение человека контролируется аверсивными (неприятными или болевыми) стимулами. Два наиболее теничных метода аверсивкого контроля - наказание и негативное подкрепление (приводится по Л. Хьеллу, Д.Зиглеру, 1997, С.347). Наказание уменьшает, по крайней мере временно, вероятность того, что реакция повторится.

По Скиннеру, наказание может быть осуществлено двумя различными способами, которые он называет позитивное наказание и негативное наказание (приводится по Л. Хьеллу, Д.Зиглеру, 1997, С.347). Позитивное наказание встречается всякий раз, когда поведение ведёт к аверсивному исходу. Если дети плохо себя ведут, их шлёпают или ругают; если студенты пользуются шпаргалками на экзамене, им ставят неудовлетворительные оценки; если взрослых ловят на краже, их штрафуют или сажают в тюрьму. Негативное наказание - за поведением следует устранение (возможного) позитивного подкрепляющего стимула. Детям запрещают смотреть телевизор из-за плохого поведения. Широко используемый подход к негативному наказанию - методика приостановки. В соответствии с этой методикой человека моментально удаляют из ситуации, в которой доступны определённые подкрепляющие стимулы. Например, непослушного ученика, мешающего занятиям, могут выгнать из кабинета.

В отличие от наказания, негативное подкрепление - это процесс, в котором организм ограничивает аверсивный стимул или избегает его. Любое поведение, которое препятствует аверсивному положению дел, чаще повторяется и является негативно подкреплённым. Поведение ухода - это тот самый случай. Например, человек, который прячется от палящего солнца, уходя в помещение, скорее всего снова пойдёт туда, когда солнце вновь станет палящим. Уход от аверсивного стимула не то же самое, что избегание его, поскольку аверсивный стимул, которого избегают, физически не представлен. Следовательно, другой способ бороться с неприятными условиями - научиться избегать их, т.е. вести себя так, чтобы предотвратить их появление. Эта стратегия известна как научение избеганию.

Скиннер определял наказание как неэффективное средство научения. Достаточные доказательства влияния наказания на поведение человека нелегко получить, поскольку людей нельзя вовлекать в эксперименты, в которых они могут испытать боль, физическую или душевную. Большая часть доказательств получена в работе с испытуемыми-добровольцами в условиях клиники, например при попытке бросить курить (Э.Стоуне, 1984).

Подобные работы показали, что эффективность наказания при ликвидации нежелательного поведения почти непредсказуема, а его использование приводит к проблемам, которые не всегда осознаются.

Одна из проблем, связанных с использованием наказания - подвергающийся наказанию часто привыкает к нему, а это значит, что интенсивность наказания должна возрастать. Как только плохо ведущий себя ребёнок привыкает к наказанию, оно увеличивается, что опять приводит к новому привыканию и создаёт порочную атмосферу, в которой всё увеличивающееся наказание сосуществует с проблемами плохого поведения.

Наказание привлекает внимание к ученику и в действительности может действовать как подкрепитель. Ученики иногда нарочно совершают поступки, ведущие к наказанию, с тем, чтобы привлечь к себе внимание учителя, а чаще внимание своих одноклассников. Последнее возможно только в ситуации конфликта между учениками и учителем, которая сама по себе может вызвать неоправданное использование наказания. Даже неодобрительные взгляды или замечания могут действовать как подкрепление, если ребёнок ищет способ привлечь к себе внимание учителя или одноклассников. Любая форма внимания к нежелательному поведению почти всегда действует как подкрепление, и оно вместо того, чтобы прекратиться, усиливается.

Характер взаимодействия учителя с отдельными учениками влияет на атмосферу в классе в целом. Негативные эмоции имеют свойство распространяться, действует «волновой эффект». Атмосфера конфликта — это атмосфера, вредная для научения. Небольшая тревожность по отношению к задаче научения может оказаться полезной, но тревожность и отрицательные эмоциональные состояния, к которым приводит конфликтная ситуация, скорее всего, мешают научению, тормозят когнитивное научение. Учитель и, возможно, школа и предметы, в которой и которым он учит, могут восприниматься учениками негативно вследствие чрезмерного использования наказания.

Учитель не всегда отдаёт себе отчёт в используемых формах наказания. Неучитываемый эффект - увеличение интенсивности порицания, произносимого в присутствии других людей. Если не все ученики справились с работой, то похвала правильным результатам, может быть воспринята как порицание неверным действиям. Возникает непредвиденное влияние успеха одного ученика на неудачу другого.

Сведения о неудачном выполнении, сопровождающиеся критическими замечаниями, удваивают наказание.

Опытный учитель упорядочит свои действия таким образом, что, даже если ученик не справится с каким-то фрагментом научения, преподаватель поощрит его, чтобы подкрепление работало против определяемого неудачей эффекта наказания. В данном случае подкреплением служит точная обратная связь, позволяющая учащемуся понять свою проблему и лучше справиться с ней в следующий раз. Одновременно необходимо поощрить его в этих условиях. Знание того, что учитель не думает, будто он стал менее умелым, поскольку не справился с каким-то фрагментом научения, очевидно, скорее приведёт ученика к нужному научению, чем его наказание в тот момент, когда он не справился с заданием.

Наказание влияет на социальное научение. Действия, осуществляемые в школе, становятся моделью для социального научения ученика. Легализация наказания помогает ученикам отнестись к нему как к принятой форме социальных отношений. Укрепляются отношения с позиции силы.

Поведение, за которым последовало наказание, скорее всего вновь повторится там, где отсутствует тот, кто наказывал.

Наказание предназначено для подавления поведения, и, каким бы эффективным оно ни казалось, оно не может использоваться для формирования ответных реакций.

При обучении содержательным задачам или поведению в классе для уменьшения нежелательного поведения существуют более надёжные и эффективные методы, чем наказание. Если подкрепление формирует поведение и приводит к новому научению, соответственно отсутствие подкрепления имеет противоположный эффект: нет подкрепления, нет нового научения, и постепенно исчезает научение, которое не подкрепляется. Подобный процесс известен как изживание.

Наиболее эффективный способ изменить ситуацию - игнорировать нежелательное поведение. Необходимо точно определить природу нежелательных действий. Что собственно делает ученик? Что происходит, когда ученик совершает свои действия, т.е. как учителю реагировать на них? И как часто совершаются эти действия? Уяснив себе это, учитель может приступить к процессу изживания нежелательного поведения с большим знанием дела и с большей верой в успех своих действий.

На начальном этапе применения игнорирования нежелательное поведение почти всегда возрастает. Возможно, это объясняется стремлением учеников усилением действия привлечь к себе внимание учителя. Очевидно, что данный момент для процесса изживания ненужного поведения является решающим. Учитель, вообразивший, что методика игнорирования сразу же даст желаемый эффект, будет обманут в своих ожиданиях и может решить, что метод не работает, хотя на самом деле поведение ученика как раз подтверждает действенность метода. Так называемое внезапное усиление реакции в конце концов прекратится, и нежелательное поведение постепенно начнёт затухать, но этот этап требует от учителя особой осторожности. Если учитель обратит внимание на внезапное усиление реакции ученика, он тем самым подкрепит усиление его активности, и нежелательное поведение упрочится.

Бывает, что источником подкрепления являются одноклассники, тогда игнорирование учителем нежелательного поведения не даст должного эффекта. В таком случае лучшее, что можно сделать, - это побудить одноклассников плохо ведущего себя ученика игнорировать его поведение. Одно из возможных средств такого отвлечения внимания - устроить небольшой перерыв в занятиях. Учитель может также совершить действия, нейтрализующие внимание класса к ученику. Привлечь внимание детей к интересной для них деятельности и поощрить их в занятии этой деятельностью. Тот же метод можно использовать и в отношении ученика, чьё поведение нуждается в изменении. Важно не пропустить момент, когда ученик начинает выполнять требуемые от него действия, и сразу же поощрить его в этом. Таким образом, одновременно работают две вещи: игнорируется нежелательное поведение и подкрепляется желательное.

В определённых обстоятельствах невозможно игнорировать нежелательное поведение с целью его изживания. Действия, срывающие работу других или угрожающие безопасности людей, должны быть прекращены как можно быстрее. В подобных случаях можно использовать наказание, но использовать его следует с осторожностью. Необходимо учесть многие связанные с этим решением проблемы. Необходимо не только удалить ученика из класса или исключить его из какой-либо деятельности, но, как и в случае подкрепления, в этом наказании надо быть последовательным и объяснить, за что ученик наказывается, как долго продлится его наказание и при каких условиях возможно прощение. Очевидной проблемой использования удаления как наказания является ситуация, когда такое удаление действует как подкрепление, а не наказание поведения ученика. Проблема уже не сводится к проступку конкретного ребёнка, а указывает на несоответствие действий учителя всей ситуации обучения.



Поделиться:


Последнее изменение этой страницы: 2021-09-26; просмотров: 405; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.119.111.9 (0.014 с.)