ТОП 10:

Павловский условный рефлекс.



Павловский условный рефлекс описывает ответную реакцию собаки на стимулы и то, как она может формироваться. При формировании данного условного рефлекса собака учится объединять определенное событие с определенной реакцией. Иначе говоря, мы обучаем животное прогнозировать, что произойдет в следствии определенных действий и в определенной обстановке. Когда собака усваивает, что сделанный ею прогноз верен, она начинает действовать с опережением. Таким образом, мы получаем предсказуемую реакцию на сигнал или раздражитель.

В концепции классического условного рефлекса стимулы делятся на два типа. Первый тип – безусловные стимулы, которые вызывают врожденный ответ, или безусловную реакцию. Например, при предъявлении пищи (безусловного раздражителя), собака выделяет слюну (безусловная реакция). Выделение слюны у собаки это безусловная реакция.

Второй тип – это условные стимулы, которые подразумевают обучение и формирование условной реакции. Для формирования условного рефлекса у собаки условный раздражитель сочетают с безусловной реакцией и получают условную реакцию. Классический пример условной реакции – собака, у которой выделяется слюна в ожидании пищи, когда дается сигнал, например звонок. Звонок это условный раздражитель, а выделение слюны – условная реакция. Чтобы создать эту условную реакцию, каждый раз, когда предъявляется пища, должен звенеть колокольчик. Скоро собака свяжет звонок с пищей и будет выделять слюну всякий раз, услышав колокольчик.

 

Оперантное обучение.

Теория оперантного обучения объясняет, как ведя себя произвольным образом, собака обучается, к чему - плохому или хорошему - ее действия приведут в результате. Оперантное обучение предусматривает четыре метода, которые усиливают желательное поведение и уменьшают нежелательное поведение.

Первые два метода – это подкрепление: отрицательное и положительное. При положительном подкреплении собаку поощряют за определенное поведение: села = угощение. При отрицательном подкреплении желаемое поведение собаки подкрепляется избавлением от неприятного воздействия: села = нет рывка поводком.

Два других метода - это отрицательное и положительное наказание. При положительном наказании, неблагоприятное последствие связывается с нежелательным поведением: не села = рывок поводком. При отрицательном наказании, поощрение, или положительное воздействие прекращается, если собака демонстрирует нежелательное поведение: не села = нет угощения.

Мы обсудим применение в дрессировке положительного и отрицательного подкрепления и наказания в Главе 4. А пока эта схема поможет вам лучше понимать четыре метода, используемые при оперантном обучении, термины, применяемые при их описании, и их предполагаемые результаты.

Оперантное обучение
  …дают …забирают
Что-то хорошее… Положительное подкрепление сел = лакомство (реакция усиливается) Отрицательное наказание Не сел = нет лакомства (реакция уменьшается)
Что-то плохое… Положительное наказание Не сел = рывок поводком (реакция уменьшается) Отрицательное подкрепление Сел = нет рывка поводком (реакция усиливается)

Когда вы размышляете о методе дрессировки и о том, какое подкрепление или наказание использовать, бывает полезно спросить себя:

1. Какое поведение нужно изменить?

2. Частота проявления этого поведения должна увеличиться или уменьшиться?

3. Какие выводы собака должна сделать?

4. В итоге, должна ли собака получить что-либо или быть лишенной чего-либо?

 

Временные соотношения между стимулами

Для того, чтобы обучение осуществилось, крайне важно, каким образом связываются условный и безусловный раздражители. Дрессировщики называют это временными соотношениями между стимулами. Есть четыре способа объединения безусловного и условного стимулов. Для объяснения мы используем типичную в дрессировке ситуацию: применение команды «нет», в сочетании с коррекцией поводком, чтобы прекратить нежелательное поведение. В этом случае при помощи команды «нет», которая представляет собой условный раздражитель, мы сообщаем собаке, что далее последует безусловный раздражитель, в данном случае, воздействие поводком.

Один из способов формирования связи между стимулами называется следовой условный рефлекс. В этом случае действие условного стимула начинается и заканчивается до предъявления стимула безусловного. В нашей ситуации тренер говорит «нет» и потом производит коррекцию поводком.

Второй способ называется запаздывающий условный рефлекс. В этом случае воздействие условного стимула начинается до предъявления безусловного, и заканчивается, как только предъявляют безусловный раздражитель. Другими словами, они слегка накладываются друг на друга, но условный раздражитель предъявляется раньше безусловного. В нашем ситуации тренер говорит «нееет» и производит коррекцию поводком в тот момент, когда он еще говорит «нет». И при следовом и при запаздывающем условном рефлексе у собаки быстро образуется ассоциация.

Третий способ соединения стимулов называется совпадающий условный рефлекс. В этом случае действие условного и безусловного стимулов начинается и заканчивается одновременно. В нашей ситуации, дрессировщик говорит «нет» и в то же время производит коррекцию поводком. Воздействие поводком заканчивается сразу, как только дрессировщик закончит произносить слово «нет». Здесь команда «нет» не служит индикатором приближающейся коррекции.

Четвертый способ называется условный рефлекс с обратной связью. В этом случае дрессировщик сначала производит коррекцию поводком, а потом дает команду «нет». Когда это происходит, у собаки нет оснований связывать команду «нет» с воздействием поводка, поскольку она сначала получает воздействие и не может ничего сделать, чтобы избежать его. Очевидно, что совпадающий и обратный способ предъявления стимулов на самом деле не помогут собаке усвоить связь между условным и безусловным стимулами.

 

Дрессировочные термины

В науке о дрессировке вы можете встретить много других терминов, которыми напичканы дрессировочные программы. Важно понимать, что означают эти термины, и какие методики дрессировки они описывают, а так же возможные преимущества и недостатки этих методик.

 

Обучение с первой пробы

Как вы можете догадаться, обучение с первой пробы это обучение в результате единственного события. Такое событие должно произвести огромное впечатление на собаку, снимая необходимость повторения урока.

Например, молодую собаку, незнакомую со стеком сильно ударили им вначале. Событие произвело такое впечатление, что собака отказывается кусаться при виде стека. Она может также отказываться кусаться и в другое время, или отказываться кусать ударившего её фигуранта. Таким образом, хотя вы и не собирались учить собаку этому, но, тем не менее, собака этому научилась.

 

Угасание поведения

Угасание поведения происходит, когда поведение больше не подкрепляется – оно не приводит к получению поощрения. В результате это поведение прекращается.

Например, если вы берете игрушку для дрессировки и отдаете ее в качестве поощрения при хорошем послушании, игрушка подкрепляет определенное поведение. Если игрушку больше не дают в качестве подкрепления, четкость выполнения может ухудшиться, поскольку поведение не подкрепляется. Это происходит, даже если игрушку предъявляют. Фактически, если ее не дают как подкрепление, собака, скорее всего, потеряет к ней интерес.

 

Побуждение

Побуждение происходит, когда занятие построено таким образом, что собака не может совершить ошибку. Например, если вы используете желоб, чтобы научить собаку прыгать, у нее нет возможности обойти барьер. Преимущество здесь в том, что собака может научиться только правильному способу брать барьер – и никогда ошибочному. Побуждение используют чтобы ускорить обучение и исключить путаницу.

 

Принцип Примака

Другая интересная теория, которую большинство дрессировщиков подсознательно используют, поскольку она работает (но немногие знают этот термин) это принцип Примака, названный в честь ученого Дэвида Примака. Утверждается, что высоковероятное, предпочтительное поведение может использоваться для подкрепления маловероятного поведения. Доступ к предпочтительному поведению зависит от выполнения маловероятного поведения.

Идея заключается в том, что предпочтительная деятельность может быть использована для подкрепления некоторой менее привлекательной деятельности. Например, собака любит играть с игрушками, даже сама с собой. Это высоко вероятная деятельность. Тогда мы используем игру с игрушкой чтобы мотивировать собаку работать в послушании, это подкрепляет работу по послушанию, делая ее более приятной.

 







Последнее изменение этой страницы: 2016-04-08; Нарушение авторского права страницы

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 54.160.19.155 (0.008 с.)