Основы кликер-тренинга
Содержание.
Введение.
Актуальность темы. Происхождение и источники кликер-тренинга.
Сравнение имеющихся и предлагаемых методов решения проблемы.
Происхождение кликер-тренинга.
Основная часть.
Установление правильных иерархических отношений в «стае» человек-собака.
Обучение поведению с помощью кликер-тренинга.
Обуславливание сигнала.
Обучение новому поведению. Повышение критериев.
Окончание повышения критериев.
Взятие поведения под стимульный контроль.
Включение поведения в репертуар.
Вариабельный режим подкрепления.
Включение отвлечений, усложнений.
Совершенствование навыка.
Включение очень редкого вариабельного подкрепления.
Заключение.
Список литературы.
Введение.
Актуальность темы. Происхождение и источники кликер-тренинга.
В масштабах планеты, методики обучения с помощью положительного подкрепления произвели настоящую революцию в методике обучения и, особенно, дрессировки в 90-х годах. Лидирующее положение среди этих методик занял кликер-тренинг. Этот вид обучения пока мало известен в России среди практиков – дрессировщиков собак. Насколько мне известно, именно наша группа собаководов стала первой в России, приступившей к изучению и применению кликер-тренинга, начиная осени 2000 года. Задачи адаптации этой методики к отечественному поголовью собак, развития методики с учетом богатых традиций российского соревновательного собаководства являются актуальнейшими для дрессировки России.
Сравнение имеющихся и предлагаемых методов решения проблемы.
Кликер-тренинг отличается от преобладающих в России вариантов контрастного метода обучения.
Главные отличия:
1. Отсутствие наказания – обучаемый не выполняет поведение от страха, чтобы избежать наказания. Обучаемый «работает» только, чтобы заслужить подкрепление. Даже при обучении животных никогда не применяется сила (поводок – только, чтобы животное не убежало).
2. Развитие творчества обучаемого. К минимуму сведены подсказки. Обучаемый предлагает варианты поведения, заранее не зная, что от него требуется. Нужные варианты подкрепляются.
Происхождение кликер-тренинга.
Кликер-тренинг - это вид обучения не только собак, но и других живых существ включая людей. Настоящий доклад основан на материалах обучения нескольких собак и одной кошки. Зародился кликер-тренинг в среде дрессировщиков дельфинов. При обучении и аттестации кликер-тренеров в США работают с цыплятами. При кликер-тренировке используется методика положительного подкрепления, о которой будет сказано ниже.
Теория кликер-тренинга основана на трёх источниках: положительное подкрепление, оперантный метод научения и сигнал.
Источники кликер-тренинга
Положительное подкрепление – это то, к чему собака стремится, вероятность чего она старается повысить своим поведением. Особенность метода положительного подкрепления в том, что правильное поведение поощряется, а неправильное игнорируется.
Следующий источник кликер-тренинга – оперантный метод научения. Оперантный метод научения основан на выработке оперантного рефлекса. Оперантным он назван от слова «oперант», что означает «действие».
Главные особенности оперантного метода научения:
1. это обучение новому поведению без стартового стимула,
2. разучивание поведения не целиком, а последовательными фрагментами
3. реакция обучающего идёт за действиями обучаемого.
И, наконец, третий источник кликер–тренинга – это сигнал
Выбирая сигнал, нужно прежде всего думать о выборе значения сигнала и о выборе звука сигнала.
Поговорим сначала о выборе значения сигнала. Основных значений сигнала всего два: сигнал = «молодец, продолжай дальше» и сигнал = «молодец, можешь закончить». При работе с кликером нам безусловно подходит вариант сигнал = «молодец, можешь закончить», потому что сочетание условного подкрепления с безусловным подкреплением должно быть постоянным и без отсрочки по времени, иначе ослабевает значение сигнала условного положительного подкрепления.
Далее о выборе звука сигнала. Мы выбрали сигнал кликера, потому что он по нескольким параметрам лучше других источников сигнала. Вот главные из достоинств кликера:
1. Сигнал кликера не может быть услышан собакой в обычной жизни.
2. Сигнал кликера звучит всегда одинаково, в отличии от других источников сигнала, которые трудно повторить дважды одинаково.
3. Кликер очень удобен в применении (маленький, дешёвый).
4. В шуме обучаемый может не услышать другой условный раздражитель, в то время как сигнал кликера хорошо различим среди посторонних звуков, к тому же он отлично воспринимается обучаемым на расстоянии.
5. Кликер очень быстро издает звук.
Главными «конкурентами» кликера являются: пищащая игрушка, свисток и голосовой сигнал, но все же кликер превосходит их в скорости воспроизведения звука. Свисток и голосовой сигнал – наиболее распространенные и удобные «конкуренты» кликера. Но у них имеются следующие недостатки: медленная скорость произведения звука, звуковой сигнал подается неодинаково. Если Вам, кроме точной отметки желательного поведения кликером, потребуется поощрить или поддержать обучаемого голосом, то Вы не сможете этого сделать, потому что у Вас будет занят рот.
При дрессировке экстра-класса «на послушание» некоторые дрессировщики иногда одинаково обуславливают два разных сигнала в качестве сигналов условного положительного подкрепления: сигнал кликера и вербальный (словесный, голосовой). Это может пригодиться на случай, если будут заняты обе руки дрессировщика.
Например: многие дрессировщики знают, как трудно добиться от молодой собаки надежной выдержки в положении «стоять». Эффективно применять для стабилизации выдержки метод «провокации». В этом случае, дрессировщик одной рукой слегка надавливает на спину собаки, а другой потягивает ее вниз за лапы. Как только мышцы собаки напрягаются, оказывая сопротивление «провоцирующему» воздействию, нужно очень точное по времени условное положительное подкрепление. Так как руки заняты, точную по времени отметку желательного мускульного усилия, можно сделать только вербально.
Игрушка, в общем, не хуже голосового сигнала и свистка. Но у нее есть еще один минус: если Вы захотите позаниматься с собакой на дрессировочной площадке, то высока вероятность, что при первом же звуке Вы окажетесь в кольце желающих поучиться именно у Вас собачек, сбежавших от своих дрессировщиков.
Как обучение поведению с помощью кликер-тренинга осуществляется на практике, описано в следующей главе.
Основная часть.
Установление правильных иерархических отношений в «стае» человек-собака.
Этот процесс происходит постоянно. Подробное рассмотрение иерархии не является предметом данной работы. Отметим два момента:
1. Так как кликер-тренинг основан на том, что собака систематически «зарабатывает» пищу, а дрессировщик пищу контролирует, этот метод хорошо подходит для корректировки иерархических отношений;
2. Необходимо, чтобы собака позволяла дрессировщику укладывать себя как угодно, трогать, вставлять градусник, чистить уши и зубы и т.п. Такая покорность собаки удобно обуславливается с помощью кликера.
Обучение поведению с помощью кликер-тренинга.
Обуславливание сигнала.
Это подкрепление условного раздражителя безусловным, например, пищей. При такой работе образуется классический условный рефлекс «по Павлову», т.е. безусловное подкрепление дается после условного сигнала вне зависимости от действий обучаемого. Длится два-три дня, в качестве безусловного подкрепления применяется чаще всего пища, причем основной рацион собаки, а не дополнительная подкормка. Самая типичная ошибка при обуславливании сигнала – когда обучающий не избегает единообразного поведения обучаемого (в момент подачи сигнала).
Обучение новому поведению. Повышение критериев.
Применение подсказки (в частности «мишени») при обучению новому поведению ускоряет обучение, но снижает «творческую активность» собаки, она не так охотно предлагает новые варианты поведения, ожидая подсказки.
Повышение критериев идет по двум направлениям.
1. Поведение разучивается по последовательным фрагментам. Например: чтобы научить собаку выполнять кувырок лежа (вокруг продольной оси), мы выделяем следующие фрагменты: лежащая собака поворачивает голову, повернув голову ложится набок, ложится на спину, выполняет кувырок. Вначале мы подкрепляем лишь поворот головы в сторону. Когда это поведение становится стабильным, мы повышаем критерий: перестаем кликать только за поворот головы. Дождавшись, когда после поворота головы собака делает такое движение, как будто пытается прилечь на бок, мы подкрепляем это движение. Добиваемся стабильности. Повышаем критерий. И так – до тех пор, пока целостное поведение не будет в основном соответствовать желаемому.
2. Повышение критериев по качеству исполнения (темп, четкость выполнения ).
Окончание повышения критериев.
Окончание повышения критериев можно начинать только тогда, когда все фрагменты поведения собраны в единую картину и поведение по качеству в основном удовлетворяет требованиям дрессировщика.
Взятие поведения под стимульный контроль может происходить только после окончания повышения критериев по складыванию поведения из фрагментов. Дело в том, что каждый фрагмент является в глазах обучаемого отдельным независимым поведением. Выполнение каждого из них (фрагмента или суммы фрагментов) по одному и тому же стимулу является тяжелейшей нагрузкой на нервную систему ученика.
Повышение критериев по качеству выполнения поведения может продолжаться всю жизнь.
Взятие поведения под стимульный контроль.
Другими словами, это привязка поведения к команде. Когда дрессировщик решил взять поведение под стимульный контроль, он перестает подкреплять это поведение без команды. А поведение, предложенное после команды, подкрепляется.
Крайне важно правильно определить правильно момент времени для взятия поведения под стимульный контроль. Типичная ошибка новичка – делать это преждевременно. Нужный момент для взятия поведения под стимульный контроль определяется по двум параметрам. Во первых, обучаемый начинает часто и регулярно предлагать данное поведение. Во вторых, должно быть закончено последовательное формирование поведения из фрагментов. Подробнее об этом было рассказано выше.
Включение поведения в репертуар.
Поведение, взятое под стимульный контроль, можно включать в репертуар. Репертуар - это комплекс поведений, взятых под стимульный контроль. Поведение, не взятое под стимульный контроль, отрабатывается отдельно.
Вариабельный режим подкрепления.
Это – когда правильное поведение подкрепляется не каждый раз. Основано на том же психологическом механизме, который привлекает играющих с «однорукими бандитами» - эффект неожиданности выигрыша.
Вариабельный режим подкрепления нельзя применять в ситуациях, когда собака делает выбор между несколькими несовместимыми поведениями (например, выборка вещи по запаху).
Включение отвлечений, усложнений.
Обучение новому поведению происходит сначала без отвлечений. Потом вводят все больше и больше отвлечений и усложнений, стабилизируют выполнение навыка в их присутствии. Насколько сложны отвлечения зависит от цели обучения данному навыку. Например, если мы обучаем проводника слепого, то отвлечения максимально усложнены и стабильности добиваемся предельной, так как от работы собаки напрямую зависит жизнь человека.
Если отвлечение по силе воздействия сравнимо с подкреплением, то нежелательное поведение самоподкрепляется и корректировать такое поведение кликером затруднительно, если вообще возможно.
Совершенствование навыка.
Это – повышение критериев по качеству, которое может происходить всю жизнь. Для навыков, не предполагающих выбор между несовместимыми поведениями, обычно сочетается с вариабельным режимом подкрепления.
Включение очень редкого вариабельного подкрепления.
Включение очень редкого вариабельного подкрепления на практике означает, что элемент разучен. Кликер применяется эпизодически, только для того, чтобы поведения не угасало. Каждое применение кликера сопровождается усиленной порцией безусловного подкрепления («Джек Пот»). Обычно стараются эпизодически подкреплять наиболее успешные по качеству, «выдающиеся» демонстрации поведения.
Заключение.
Применение методики кликер-тренинга в России весьма актуально как с точки зрения повышения качества обучения, так и точки зрения внедрения более гуманных методов дрессировки. Кликер-тренинг успешно может применяться, как для начального обучения, так и для тонкого совершенствования навыков при соревновательной дрессировке экстра-класса.
Список литературы.
1. Прайор К. Не рычите на собаку. – М.: Селена, 1995
2. Pryor K. Clicker Training for dogs. – Sunshine Books, Inc., 1999. – 52 c.
3. Wilkes G. Clicker Training Start Kit. – Clean Run Production, 1999. – 50
4. Donaldson J. Dogs are from Neptune. – Lasar Multimedia Production, 1998 – 162
5. Spector M. Clicker Training for Obedience. – Sunshine Books, Inc, 1999 – 267
Источник статьи: kliker-trening.ru
Автор: Бондарева Анна, Клуб юных собаководов
На главную
Разработка сайта Пшеничников Михаил (email: introf@mail.ru) |