Павловский эксперимент по сравнению с оперантным обусловливанием. Изображение: Нидерландский институт неврологии

Дофамин регулирует и обучение и мотивацию

Новое исследование, проведенное Нидерландским институтом неврологии, объединяет две точки зрения на функцию нейромедиатора дофамина: одна утверждает, что дофамин обеспечивает сигнал обучения, другая утверждает, что дофамин управляет мотивацией. “Но, вероятно, это и то, и другое”, – говорит Инго Виллун.

Хорошо известно, что дофаминовая система участвует в передаче информации, связанной с вознаграждением, а также в действиях, которые приводят к вознаграждению. Это можно исследовать с помощью экспериментов Павлова и оперантного обусловливания. Павловское обусловливание описывает, как ваш мозг создает ассоциацию между двумя ситуациями или стимулами, которые ранее казались несвязанными.

Известным примером является эксперимент Павлова, в котором собака слышит звук перед получением пищи. После нескольких таких сочетаний звука с пищей один только звук начал вызывать у собаки слюноотделение. Оперантное обусловливание, или инструментальное обучение, отличается от тем, что для получения пищевого вознаграждения важно поведение человека. Это означает, что человек, услышав звук, должен выполнить так называемое оперантное действие, чтобы получить вознаграждение. В экспериментах на животных такой оперантной реакцией часто является нажатие на рычаг.

Измерение дофамина в прилежащем ядре

В своей заключительной докторской работе Джессика Годхуп в сотрудничестве с Тарой Арбаб и Инго Виллуном из Нидерландского института неврологии более подробно рассматривают роль передачи сигналов дофамина в обучении и мотивации. Команда напрямую сравнила две парадигмы обусловливания: самцы крыс подвергались либо павловскому, либо оперантному обусловливанию, в то время как высвобождение дофамина измерялось в прилежащем ядре – области мозга, центральной для обработки этой информации.

Во время экспериментов сигнальная лампочка горела в течение 5 секунд. Для павловской группы пищевая гранула доставлялась в кассету с вознаграждением сразу после того, как гасла сигнальная лампочка. В группе оперантного обусловливания за выключением сигнальной лампочки в оперантную коробку выдвигался рычаг.

После одного нажатия на рычаг он отводился назад, что немедленно приводило к доставке одной пищевой гранулы в пищевую кассету. Если в течение 5 секунд после выдвижения рычага не было нажатия, рычаг убирался и вознаграждение не выдавалось.

Устойчивое высвобождение дофамина при оперантном обусловливании

У крыс в обеих группах в начале сигнала высвобождалось одинаковое количество дофамина, предсказывающего вознаграждение. Однако только у группы оперантного обусловливания наблюдалось последующее устойчивое плато концентрации дофамина на протяжении всего 5-секундного сигнала (с начала сигнала и до нажатия на рычаг).

Это поддержание уровня дофамина наблюдалось достоверно и последовательно на протяжении систематических манипуляций с экспериментальными параметрами и поведенческого тренинга. Поэтому исследователи считают, что устойчивый уровень дофамина может быть промежуточным звеном между обучением и действием, концептуально связанным с мотивацией к совершению действия, приносящего вознаграждение.

“Было проведено много исследований дофамина. У нас есть хорошее представление о том, когда в мозге высвобождается дофамин, но до сих пор ведется много дискуссий о том, каковы точные переменные, определяющие такую передачу сигналов дофамином. По сути, это обсуждение того, что “означает” дофамин. Чтобы исследовать это, ученые обычно проводят либо Павловские эксперименты, либо с оперантным обусловливанием”, – говорит Инго Виллун.

“Но они проверяют немного разные вещи. И то, и другое связано с изучением связи между нейтральным стимулом и вознаграждением. Но оперантное обусловливание требует мотивации для выполнения дополнительного действия (чтобы получить вознаграждение). Поэтому мы сравнили два типа обусловливания в одном и том же эксперименте”.

Добавление кусочка к головоломке

“Наши результаты объединяют два лагеря ученых, которые часто воюют друг с другом: один говорит, что дофамин – это так называемый сигнал ошибки предсказания вознаграждения, означающий, что дофамин высвобождается, когда происходит что-то лучшее, чем ожидалось, и подавляется, когда происходит что-то худшее, чем ожидалось. Это обучающий сигнал”.

“Другой лагерь утверждает, что это неправда. Они говорят, что дофамин как-то связан с мотивацией. Повышенный выброс дофамина придает силы испытуемым, и они усерднее работают, чтобы получить вознаграждение. В прошлом было несколько попыток объединить эти два лагеря, но по-прежнему требуется больше знаний по этому вопросу”.

“В нашем исследовании мы увидели, что только в задаче оперантного обучения уровень дофамина оставался высоким. Похоже, что мотивация закодирована в этом плато. Предсказание вознаграждения – это начальный пик дофамина, но то, насколько сильно сигнал сохраняется, отражает мотивацию. Таким образом, в нашей статье говорится, что существует вероятность того, что дофамин участвует как в обучении, так и в мотивации”.

“Следующими шагами будет выяснение более подробной информации об этом. Нам нужно воспроизвести эксперименты и сделать их более изощренными. Чем сложнее вы это сделаете, тем более точными будут наши прогнозы. Мы собираемся на них опереться и посмотреть, смогут ли они выдержать”.

Последствия

“Дофамин задействован не только в повседневной жизни, но и в таких расстройствах, как наркомания, болезнь Паркинсона и шизофрения. Из-за существования двух лагерей существуют разногласия по поводу того, что именно происходит. Например, некоторые исследователи считают, что, когда наркоманы принимают наркотики, высвобождение дофамина увеличивается, и, как следствие, все сигналы окружающей среды становятся более значимыми.”

“Наркоманы выучивают, что эти сигналы связаны с наркотиком, и принимают все наркотики все чаще и чаще, потому что они постоянно и повсюду получают напоминания о наркотике. С этой точки зрения, зависимость является ошибочным обучением. Другие исследователи считают, что мотивация к приему наркотика усиливается при более частом приеме препарата, потому что наркотик усиливает высвобождение дофамина. Это исследование показывает, что может быть и то, и другое. В зависимости от точного времени обе системы могут быть движущей силой, и обе могут быть задействованы”.

“Это также актуально и для клиники. Назначаемые лекарства могут влиять одновременно и на систему обучения, и на систему мотивации, и тогда все может пойти наперекосяк. Если вы назначаете пациентам с шизофренией классические нейролептики, они становятся медлительными и не могут активно действовать, потому что их система мотивации ослаблена”.

“Пациенты с болезнью Паркинсона принимают дофаминовые препараты в основном потому, что они утратили свой дофамин, но некоторые пациенты начинают играть в азартные игры, потому что их дофаминовая система внезапно перегружается. Мы не можем влиять на компоненты обучения и мотивации по отдельности. Как только вы даете лекарство, оно действует на все компоненты, так что хорошо иметь это в виду”.

Статья опубликована в The Journal of Neuroscience.

Подпишитесь на psy.help в Telegram или ВКонтакте.
Помощь психолога

Check Also

Окно в скрытые социальные предпочтения

Исследователи обнаружили, что люди могут делать выводы о предпочтениях других людей, наблюдая за тем, как …

Почему так важны гены школьных друзей?

Если ваша мама всегда говорила: “Выбирай друзей с умом”, то исследование, проведенное профессором кафедры здравоохранения …