Исследователи из Института науки и технологий Нары разработали новую модель обсессивно-компульсивного расстройства, основанную на принципах обучения с подкреплением. Эта модель может привести к лучшему лечению обсессивно-компульсивных и связанных с ними расстройств. Результаты исследования опубликованы в журнале Cell Reports.
Ученые из Института науки и технологий Нары (NAIST), Международного института перспективных телекоммуникационных исследований и Университета Тамагавы продемонстрировали, что обсессивно-компульсивное расстройство (ОКР) можно понимать как результат дисбаланса в процессе обучения между подкреплением и наказанием.
На основе эмпирических проверок своей теоретической модели они показали, что асимметрия в вычислениях мозга, которые связывают текущие результаты с действиями в прошлом, может привести к болезненному поведению.
В частности, это может произойти, когда след в памяти, оставленный действиями в прошлом, по-разному затухает для хорошего и плохого результата. В этом случае “хороший” означает, что результат был лучше, чем ожидалось, а “плохой” означает, что он был хуже, чем ожидалось. Эта работа помогает объяснить, как развивается ОКР.
ОКР – это психическое заболевание, связанное с тревожностью, которое характеризуется навязчивыми и повторяющимися мыслями -или навязчивыми идеями, в сочетании с определенными повторяющимися действиями, известными как компульсии. Пациенты с ОКР часто чувствуют, что они неспособны изменить свое поведение, даже если знают, что навязчивые идеи или компульсии не имеют смысла. В тяжелых случаях они могут сделать человека неспособным вести нормальную жизнь. Компульсивное поведение, например, чрезмерное мытье рук или многократная проверка того, заперты ли двери перед выходом из дома, являются попытками временно уменьшить тревогу, вызванную навязчивыми идеями. Однако до сих пор механизм, с помощью которого усиливается цикл навязчивых идей и компульсий, был недостаточно понятен.
Команда, возглавляемая исследователями из Института науки и технологий Нары, использовала теорию обучения с подкреплением для моделирования болезненного цикла, связанного с ОКР.
В этой рамках этой системы результат, который лучше прогноза, становится более вероятным (положительная ошибка прогноза), а результат, который хуже ожидаемого, подавляется (отрицательная ошибка прогноза). При реализации обучения с подкреплением также важно учитывать задержки, а также положительные/отрицательные ошибки прогнозирования. Как правило, результат определенного выбора доступен после определенной задержки. Поэтому подкрепление и наказание должны назначаться недавним выбором в течение определенного периода времени. Это называется присвоением коэффициента доверия, который в теории обучения с подкреплением реализуется как след в памяти.
В идеале следы в памяти, оставленные действиями в прошлом, затухают с одинаковой скоростью как для положительных, так и для отрицательных ошибок прогноза. Однако это не может быть полностью реализовано в дискретных нейронных системах. Используя моделирование, ученые обнаружили, что агенты неявно усваивают обсессивно-компульсивное поведение, когда коэффициент затухания в памяти следов прошлых действий, связанных с ошибками отрицательного прогноза (?-), намного меньше, чем коэффициент, связанный с ошибками положительного прогноза (?+). Это означает, что с противоположной точки зрения, взгляд на прошлые действия гораздо более ограничен для ошибок отрицательного прогноза, чем для ошибок положительного прогноза.
“Наша модель с несбалансированными факторами распада следов (?+ > ?-) успешно представляет порочный круг одержимости и принуждения, характерных для ОКР”, – говорят соавторы Юки Сакаи и Ютака Сакаи.
Чтобы проверить этот прогноз, исследователи попросили 45 пациентов с ОКР и 168 здоровых людей из контрольной группы сыграть в компьютерную игру с денежными вознаграждениями и штрафами. Пациенты с ОКР показали гораздо меньший ?- по сравнению с ?+, как и предсказывалось вычислительными характеристиками ОКР. Кроме того, этот несбалансированный набор факторов распада следов (?+ > ?-) был нормализован усилителями серотонина, которые являются препаратами первой линии для лечения ОКР.
“Хотя мы думаем, что всегда принимаем рациональные решения, наша вычислительная модель доказывает, что иногда мы неявно подкрепляем неадаптивное поведение”, – говорит автор-корреспондент Саори К. Танака.
Хотя в настоящее время трудно идентифицировать резистентных к лечению пациентов на основе их клинических симптомов, эта компьютерная модель предполагает, что пациенты с сильно несбалансированными факторами распада следов могут не реагировать только на поведенческую терапию. Эти результаты однажды могут быть использованы для определения того, какие пациенты, вероятно, будут резистентны к поведенческой терапии до начала лечения.
Помощь психолога