Геймификация отношений между пациентом и терапевтом с помощью обучения с подкреплением

Не так давно терапия ИИ была полностью областью научной фантастики. Классическая космическая опера Фредерика Пола «Врата» исследовала эту тему с главным героем Робинетт Стетли Бродхед, рассказывающим о своих приключениях в качестве галактического сланцевого шахтера ИИ-терапевту.

Хотя многое из научной фантастики остается за пределами нашего понимания, недавние разработки в области машинного обучения открыли новые пути к созданию терапевтического ИИ. Давайте начнем с ответа на два вопроса, которые могут возникнуть при рассмотрении тем терапевтического ИИ: есть ли в нем необходимость и возможно ли это, учитывая текущее состояние машинного обучения?

В следующих абзацах я надеюсь продемонстрировать, почему ответ на оба вопроса положительный. Терапевтический ИИ может даже оказаться одним из самых важных достижений в области машинного обучения в этом десятилетии, особенно если мы измеряем прогресс с точки зрения благополучия человека, а не с помощью кликов по рекламе или рекомендуемых фильмов.

Удовлетворение неудовлетворенной потребности
Есть ли необходимость в терапевтическом ИИ? Если принять во внимание стремительно растущее число массовых расстрелов, самоубийств и случаев применения опиоидов в сочетании с шокирующим отсутствием доступной терапии, я думаю, что ответ ясен. Мы переживаем кризис психического здоровья во многих частях земного шара и нуждаемся в новых инструментах для борьбы с этой эпидемией.

В таких местах, как Соединенные Штаты, где качество психического здоровья, возможно, резко ухудшается, использование терапии ИИ может сэкономить миллионы долларов, не говоря уже о гибели людей, если бы это предотвратило хотя бы один массовый расстрел. .

Проще говоря, существует разрыв в доступности между многими из наших наиболее уязвимых граждан и терапевтической помощью, которая может избежать наихудших исходов.

Есть ли основания полагать, что терапия ИИ может предложить те же преимущества, что и человеческий терапевт? Ранние данные свидетельствуют о том, что это так. Исследование, опубликованное в журнале Computers in Human Behavior, показало, что обмен негативными эмоциями с виртуальным человеком уменьшает эти негативные эмоции и создает эмоциональное облегчение. Если даже виртуальные люди, которым не хватает специфического поведения в терапии, могут принести ощутимую пользу, вполне вероятно, что терапевт с искусственным интеллектом может иметь аналогичную или увеличенную пользу.

В нынешнем виде люди печально известны тем, что очеловечивают животных и других нечеловеческих субъектов — собак, кошек, сломанные пылесосы, регулярно разговаривая с ними, как если бы они были людьми, и интерпретируя их поведение как обладание человеческими намерениями. Я часто слышал, как моя мачеха обращается к своей амазонке Алексе, как к непокорной служанке, и считаю, что такое общение снижает скрытое эмоциональное напряжение в ее доме.

Дорожная карта терапевтического ИИ
Но насколько достижим терапевтический ИИ с технической точки зрения? В значительной степени это может зависеть от типа терапии, которую человек пытается воспроизвести. В целом, похоже, существует по крайней мере один терапевтический метод, который можно воспроизвести с помощью ИИ, — это когнитивно-поведенческая терапия (КПТ). КПТ примечательна тем, что часто включает использование ролевых игр для подготовки к потенциально проблемным взаимодействиям и обучение успокоению ума и расслаблению тела посредством процесса десенсибилизации.

Я считаю, что ключом к прокладыванию пути к терапевтическому ИИ является геймификация отношений между клиентом и терапевтом, как это происходит в когнитивно-поведенческой терапии. Недавние разработки в области обучения с подкреплением показали, что ИИ может играть в самые разные игры, часто на сверхчеловеческом уровне.

В частности, мы можем смоделировать когнитивно-поведенческую терапию как совместную игру для двух человек, в которой терапевт стремится выявить, а затем заменить отличающееся или вредное человеческое поведение. Может ли алгоритм быть достаточно «умным», чтобы изменить ход человеческого поведения? Ответ на этот вопрос, несомненно, положительный, и это показывают миллионы людей, проводящих пальцем по экрану или уставившихся на свои смартфоны прямо сейчас. Такие компании, как Facebook, вложили миллионы во взлом дофаминовой системы человека не в терапевтических целях, а для того, чтобы у людей была зависимость от пролистывания своих медиа-каналов или кликов по рекламе.

Понимание дофаминовой системы человека выявило многочисленные способы корректировки нашего поведения с помощью простых визуальных или слуховых сигналов. Мы гораздо более программируемы, чем большинству из нас хотелось бы верить, и работа терапевта в некотором роде заключается в том, чтобы перепрограммировать нас, чтобы мы меньше наносили себе вред или дезадаптировали поведение. Используя когнитивно-поведенческую терапию, это может быть так же просто, как предъявление стимулов, связанных с травмирующим опытом, а затем предложение клиенту альтернативного результата, который не усиливает реакцию на стресс, которую он ожидал.

Многие виды нашего поведения усваиваются с помощью стимулов окружающей среды и, следовательно, поддаются повторному обучению с помощью таких стимулов. Давайте возьмем пример и посмотрим, как мы можем представить сценарий, в котором ИИ-терапевт в форме алгоритма обучения с подкреплением обнаруживает, а затем заменяет выученную реакцию на травму.

Многие из нас, возможно, пережили травму в детстве или юношестве в социальной среде. Возможно, мы пытались пошутить с новой компанией друзей, и нас за это высмеяли, или когда мы впервые пригласили кого-то на свидание, они насмехались над нами и уходили. Такие взаимодействия могут иметь длительное влияние на наше поведение.

Теперь представьте геймификацию аналогичной ситуации, в которой ИИ-терапевт представляет клиенту виртуальную обстановку, например коктейльную вечеринку, на которой ему нужно найти хозяйку и остроумно представить ее. Достижения машинного обучения в распознавании речи и анализе настроений уже способны определять эмоциональную валентность в нашей речи и в сочетании с биологическими датчиками (частота сердечных сокращений, проводимость кожи) могут дать ИИ-терапевту разумную меру беспокойства, которое вызывает у нас конкретная виртуальная задача. .

Работа ИИ-терапевта, стратегического игрока в этой вымышленной игре, состоит в том, чтобы контролировать динамику сцены, чтобы убедиться, что тревога клиента не превышает определенного порога, и чтобы мы достигли результатов, которые усиливают положительную реакцию. Например, если «клиент» испытывает трудности с поиском хостес на коктейльной вечеринке и испытывает всплеск уровня своей тревожности, ИИ-терапевт может заметить это и заставить хостес переместиться в поле зрения клиентов, уменьшая их беспокойство. Таким образом, мы заменяем выученную тревожную реакцию выученной безопасной реакцией, гарантируя, что ожидаемая травма никогда не произойдет, и ситуация приведет к положительному результату.

Этот пример тесно связан с работой, проводимой над динамическим созданием контента с обучением с подкреплением. При создании динамического контента используется RL для обнаружения сгенерированного игроком сигнала вознаграждения, а затем модифицируются медиа-компоненты в режиме реального времени, чтобы соответствовать предполагаемым предпочтениям пользователей. Недавно я продемонстрировал это в статье На пути к науке о данных, в которой мы рассмотрели, как можно использовать игровой симулятор Unreal Engine и плагин обучения с подкреплением MindMaker для обнаружения сигнала вознаграждения, генерируемого игроком. Использование обучения с подкреплением для создания динамического контента, реагирующего в режиме реального времени на предпочтения пользователя, вероятно, представляет собой новый уровень развития искусственного интеллекта в видеоиграх. В таком сценарии ни один контент не является фиксированным, а постоянно подстраивается под пользователя, поскольку они взаимодействуют с ним так же, как это делают наши интернет-радиостанции.

Тот же принцип можно использовать для терапевтического ИИ — когда человек испытывает высокий уровень стресса в ответ на определенную среду, ИИ может корректировать содержание, чтобы снизить его тревогу. Таким образом, клиент может постепенно стать менее чувствительным к пусковым стимулам и научиться новому поведению, которое не основано на реакции на травму.

Хотя такие адаптивные и динамические механизмы контента все еще находятся в зачаточном состоянии, разумно было бы предложить выйти за рамки простого развлечения и использовать эти инструменты, чтобы облегчить бремя травм, с которыми сталкивается общество. Хотя многие формы терапии, в том числе разговорная терапия, все еще могут быть недоступны для машинного обучения (хотя чат-боты вскоре могут стать ответом на это), другие методы, подобные описанному выше, представляют собой достижимый путь к дешевому и масштабируемому терапевтическому ИИ.

Аарон Круминс — автор книги Перехитрить — обещание и опасность обучения с подкреплением и имеет опыт работы с веб-приложениями и машинным обучением. В настоящее время он работает внештатным консультантом по машинному обучению.