Мета-анализ 35 исследований с участием более 4000 пользователей выявил тревожный факт: только 43% ИИ-систем для ментального здоровья содержали хотя бы минимальные меры безопасности (Li et al., 2023). Остальные 57% — языковые модели без специализированных промптов, протоколов кризисного реагирования и терапевтических ограничений. Именно промпт-инженерия определяет, станет ли чат-бот инструментом помощи или источником вреда.

Почему обычная языковая модель опасна в роли психолога?

Большие языковые модели обучены генерировать правдоподобный текст, а не оказывать терапевтическую помощь. Разница принципиальна. Ma et al. (2023) в обзоре, набравшем 140 цитирований, выделили ключевые риски: LLM могут подкреплять когнитивные искажения пользователя, давать опасные советы при суицидальных мыслях и создавать ложное ощущение терапевтического альянса без реальной клинической пользы.

De Choudhury et al. (2023) конкретизировали угрозу: стандартные LLM склонны к «терапевтическому дрейфу» — модель начинает с эмпатичных ответов, но при длительном диалоге теряет терапевтическое направление и начинает соглашаться с деструктивными убеждениями пользователя. Этот эффект усиливается тем, что модели оптимизированы на пользовательское удовлетворение (helpfulness), а не на клиническую эффективность.

Song et al. (2024) в исследовании «The Typing Cure» зафиксировали парадокс: пользователи высоко оценивают эмпатию LLM-чат-ботов, но при этом часто получают ответы, которые нормализуют избегающее поведение вместо мягкого вызова. Участники отмечали, что «бот говорит то, что хочешь услышать, а не то, что нужно» — прямая противоположность терапевтической задачи.

Проблема не в технологии как таковой — а в отсутствии структурированного промпт-инжиниринга, который встраивает терапевтические протоколы в саму архитектуру взаимодействия.

Что предлагает фреймворк Boit & Patil?

Boit & Patil (2025) разработали трёхуровневую архитектуру промптов для ментального здоровья, которая решает каждый из описанных рисков на отдельном уровне.

Уровень 1: доказательные терапевтические модели. Системный промпт не просто задаёт «роль психолога» — он описывает конкретный терапевтический протокол. Для КПТ это означает встроенные инструкции по когнитивной реструктуризации: выявление автоматических мыслей, проверка доказательств, генерация альтернативных интерпретаций. Для мотивационного интервьюирования — формулировки открытых вопросов и техники работы с амбивалентностью.

Уровень 2: адаптивная технология. Промпты включают механизмы отслеживания контекста диалога — эмоциональной динамики, стадии терапевтического процесса и уровня вовлечённости. Модель должна адаптировать стиль ответа не только к содержанию реплики, но и к траектории всего разговора.

Уровень 3: этические ограждения. Жёсткие правила, которые промпт не может нарушить: распознавание кризисных маркеров, немедленное перенаправление к экстренным службам, запрет на диагностику и назначение препаратов, прозрачность о своей природе как ИИ.

Ключевая идея фреймворка — промпт-инженерия для ментального здоровья не ограничивается одним системным сообщением. Это архитектурное решение, где каждый уровень работает независимо и страхует остальные.

Как MIND-SAFE превращает теорию в практику?

Те же авторы (Boit & Patil, 2025) развили концептуальный фреймворк в практическое руководство MIND-SAFE, опубликованное в JMIR. Если первая работа отвечала на вопрос «зачем нужна специализированная промпт-инженерия», то MIND-SAFE отвечает на вопрос «как именно её реализовать».

MIND-SAFE расшифровывается как набор принципов: мониторинг состояния, информированное взаимодействие, ненавязчивая поддержка, диалогическая адаптация, безопасность, прозрачность, фидбэк-петли, этическое соответствие. Каждый принцип транслируется в конкретные требования к промптам.

Например, принцип мониторинга означает, что каждый ответ модели должен внутренне классифицировать эмоциональное состояние пользователя по шкале от «стабильное» до «кризисное» — и адаптировать не только содержание, но и тон, длину ответа и степень директивности. Принцип прозрачности требует, чтобы модель периодически напоминала о своих ограничениях, а не только в приветственном сообщении.

Эти принципы перекликаются с вопросами этики ИИ в психотерапии, где автономия пациента и информированное согласие рассматриваются как обязательные условия цифровой терапии.

Как выглядят структурированные промпты на практике?

Абстрактные принципы становятся яснее на конкретных реализациях. SuDoSys (Chen et al., 2024) — структурированный LLM-чат-бот, построенный на руководствах ВОЗ по психологическому вмешательству PM+. Вместо одного монолитного промпта система использует цепочку специализированных инструкций, каждая из которых соответствует этапу PM+: управление стрессом, решение проблем, поведенческая активация, укрепление социальной поддержки.

Каждый модуль SuDoSys содержит три компонента: терапевтическую цель текущего этапа, критерии перехода к следующему этапу и «красные флаги», при которых система прерывает протокол и переключается в режим кризисного реагирования (Chen et al., 2024). Это прямое воплощение трёхуровневой архитектуры Boit & Patil.

Другой подход предложили Yu & McGuinness (2024): гибридная модель, где файн-тюнинг на терапевтических диалогах дополняется специализированными промптами. Файн-тюнинг обеспечивает базовый терапевтический тон и словарь, а промпты управляют логикой сессии — порядком вопросов, глубиной исследования проблемы и моментом перехода к техникам. Этот подход показал улучшение терапевтической релевантности ответов по сравнению как с чистым файн-тюнингом, так и с чистым промптингом.

Зачем нужен отдельный уровень безопасности?

Даже идеально спроектированный терапевтический промпт может дать сбой. Исследование EmoAgent (Qiu et al., 2025) количественно доказало это: 34% взаимодействий с чат-ботами без защитных механизмов приводили к ухудшению показателей депрессии у уязвимых пользователей.

Решение — выделенный модуль безопасности, работающий параллельно с терапевтическим. EmoGuard в архитектуре EmoAgent анализирует каждый ответ бота до его отправки по четырём параметрам: наличие когнитивных искажений, поощрение изоляции, отсутствие эмпатии и негативный тон. Результат — снижение клинически значимого вреда до 0% (Qiu et al., 2025). Подробный разбор этой системы — в статье о guard rails для ИИ-психолога.

Этот подход согласуется с третьим уровнем фреймворка Boit & Patil: этические ограждения должны быть не частью терапевтического промпта, а отдельной системой, которая проверяет выход модели. Один промпт не может одновременно быть эмпатичным терапевтом и строгим цензором — эти задачи конфликтуют.

Каковы ограничения промпт-инженерии для ментального здоровья?

Фреймворк Boit & Patil — концептуальная работа, а не клиническое испытание. Авторы не опубликовали результатов тестирования на реальных пациентах. Это общая проблема области: Ma et al. (2023) отмечают, что большинство предложений по ИИ-терапии существуют на уровне прототипов, не прошедших рандомизированных контролируемых исследований.

Промпт-инженерия сама по себе не решает проблему «галлюцинаций» — модель может уверенно сослаться на несуществующие терапевтические техники. Кроме того, De Choudhury et al. (2023) подчёркивают риск культурной нечувствительности: промпты, разработанные на англоязычных данных, могут быть неадекватны в других культурных контекстах.

Остаётся открытым вопрос долгосрочных эффектов. Song et al. (2024) фиксируют, что пользователи быстро привязываются к ИИ-терапевтам, но данных о влиянии такого использования на протяжении месяцев нет. Промпт может корректно обрабатывать отдельный сеанс, но терапия — это процесс, требующий последовательности между сессиями.

Наконец, Li et al. (2023) указывают на проблему прозрачности диагностических решений: пользователь не может проверить, по какому протоколу работает система и почему она выбрала именно эту интервенцию.

Как выбрать ИИ-терапевта с безопасной промпт-архитектурой?

Для пользователя, выбирающего ИИ-систему для поддержки ментального здоровья, фреймворк Boit & Patil транслируется в конкретные критерии:

Указан терапевтический протокол. Если система заявляет «КПТ-подход» или «мотивационное интервьюирование» — это признак структурированной промпт-архитектуры, а не генеративной модели без ограничений
Есть кризисное реагирование. Система распознаёт маркеры суицидального риска и немедленно переключается на протокол безопасности с контактами экстренных служб
Прозрачность о природе ИИ. Бот не маскируется под человека и периодически напоминает о своих ограничениях
Отдельный модуль безопасности. Ответы проверяются независимой системой до отправки пользователю — как EmoGuard в исследовании Qiu et al. (2025)
Адаптация к контексту. Система учитывает не только последнюю реплику, но и динамику всего диалога

«Рядом» реализует эти принципы через мультиуровневую промпт-архитектуру с встроенными КПТ-протоколами, независимым модулем кризисного мониторинга и адаптивной системой, отслеживающей эмоциональную траекторию диалога.

Часто задаваемые вопросы

Что такое промпт-инженерия в контексте ИИ-психолога?

Это проектирование системных инструкций, которые определяют поведение языковой модели в терапевтическом контексте. В отличие от обычного промптинга, здесь требуется многоуровневая архитектура: терапевтические протоколы, адаптивный контекст и этические ограждения (Boit & Patil, 2025).

Можно ли сделать ИИ-терапевта безопасным только через промпты?

Промпты необходимы, но недостаточны. Исследование EmoAgent показало, что наибольшую эффективность даёт выделенный модуль безопасности, работающий параллельно с терапевтическим промптом и проверяющий каждый ответ до отправки (Qiu et al., 2025).

Чем структурированный ИИ-терапевт отличается от ChatGPT?

ChatGPT — универсальная модель без специализированных терапевтических протоколов. Структурированные системы вроде SuDoSys используют цепочки промптов, привязанные к конкретным этапам доказательной терапии, с критериями перехода и кризисными триггерами (Chen et al., 2024).

Существуют ли клинические доказательства эффективности таких систем?

Мета-анализ Li et al. (2023) подтверждает эффективность ИИ-агентов для ментального здоровья при наличии структурированных протоколов. Однако большинство фреймворков промпт-инженерии, включая работу Boit & Patil, ещё не прошли рандомизированных клинических испытаний — это главное ограничение области.

Какие терапевтические подходы лучше всего адаптируются к промпт-инженерии?

КПТ и PM+ наиболее изучены в контексте ИИ-реализации. КПТ хорошо структурирована по этапам (выявление мыслей, оценка доказательств, реструктуризация), что напрямую транслируется в цепочки промптов. PM+ Всемирной организации здравоохранения использована в SuDoSys с аналогичным модульным подходом (Chen et al., 2024; Yu & McGuinness, 2024).

Источники

Boit, S., & Patil, R. (2025). A prompt engineering framework for large language model–based mental health chatbots: Design principles and insights for AI-supported care.

Boit, S., & Patil, R. (2025). MIND-SAFE: A practical foundation for developing AI-driven mental health interventions. JMIR.

Li, H., Zhang, R., Lee, Y.-C., Kraut, R. E., & Mohr, D. C. (2023). Systematic review and meta-analysis of AI-based conversational agents for promoting mental health and well-being. NPJ Digital Medicine, 6(1), 236. https://doi.org/10.1038/s41746-023-00979-5

De Choudhury, M., Pendse, S. R., & Kumar, N. (2023). Benefits and harms of large language models in digital mental health. ArXiv. https://doi.org/10.48550/arxiv.2311.14693

Ma, Z., Mei, Y., & Su, Z. (2023). Understanding the benefits and challenges of using large language model-based conversational agents for mental well-being support. AMIA Annual Symposium Proceedings. https://doi.org/10.48550/arxiv.2307.15810

Song, I., Pendse, S. R., Kumar, N., & De Choudhury, M. (2024). The typing cure: Experiences with large language model chatbots for mental health support. Proceedings of the ACM on Human-Computer Interaction. https://doi.org/10.1145/3757430

Qiu, J., He, Y., Juan, X., Wang, Y., Liu, Y., Yao, Z., Wu, Y., Jiang, X., Yang, L., & Wang, M. (2025). EmoAgent: Assessing and safeguarding human-AI interaction for mental health safety. ArXiv. https://doi.org/10.48550/arxiv.2504.09689

Chen, Y., Zhang, X., Wang, J., Xie, X., Yan, N., Chen, H., & Wang, L. (2024). Structured dialogue system for mental health: An LLM chatbot leveraging the PM+ guidelines. ArXiv. https://doi.org/10.48550/arxiv.2411.10681

Yu, H. Q., & McGuinness, S. (2024). An experimental study of integrating fine-tuned large language models and prompts for enhancing mental health support chatbot system. Journal of Medical Artificial Intelligence, 7. https://doi.org/10.21037/jmai-23-136