Адзін чатбот — гэта адна мадэль, якая спрабуе быць адначасова і псіхолагам, і аналітыкам, і навігатарам. Даследаванне мультыагентнага фрэймворку MIND (Chen et al., 2025) даказала на дадзеных: выдаленне любога з пяці спецыялізаваных агентаў зніжае тэрапеўтычную эфектыўнасць у сярэднім на 42%. Не памер мадэлі вызначае якасць дапамогі — а архітэктура.

Чаму аднаго LLM недастаткова для псіхалагічнай дапамогі?

ChatGPT, Claude, Gemini — магутныя мадэлі агульнага прызначэння. Але ў іх няма структуры тэрапеўтычнай сесіі. Вы можаце папрасіць GPT «дапамагчы з трывогай» — і атрымаць фармальна карэктны, але клінічна бескарысны адказ. Мадэль лёгка завесці ўбок. Яна не ўтрымлівае фокус на запыце. У яе няма пратаколу і няма «памяці» паміж сесіямі.

Скопінг-агляд 95 рэцэнзаваных даследаванняў (Thieme et al., 2025) пацвердзіў: LLM паказваюць ранні патэнцыял у кансультаванні і эмацыянальнай падтрымцы, але большасць ацэнак заснаваны на малых выбарках, без лангітуднага назірання, у фармаце адной сесіі. Праблема не ў саміх мадэлях — у тым, як яны выкарыстоўваюцца: адна мадэль на ўсе задачы.

У медыцыне ёсць пратаколы вядзення пацыентаў. Урач не імправізуе — ён прытрымліваецца структураванага плану лячэння. Мультыагентны ШІ-псіхолаг — гэта перанос таго ж прынцыпу ў лічбавую тэрапію: кожны агент адказвае за свой участак, і разам яны забяспечваюць якасць, якой адзіночная мадэль дасягнуць не можа.

Як уладкавана мультыагентная архітэктура MIND

Фрэймворк MIND выкарыстоўвае пяць спецыялізаваных агентаў, якія працуюць у цыкле:

Агент	Роля	Аналаг у тэрапіі
Трыгер	Генеруе персаналізаваны сцэнарый з запыту карыстальніка	Тэрапеўт фармулюе запыт на сесію
«Д'ябал»	Агучвае кагнітыўныя скажэнні карыстальніка	Выяўленне аўтаматычных думак у КПТ
Правадыр	Прапаноўвае тэхнікі кагнітыўнай рэструктурызацыі	Тэрапеўтычныя інтэрвенцыі
Стратэг	Ацэньвае прагрэс і вырашае, ці рухаць сюжэт далей	Супервізія і ацэнка дынамікі
Пацыент	Віртуальнае «я» карыстальніка, якое прымае суцяшэнне	Кліент у ролевай гульні

Ключавое адрозненне ад адзіночнага чатбота: кожны агент выконвае адну задачу і робіць яе добра. Трыгер не спрабуе адначасова генераваць сцэнарыі і ацэньваць прагрэс. Правадыр не імправізуе — ён працуе ў рамках даказальных КПТ-тэхнік.

Доказ: што адбываецца, калі прыбраць аднаго агента

Даследчыкі правялі ablation study — сістэматычнае выдаленне кампанентаў для праверкі іх уклада (Chen et al., 2025):

Без агента-правадыра: карыстальнік не атрымлівае структураванай дапамогі → якасць дыялогу падае
Без стратэга: сістэма не разумее, ці прасунуўся карыстальнік → гісторыя ходзіць па крузе
Без механізму памяці: кантэкст губляецца → тэрапеўтычная прагрэсія немагчымая

Сярэдняе падзенне эфектыўнасці пры выдаленні любога кампанента: 42%. Ніводзін агент не дамінуе — менавіта сінергія ўсіх пяці стварае тэрапеўтычны эфект. Гэта як аркестр: прыбярыце скрыпкі — і гучанне збяднее, нават калі духавыя граюць ідэальна.

Дадзеныя: мультыагент vs адзіночны чатбот vs жывы тэрапеўт

MIND параўноўвалі з трыма падыходамі па шасці метрыках (Chen et al., 2025):

Метрыка	MIND	Чатбот	Трэнінг эмпатыі	Традыцыйнае кансультаванне
Цікавасць	5.0	ніжэй	ніжэй	ніжэй
Задаволенасць	5.0	ніжэй	ніжэй	ніжэй
Уцягнутасць	+17.1% vs кансультаванне	—	—	базавы ўзровень
Эмац. палягчэнне	лепшы	—	—	—

Сярэдні прырост па ўсіх метрыках: +13% у параўнанні з традыцыйнымі падыходамі.

У эксперыменце з васьмю добраахвотнікамі па шкале PANAS:

Рост пазітыўнага афекту: +1.46 (MIND) vs +0.36 (адзіночны LLM — EmoLLM)
Розніца ў 4 разы паміж мультыагентнай сістэмай і адзіночным чатботам

Памяць і прагрэсія: тое, чаго няма ў звычайнага чатбота

Адна з крытычных праблем адзіночных LLM у тэрапіі — страта кантэксту. Вы распавялі GPT пра сваю праблему, закрылі чат, адкрылі зноў — і пачынаеце з нуля. Нават у рамках адной сесіі доўгі кантэкст размываецца.

MIND вырашае гэта праз рэкурсіўную сумарызацыю (Chen et al., 2025). Агент-правадыр захоўвае тэрапеўтычныя вехі: «ад самаадмаўлення да пачатковай рэфлексіі», «усведамленне катастрафізацыі». Гэта дазваляе:

Не паўтараць адны і тыя ж інтэрвенцыі
Адсочваць прагрэс паміж сесіямі
Забяспечваць лінейны рух да мэты, а не хаджэнне па крузе

Для параўнання: мультыагентныя сістэмы ў псіхіятрычнай дыягностыцы (MAGI, Gao et al., 2025) таксама паказалі перавагу над адзіночнымі мадэлямі ў структураваных клінічных інтэрв'ю. Прынцып адзін: спецыялізацыя + каардынацыя > універсальнасць.

Распазнаванне кагнітыўных скажэнняў: навошта патрэбны асобны агент

Распазнаванне кагнітыўных скажэнняў — нетрывіяльная задача нават для магутных LLM. Даследаванне мультымадальнага фрэймворку для выяўлення скажэнняў у клінічных размовах (Yao et al., 2024) паказала: аднамадальныя метады дасягаюць F1-меры ўсяго 0.2–0.4. Гэта азначае, што мадэль прапускае больш за палову скажэнняў.

У MIND агент-«д'ябал» спецыялізуецца выключна на гэтай задачы. Ён не спрабуе паралельна быць суцяшальнікам ці аналітыкам — ён увасабляе кагнітыўныя скажэнні карыстальніка: катастрафізацыю, звышабагульненне, чорна-белае мысленне. За кошт вузкай спецыялізацыі якасць мадэлявання вышэйшая, чым у універсальнай мадэлі.

Дадзеныя для працы гэтага агента бяруцца з датасету C2D2, які ахоплівае восем тэматычных катэгорый: працоўныя праблемы, міжасобасныя канфлікты, фінансавыя цяжкасці, сямейная дынаміка, фізічны стрэс і іншыя.

Архітэктура важнейшая за памер мадэлі

Паказальны вынік даследавання: MIND працуе эфектыўна і на закрытых мадэлях (Gemini-2.0-flash, GPT-4o), і на адкрытых (Llama-3.1-8B, Qwen2.5-72B, Deepseek-R1). Пры гэтым прафесійная ацэнка пяці клінічных экспертаў паказала, што Gemini-2.0-flash набраў 4.8/5.0 па стабільнасці дыялогу — але ў рамках мультыагентнай архітэктуры.

Гэта значыць, што справа не ў памеры канкрэтнай мадэлі, а ў тым, як арганізавана ўзаемадзеянне паміж мадэлямі. Мета-аналіз эфектыўнасці лічбавых інтэрвенцый (Firth et al., 2017) паказаў значны эфект пры Hedges' g = 0.38 (n = 3 414). Мультыагентныя сістэмы выводзяць гэты эфект на новы ўзровень за кошт структураванасці і спецыялізацыі.

Абмежаванні і сумленны погляд

Пры ўсіх моцных дадзеных — важна разумець кантэкст:

Асноўны эксперымент з людзьмі: 8 студэнтаў 18–21 года — малая, аднародная выбарка
Параўнанне з «традыцыйным кансультаваннем» — спрошчаная мадэль, не паўнавартасная тэрапія
Людзі з актыўнымі псіхічнымі расстройствамі выключаны з даследавання
Доўгатэрміновыя эфекты не вывучаліся — толькі кароткатэрміновая дынаміка

Агляд 95 даследаванняў LLM у ментальным здароўі (Thieme et al., 2025) падкрэслівае: патрэбны лангітудныя даследаванні з разнастайнымі папуляцыямі. MIND — перспектыўны прататып, але не фінальны прадукт.

Частыя пытанні

Чаму нельга проста выкарыстаць ChatGPT замест псіхолага?

ChatGPT — мадэль агульнага прызначэння без тэрапеўтычнага пратаколу. Яна не ўтрымлівае фокус на запыце, не адсочвае прагрэс і не распазнае кагнітыўныя скажэнні сістэмна. Мультыагентная сістэма з пяццю спецыялізаванымі агентамі паказала +13% эфектыўнасці ў параўнанні з адзіночным чатботам (Chen et al., 2025).

Што такое ablation study і чаму 42% — гэта шмат?

Ablation study — метад, пры якім з сістэмы паслядоўна прыбіраюць кампаненты, каб ацаніць іх уклад. 42% падзення пры выдаленні аднаго агента азначае, што кожны кампанент крытычна важны — сістэма працуе як адзінае цэлае, а не як набор незалежных частак.

Ці можа мультыагентная сістэма замяніць жывога псіхолага?

Не. Гэта інструмент-дадатак, а не замена. Аўтары MIND падкрэсліваюць неабходнасць супервізіі ліцэнзаванага спецыяліста. Перавага — даступнасць 24/7 і зніжэнне бар'ера ўваходу для людзей без доступу да тэрапіі.

На якіх мовах працуе MIND?

На дадзены момант MIND даследаваўся на кітайскай і англійскай мовах. Маштабаванне на іншыя мовы і культурныя кантэксты — адзін з напрамкаў далейшай працы, адзначаны аўтарамі.

Якую мадэль лепш выкарыстоўваць для ШІ-тэрапіі?

Даследаванне паказала, што архітэктура важнейшая за канкрэтную мадэль. Gemini-2.0-flash, GPT-4o і нават адкрыты Llama-3.1-8B працуюць эфектыўна ў мультыагентнай архітэктуры. Ключавы фактар — спецыялізацыя агентаў і іх каардынацыя.

Крыніцы

Chen, Y., Li, C., Wang, Y., Ju, T., Xiao, Q., Zhang, N., Kong, Z., Wang, P., & Yan, B. (2025). MIND: Towards immersive psychological healing with multi-agent inner dialogue. arXiv preprint. https://doi.org/10.48550/arXiv.2502.19860

Firth, J., Torous, J., Nicholas, J., Carney, R., Rosenbaum, S., & Sarris, J. (2017). The efficacy of smartphone-based mental health interventions for depressive symptoms: A meta-analysis of randomized controlled trials. World Psychiatry, 16(3), 287–298. https://doi.org/10.1002/wps.20472

Gao, Y., et al. (2025). Multi-agent guided interview for psychiatric assessment. Findings of the Association for Computational Linguistics (ACL 2025).

Thieme, A., et al. (2025). A scoping review of large language models for generative tasks in mental health care. npj Digital Medicine.

Yao, Z., et al. (2024). Deciphering cognitive distortions in patient-doctor mental health conversations. Proceedings of EMNLP 2024.