Мэта-аналіз 35 даследаванняў з удзелам больш за 17 000 чалавек паказаў: ШІ-чат-боты значна зніжаюць сімптомы дэпрэсіі (Hedges' g = 0,64) і псіхалагічнага дыстрэсу (g = 0,70). Генератыўныя мадэлі аказаліся ў 2,4 разы эфектыўнейшымі за скрыптавыя сістэмы. Ніжэй — разбор даных, ключавых высноў і абмежаванняў найбуйнейшага на сёння агляду доказнай базы ШІ-тэрапіі.

Што за мэта-аналіз і чаму ён важны?

У 2023 годзе каманда даследчыкаў з Сінгапурскага нацыянальнага ўніверсітэта і Паўночна-Заходняга ўніверсітэта (ЗША) апублікавала сістэматычны агляд і мэта-аналіз у NPJ Digital Medicine — часопісе першага квартылю па лічбавай медыцыне (Li et al., 2023). На момант публікацыі гэта самы маштабны аналіз ШІ-чат-ботаў для псіхічнага здароўя.

Аўтары прааналізавалі 12 баз даных навуковых публікацый, адабралі 35 эксперыментальных даследаванняў (з іх 15 рандамізаваных клінічных выпрабаванняў) і абагульнілі даныя пра 17 123 удзельнікі з 15 краін. У агляд увайшлі 23 розныя сістэмы: ад добра вядомых Woebot і Wysa да менш распаўсюджаных Tess, Elomia, XiaoE і VRECC.

Папярэднія агляды (Vaidyam et al., 2019) пераважна ахоплівалі скрыптавыя чат-боты з наканаванымі сцэнарыямі. Гэты мэта-аналіз упершыню вылучыў і параўнаў менавіта ШІ-сістэмы — з апрацоўкай натуральнай мовы і генератыўнымі мадэлямі.

Ці зніжае ШІ-чат-бот сімптомы дэпрэсіі?

Так. Мэта-аналіз 13 РКВ (1 744 удзельнікі) паказаў статыстычна значнае зніжэнне псіхалагічнага дыстрэсу: Hedges' g = 0,70 (95% ДІ: 0,18–1,22). Па асобных вымярэннях:

Дэпрэсія: g = 0,64 (95% ДІ: 0,17–1,12) — значнае зніжэнне
Трывожнасць: g = 0,65 (95% ДІ: −0,46–1,77) — не значна
Агульны дабрабыт: g = 0,32 (95% ДІ: −0,13–0,78) — не значна

Памер эфекту g = 0,64 лічыцца сярэднім паводле шкалы Коэна. Гэта супастаўна з эфектам шэрагу традыцыйных псіхатэрапеўтычных інтэрвенцый. Папярэднія мэта-аналізы скрыптавых чат-ботаў паказвалі больш сціплыя вынікі — g ад 0,24 да 0,47 (Vaidyam et al., 2019).

Агульны псіхалагічны дабрабыт не палепшыўся. Аўтары тлумачаць гэта тым, што паказчыкі дабрабыту больш стабільныя ў часе і менш адчувальныя да кароткатэрміновых інтэрвенцый. Акрамя таго, у гэтую катэгорыю ўвайшло толькі 8 РКВ — статыстычнай магутнасці магло не хапіць.

Генератыўны ШІ супраць скрыптавых чат-ботаў: 2,4-кратная розніца

Самы прыкметны вынік — розніца паміж тыпамі ШІ. Генератыўныя мадэлі (GPT, BERT) паказалі памер эфекту g = 1,24, тады як скрыптавыя (retrieval-based) сістэмы — g = 0,52. Розніца статыстычна значная (F = 4,88, p = 0,019).

Генератыўныя мадэлі не ідуць па гатовых сцэнарыях, а ствараюць адказы «з нуля», адаптуючыся да кантэксту размовы. Гэта дазваляе ім дакладней рэагаваць на эмацыйны стан, фармуляваць персаналізаваныя рэкамендацыі і падтрымліваць больш натуральны дыялог.

З 35 вывучаных сістэм толькі 5 (14,3%) выкарыстоўвалі генератыўны падыход, але менавіта яны далі найбольшы тэрапеўтычны эфект. Адна з такіх сістэм — Therabot, якая паказала зніжэнне дэпрэсіі на 51% у асобным клінічным выпрабаванні (Sharma et al., 2023). З 2023 года доля генератыўных сістэм імкліва расце: новыя платформы ўсё часцей будуюцца на вялікіх моўных мадэлях.

Каму ШІ-тэрапія дапамагае найбольш?

Субгрупавы аналіз выявіў некалькі значных мадэратараў эфектыўнасці:

Па стане здароўя. Людзі з клінічнымі або субклінічнымі сімптомамі (g = 1,07) атрымалі ў 10 разоў больш карысці, чым здаровыя ўдзельнікі (g = 0,11). Гэта ўзгадняецца з агульным прынцыпам: псіхалагічныя інтэрвенцыі найбольш эфектыўныя для тых, хто сапраўды мае патрэбу ў дапамозе (F = 7,15, p = 0,005).

Па платформе. Мабільныя дадаткі (g = 0,96) і месенджары (g = 0,75) значна пераўзыходзілі вэб-версіі (g = −0,08). Смартфон застаецца асноўным каналам доступу да ШІ-тэрапіі (F = 3,26, p = 0,046).

Па мадальнасці. Мультымадальныя сістэмы — тэкст, голас, візуальныя элементы — (g = 0,83) некалькі пераўзыходзілі чыста тэкставыя (g = 0,67). Галасавы кампанент узмацняе адчуванне сацыяльнай прысутнасці.

Па ўзросце. Дарослыя сярэдняга і старэйшага ўзросту (g = 0,85) атрымалі больш карысці, чым моладзь (g = 0,64). Пол не ўплываў на вынік. Асобны мэта-аналіз 2025 года пацвердзіў, што чат-боты зніжаюць дыстрэс і ў моладзі, хоць і з меншым эфектам (Li et al., 2025).

Што карыстальнікі цэняць у ШІ-тэрапеўце?

16 з 35 даследаванняў збіралі якасную зваротную сувязь ад удзельнікаў. Ключавыя фактары пазітыўнага вопыту:

Тэрапеўтычны альянс (8 даследаванняў): эмпатычныя зносіны, безацэначнасць, рэгулярныя чэк-іны, чалавекападобная асоба
Змест (6 даследаванняў): канкрэтныя тэрапеўтычныя тэхнікі, багацце кантэнту, дапамога ў навучанні навыкам
Даступнасць (2 даследаванні): падтрымка ў любы час сутак, без чэргаў і стыгмы

Галоўная прычына негатыўнага вопыту — камунікатыўныя збоі (8 даследаванняў): чат-бот не разумеў кантэкст, даваў нерэлевантныя або шаблонныя адказы. Даследаванні карыстальніцкага вопыту пацвярджаюць: якасць дыялогу — крытычны фактар поспеху ШІ-тэрапіі (Song et al., 2024). Менавіта здольнасць падтрымаць сапраўдную размову, а не выдаць загатаваную фразу, вызначае, ці застанецца чалавек у тэрапіі.

Праблема бяспекі: больш за палову сістэм без абароны

Трывожная знаходка: толькі 15 з 35 вывучаных сістэм (43%) паведамілі пра наяўнасць мер бяспекі. З іх:

Аўтаматычнае распазнаванне крызісу: 10 сістэм
Доступ да жывога спецыяліста: 3 сістэмы
Ацэнка пабочных эфектаў: 3 сістэмы

Гэта азначае, што больш за палову сістэм працавалі без механізмаў выяўлення суіцыдальных думак, без эскалацыі да чалавека і без маніторынгу непажаданых рэакцый. Для клінічнага прымянення такі падыход непрымальны: выкарыстанне LLM без спецыяльных механізмаў абароны стварае рэальныя рызыкі (De Choudhury et al., 2023).

Абмежаванні мэта-аналізу: што яшчэ не даказана

Аўтары агляду сумленна паказваюць на істотныя абмежаванні:

Высокая гетэрагеннасць (I² = 95,3%) — даследаванні моцна адрозніваюцца па дызайне, папуляцыях і інструментах вымярэння
Мала даных пра доўгатэрміновыя эфекты — толькі 6 з 35 даследаванняў адсочвалі вынік пасля заканчэння інтэрвенцыі
Моўнае абмежаванне — аналізаваліся толькі англамоўныя публікацыі
Мала генератыўных сістэм — 5 з 35, што абмяжоўвае высновы пра LLM
Рызыка прадузятасці — толькі 2 з 15 РКВ атрымалі нізкую рызыку bias паводле шкалы Cochrane

Тым не менш гэта найбольш поўны і актуальны агляд доказнай базы ШІ-чат-ботаў для псіхічнага здароўя, апублікаваны ў рэцэнзаваным часопісе Q1 з 248 цытаваннямі.

Што гэта значыць на практыцы

Мэта-аналіз пацвярджае: ШІ-чат-боты — не замена псіхатэрапеўту, але значны інструмент падтрымкі. Найбольш эфектыўныя:

Генератыўныя мадэлі (а не скрыптавыя)
Мабільныя дадаткі (а не вэб-версіі)
Сістэмы на аснове КПТ для людзей з рэальнымі сімптомамі
Платформы з убудаванымі механізмамі бяспекі

Менавіта такі падыход рэалізаваны ў «Рядом»: генератыўны ШІ на аснове КПТ-пратаколаў з мультыагентнай архітэктурай, механізмамі распазнавання крызісу і мабільным фарматам. Не «яшчэ адзін ChatGPT», а спецыялізаваная сістэма, спраектаваная з улікам таго, што паказала навука.

Частыя пытанні

Ці сапраўды ШІ-чат-бот можа дапамагчы пры дэпрэсіі?

Так. Мэта-аналіз 15 РКВ паказаў статыстычна значнае зніжэнне сімптомаў дэпрэсіі (Hedges' g = 0,64). Эфект супастаўны з некаторымі традыцыйнымі псіхатэрапеўтычнымі інтэрвенцыямі, хоць прамое параўнанне з вочнай тэрапіяй у гэтым аглядзе не праводзілася.

Які тып ШІ-чат-бота найбольш эфектыўны?

Генератыўныя мадэлі (GPT, BERT) паказалі памер эфекту ў 2,4 разы большы, чым скрыптавыя сістэмы. Мабільныя дадаткі эфектыўнейшыя за вэб-версіі. Мультымадальныя сістэмы (тэкст + голас) пераўзыходзяць чыста тэкставыя.

Ці бяспечныя ШІ-чат-боты для псіхічнага здароўя?

Не ўсе. Толькі 43% даследаваных сістэм мелі ўбудаваныя механізмы бяспекі. Пры выбары платформы важна пераканацца, што яна распазнае крызісныя сітуацыі, можа перанакіраваць да спецыяліста і маніторыць пабочныя эфекты.

Ці можа ШІ-чат-бот замяніць псіхатэрапеўта?

Не. Аўтары мэта-аналізу падкрэсліваюць: ШІ-чат-боты не прызначаны для замены прафесійнай дапамогі. Яны працуюць як дадатковы інструмент — даступны кругласутачна, без стыгмы і чэргаў.

Ці дапамагае ШІ-чат-бот пры трывожнасці?

Пакуль пераканаўчых даных няма. Мэта-аналіз не выявіў статыстычна значнага эфекту для трывожнасці (g = 0,65, ДІ: −0,46–1,77). Вынік можа быць звязаны з малой колькасцю даследаванняў і высокай гетэрагеннасцю. Патрэбны дадатковыя РКВ.

Крыніцы

Li, H., Zhang, R., Lee, Y.-C., Kraut, R. E., & Mohr, D. C. (2023). Systematic review and meta-analysis of AI-based conversational agents for promoting mental health and well-being. NPJ Digital Medicine, 6(1), 236. https://doi.org/10.1038/s41746-023-00979-5

Vaidyam, A. N., Wisniewski, H., Halamka, J. D., Kashavan, M. S., & Torous, J. B. (2019). Chatbots and conversational agents in mental health: A review of the psychiatric landscape. The Canadian Journal of Psychiatry, 64(7), 456–464. https://doi.org/10.1177/0706743719828977

Sharma, A., et al. (2023). Human-centered evaluation of generative AI-based therapy chatbot. NEJM AI, 1(2). https://doi.org/10.1056/AIoa2300127

Song, I., Pendse, S. R., Kumar, N., & De Choudhury, M. (2024). The typing cure: Experiences with large language model chatbots for mental health support. Proceedings of the ACM on Human-Computer Interaction. https://doi.org/10.1145/3757430

De Choudhury, M., Pendse, S. R., & Kumar, N. (2023). Benefits and harms of large language models in digital mental health. ArXiv. https://doi.org/10.48550/arxiv.2311.14693

Li, J., Li, Y., Hu, Y., Ma, D. C. F., Mei, X., Chan, E. A., & Yorke, J. (2025). Chatbot-delivered interventions for improving mental health among young people: A systematic review and meta-analysis. Worldviews on Evidence-Based Nursing. https://doi.org/10.1111/wvn.70059