Ці працуе ШІ-псіхолаг? Мэта-аналіз 35 даследаванняў дае адказ
Мэта-аналіз 35 даследаванняў з удзелам больш за 17 000 чалавек паказаў: ШІ-чат-боты значна зніжаюць сімптомы дэпрэсіі (Hedges' g = 0,64) і псіхалагічнага дыстрэсу (g = 0,70). Генератыўныя мадэлі аказаліся ў 2,4 разы эфектыўнейшымі за скрыптавыя сістэмы. Ніжэй — разбор даных, ключавых высноў і абмежаванняў найбуйнейшага на сёння агляду доказнай базы ШІ-тэрапіі.
Што за мэта-аналіз і чаму ён важны?
У 2023 годзе каманда даследчыкаў з Сінгапурскага нацыянальнага ўніверсітэта і Паўночна-Заходняга ўніверсітэта (ЗША) апублікавала сістэматычны агляд і мэта-аналіз у NPJ Digital Medicine — часопісе першага квартылю па лічбавай медыцыне (Li et al., 2023). На момант публікацыі гэта самы маштабны аналіз ШІ-чат-ботаў для псіхічнага здароўя.
Аўтары прааналізавалі 12 баз даных навуковых публікацый, адабралі 35 эксперыментальных даследаванняў (з іх 15 рандамізаваных клінічных выпрабаванняў) і абагульнілі даныя пра 17 123 удзельнікі з 15 краін. У агляд увайшлі 23 розныя сістэмы: ад добра вядомых Woebot і Wysa да менш распаўсюджаных Tess, Elomia, XiaoE і VRECC.
Папярэднія агляды (Vaidyam et al., 2019) пераважна ахоплівалі скрыптавыя чат-боты з наканаванымі сцэнарыямі. Гэты мэта-аналіз упершыню вылучыў і параўнаў менавіта ШІ-сістэмы — з апрацоўкай натуральнай мовы і генератыўнымі мадэлямі.
Ці зніжае ШІ-чат-бот сімптомы дэпрэсіі?
Так. Мэта-аналіз 13 РКВ (1 744 удзельнікі) паказаў статыстычна значнае зніжэнне псіхалагічнага дыстрэсу: Hedges' g = 0,70 (95% ДІ: 0,18–1,22). Па асобных вымярэннях:
- Дэпрэсія: g = 0,64 (95% ДІ: 0,17–1,12) — значнае зніжэнне
- Трывожнасць: g = 0,65 (95% ДІ: −0,46–1,77) — не значна
- Агульны дабрабыт: g = 0,32 (95% ДІ: −0,13–0,78) — не значна
Памер эфекту g = 0,64 лічыцца сярэднім паводле шкалы Коэна. Гэта супастаўна з эфектам шэрагу традыцыйных псіхатэрапеўтычных інтэрвенцый. Папярэднія мэта-аналізы скрыптавых чат-ботаў паказвалі больш сціплыя вынікі — g ад 0,24 да 0,47 (Vaidyam et al., 2019).
Агульны псіхалагічны дабрабыт не палепшыўся. Аўтары тлумачаць гэта тым, што паказчыкі дабрабыту больш стабільныя ў часе і менш адчувальныя да кароткатэрміновых інтэрвенцый. Акрамя таго, у гэтую катэгорыю ўвайшло толькі 8 РКВ — статыстычнай магутнасці магло не хапіць.
Генератыўны ШІ супраць скрыптавых чат-ботаў: 2,4-кратная розніца
Самы прыкметны вынік — розніца паміж тыпамі ШІ. Генератыўныя мадэлі (GPT, BERT) паказалі памер эфекту g = 1,24, тады як скрыптавыя (retrieval-based) сістэмы — g = 0,52. Розніца статыстычна значная (F = 4,88, p = 0,019).
Генератыўныя мадэлі не ідуць па гатовых сцэнарыях, а ствараюць адказы «з нуля», адаптуючыся да кантэксту размовы. Гэта дазваляе ім дакладней рэагаваць на эмацыйны стан, фармуляваць персаналізаваныя рэкамендацыі і падтрымліваць больш натуральны дыялог.
З 35 вывучаных сістэм толькі 5 (14,3%) выкарыстоўвалі генератыўны падыход, але менавіта яны далі найбольшы тэрапеўтычны эфект. Адна з такіх сістэм — Therabot, якая паказала зніжэнне дэпрэсіі на 51% у асобным клінічным выпрабаванні (Sharma et al., 2023). З 2023 года доля генератыўных сістэм імкліва расце: новыя платформы ўсё часцей будуюцца на вялікіх моўных мадэлях.
Каму ШІ-тэрапія дапамагае найбольш?
Субгрупавы аналіз выявіў некалькі значных мадэратараў эфектыўнасці:
Па стане здароўя. Людзі з клінічнымі або субклінічнымі сімптомамі (g = 1,07) атрымалі ў 10 разоў больш карысці, чым здаровыя ўдзельнікі (g = 0,11). Гэта ўзгадняецца з агульным прынцыпам: псіхалагічныя інтэрвенцыі найбольш эфектыўныя для тых, хто сапраўды мае патрэбу ў дапамозе (F = 7,15, p = 0,005).
Па платформе. Мабільныя дадаткі (g = 0,96) і месенджары (g = 0,75) значна пераўзыходзілі вэб-версіі (g = −0,08). Смартфон застаецца асноўным каналам доступу да ШІ-тэрапіі (F = 3,26, p = 0,046).
Па мадальнасці. Мультымадальныя сістэмы — тэкст, голас, візуальныя элементы — (g = 0,83) некалькі пераўзыходзілі чыста тэкставыя (g = 0,67). Галасавы кампанент узмацняе адчуванне сацыяльнай прысутнасці.
Па ўзросце. Дарослыя сярэдняга і старэйшага ўзросту (g = 0,85) атрымалі больш карысці, чым моладзь (g = 0,64). Пол не ўплываў на вынік. Асобны мэта-аналіз 2025 года пацвердзіў, што чат-боты зніжаюць дыстрэс і ў моладзі, хоць і з меншым эфектам (Li et al., 2025).
Што карыстальнікі цэняць у ШІ-тэрапеўце?
16 з 35 даследаванняў збіралі якасную зваротную сувязь ад удзельнікаў. Ключавыя фактары пазітыўнага вопыту:
- Тэрапеўтычны альянс (8 даследаванняў): эмпатычныя зносіны, безацэначнасць, рэгулярныя чэк-іны, чалавекападобная асоба
- Змест (6 даследаванняў): канкрэтныя тэрапеўтычныя тэхнікі, багацце кантэнту, дапамога ў навучанні навыкам
- Даступнасць (2 даследаванні): падтрымка ў любы час сутак, без чэргаў і стыгмы
Галоўная прычына негатыўнага вопыту — камунікатыўныя збоі (8 даследаванняў): чат-бот не разумеў кантэкст, даваў нерэлевантныя або шаблонныя адказы. Даследаванні карыстальніцкага вопыту пацвярджаюць: якасць дыялогу — крытычны фактар поспеху ШІ-тэрапіі (Song et al., 2024). Менавіта здольнасць падтрымаць сапраўдную размову, а не выдаць загатаваную фразу, вызначае, ці застанецца чалавек у тэрапіі.
Праблема бяспекі: больш за палову сістэм без абароны
Трывожная знаходка: толькі 15 з 35 вывучаных сістэм (43%) паведамілі пра наяўнасць мер бяспекі. З іх:
- Аўтаматычнае распазнаванне крызісу: 10 сістэм
- Доступ да жывога спецыяліста: 3 сістэмы
- Ацэнка пабочных эфектаў: 3 сістэмы
Гэта азначае, што больш за палову сістэм працавалі без механізмаў выяўлення суіцыдальных думак, без эскалацыі да чалавека і без маніторынгу непажаданых рэакцый. Для клінічнага прымянення такі падыход непрымальны: выкарыстанне LLM без спецыяльных механізмаў абароны стварае рэальныя рызыкі (De Choudhury et al., 2023).
Абмежаванні мэта-аналізу: што яшчэ не даказана
Аўтары агляду сумленна паказваюць на істотныя абмежаванні:
- Высокая гетэрагеннасць (I² = 95,3%) — даследаванні моцна адрозніваюцца па дызайне, папуляцыях і інструментах вымярэння
- Мала даных пра доўгатэрміновыя эфекты — толькі 6 з 35 даследаванняў адсочвалі вынік пасля заканчэння інтэрвенцыі
- Моўнае абмежаванне — аналізаваліся толькі англамоўныя публікацыі
- Мала генератыўных сістэм — 5 з 35, што абмяжоўвае высновы пра LLM
- Рызыка прадузятасці — толькі 2 з 15 РКВ атрымалі нізкую рызыку bias паводле шкалы Cochrane
Тым не менш гэта найбольш поўны і актуальны агляд доказнай базы ШІ-чат-ботаў для псіхічнага здароўя, апублікаваны ў рэцэнзаваным часопісе Q1 з 248 цытаваннямі.
Што гэта значыць на практыцы
Мэта-аналіз пацвярджае: ШІ-чат-боты — не замена псіхатэрапеўту, але значны інструмент падтрымкі. Найбольш эфектыўныя:
- Генератыўныя мадэлі (а не скрыптавыя)
- Мабільныя дадаткі (а не вэб-версіі)
- Сістэмы на аснове КПТ для людзей з рэальнымі сімптомамі
- Платформы з убудаванымі механізмамі бяспекі
Менавіта такі падыход рэалізаваны ў «Рядом»: генератыўны ШІ на аснове КПТ-пратаколаў з мультыагентнай архітэктурай, механізмамі распазнавання крызісу і мабільным фарматам. Не «яшчэ адзін ChatGPT», а спецыялізаваная сістэма, спраектаваная з улікам таго, што паказала навука.
Частыя пытанні
Ці сапраўды ШІ-чат-бот можа дапамагчы пры дэпрэсіі?
Так. Мэта-аналіз 15 РКВ паказаў статыстычна значнае зніжэнне сімптомаў дэпрэсіі (Hedges' g = 0,64). Эфект супастаўны з некаторымі традыцыйнымі псіхатэрапеўтычнымі інтэрвенцыямі, хоць прамое параўнанне з вочнай тэрапіяй у гэтым аглядзе не праводзілася.
Які тып ШІ-чат-бота найбольш эфектыўны?
Генератыўныя мадэлі (GPT, BERT) паказалі памер эфекту ў 2,4 разы большы, чым скрыптавыя сістэмы. Мабільныя дадаткі эфектыўнейшыя за вэб-версіі. Мультымадальныя сістэмы (тэкст + голас) пераўзыходзяць чыста тэкставыя.
Ці бяспечныя ШІ-чат-боты для псіхічнага здароўя?
Не ўсе. Толькі 43% даследаваных сістэм мелі ўбудаваныя механізмы бяспекі. Пры выбары платформы важна пераканацца, што яна распазнае крызісныя сітуацыі, можа перанакіраваць да спецыяліста і маніторыць пабочныя эфекты.
Ці можа ШІ-чат-бот замяніць псіхатэрапеўта?
Не. Аўтары мэта-аналізу падкрэсліваюць: ШІ-чат-боты не прызначаны для замены прафесійнай дапамогі. Яны працуюць як дадатковы інструмент — даступны кругласутачна, без стыгмы і чэргаў.
Ці дапамагае ШІ-чат-бот пры трывожнасці?
Пакуль пераканаўчых даных няма. Мэта-аналіз не выявіў статыстычна значнага эфекту для трывожнасці (g = 0,65, ДІ: −0,46–1,77). Вынік можа быць звязаны з малой колькасцю даследаванняў і высокай гетэрагеннасцю. Патрэбны дадатковыя РКВ.
Крыніцы
Li, H., Zhang, R., Lee, Y.-C., Kraut, R. E., & Mohr, D. C. (2023). Systematic review and meta-analysis of AI-based conversational agents for promoting mental health and well-being. NPJ Digital Medicine, 6(1), 236. https://doi.org/10.1038/s41746-023-00979-5
Vaidyam, A. N., Wisniewski, H., Halamka, J. D., Kashavan, M. S., & Torous, J. B. (2019). Chatbots and conversational agents in mental health: A review of the psychiatric landscape. The Canadian Journal of Psychiatry, 64(7), 456–464. https://doi.org/10.1177/0706743719828977
Sharma, A., et al. (2023). Human-centered evaluation of generative AI-based therapy chatbot. NEJM AI, 1(2). https://doi.org/10.1056/AIoa2300127
Song, I., Pendse, S. R., Kumar, N., & De Choudhury, M. (2024). The typing cure: Experiences with large language model chatbots for mental health support. Proceedings of the ACM on Human-Computer Interaction. https://doi.org/10.1145/3757430
De Choudhury, M., Pendse, S. R., & Kumar, N. (2023). Benefits and harms of large language models in digital mental health. ArXiv. https://doi.org/10.48550/arxiv.2311.14693
Li, J., Li, Y., Hu, Y., Ma, D. C. F., Mei, X., Chan, E. A., & Yorke, J. (2025). Chatbot-delivered interventions for improving mental health among young people: A systematic review and meta-analysis. Worldviews on Evidence-Based Nursing. https://doi.org/10.1111/wvn.70059