Скрыптовыя чат-боты лепшыя за LLM пры дэпрэсіі? Мета-аналіз 2025
Мета-аналіз 2025 года выявіў парадокс: скрыптовыя чат-боты з жорсткімі сцэнарыямі ўмерана зніжаюць сімптомы дэпрэсіі, а чат-боты на вялікіх моўных мадэлях — не. Сістэматычны агляд Du et al. (2025) прааналізаваў рандамізаваныя клінічныя выпрабаванні абодвух тыпаў сістэм і прыйшоў да высновы, якая ставіць пад пытанне наратыў пра перавагу генератыўнага ІІ ў тэрапіі.
Што менавіта паказаў мета-аналіз?
Каманда даследчыкаў пад кіраўніцтвам Qiuxue Du правяла сістэматычны агляд і мета-аналіз РКВ, якія параўноўваюць два тыпы чат-ботаў для людзей з сімптомамі дэпрэсіі і трывожнасці (Du et al., 2025). Яны падзялілі сістэмы на дзве катэгорыі: rule-based (скрыптовыя, якія працуюць па загадзя прапісаных алгарытмах) і LLM-based (пабудаваныя на вялікіх моўных мадэлях).
Галоўны вынік: скрыптовыя чат-боты прадэманстравалі сціплае, але статыстычна значнае паляпшэнне дэпрэсіўных сімптомаў. LLM-чат-боты значнага эфекту не паказалі.
Гэта контрінтуітыўны вынік. Моўныя мадэлі генеруюць больш натуральныя адказы, лепш разумеюць кантэкст, здольныя праяўляць эмпатыю, блізкую да чалавечай (Karki et al., 2025). Як сістэма, якая адказвае загатаванымі фразамі, можа працаваць лепш?
Чаму скрыптовыя чат-боты «перамаглі»?
Адказ не ў тым, што скрыпты лепшыя за ІІ. Адказ — у доказнай базе.
Дзесяцігоддзе клінічных даных. Скрыптовыя сістэмы накшталт Woebot і Wysa існуюць з 2017 года. За гэты час яны прайшлі дзясяткі рандамізаваных выпрабаванняў з буйнымі выбаркамі і працяглым назіраннем. Яшчэ ў 2019 годзе агляд Vaidyam et al. зафіксаваў расце доказнай базы для скрыптовых чат-ботаў у псіхіятрыі — задоўга да эпохі ChatGPT (Vaidyam et al., 2019).
Тэрапеўтычныя пратаколы. Woebot строга прытрымліваецца кагнітыўна-паводніцкай тэрапіі. Кожны дыялог — гэта структураваная сесія з канкрэтнай мэтай: выявіць аўтаматычную думку, правесці кагнітыўную рэструктурызацыю, прызначыць паводніцкі эксперымент. Скрыпт не можа адхіліцца ад пратаколу — і гэта яго перавага.
Адзінкі РКВ для LLM. Вялікія моўныя мадэлі сталі даступнымі для тэрапеўтычных прыкладанняў толькі ў 2023–2024 гадах. Колькасць завершаных РКВ для LLM-чат-ботаў вымяраецца адзінкамі. Мета-аналіз, які аб'ядноўвае тры-чатыры невялікія выпрабаванні, не можа паказаць статыстычную значнасць — яму проста не хапае магутнасці.
Што не так з раннімі LLM-даследаваннямі?
Праблема не толькі ў колькасці выпрабаванняў. Раннія LLM-чат-боты для ментальнага здароўя часта распрацоўваліся без тэрапеўтычнай структуры.
Тыповы сцэнарый 2023 года: даследчыкі бяруць GPT-3.5 або GPT-4, пішуць сістэмны промпт «ты — эмпатычны псіхолаг», і выпускаюць карыстальнікаў у свабодны дыялог. Такі чат-бот можа суцешыць, выслухаць, падабраць правільныя словы. Але ён не вядзе чалавека па тэрапеўтычным маршруце. Ён рэактыўны — адказвае на тое, што кажа карыстальнік, замест таго каб накіроўваць размову да канкрэтных тэрапеўтычных мэтаў.
Ma et al. (2023) апісалі гэты фундаментальны выклік: LLM-агенты валодаюць уражлівымі моўнымі здольнасцямі, але без дадатковай архітэктуры ім не хапае структураванага клінічнага разважання (Ma et al., 2023). Агляд Pavlopoulos et al. (2024) пацвердзіў: сярод ІІ-інструментаў для дэпрэсіі і трывожнасці найбольшы эфект паказваюць тыя, што ўбудаваны ў доказныя тэрапеўтычныя фрэймворкі (Pavlopoulos et al., 2024).
Kuhlmeier et al. (2025) правялі эксперымент з LLM-чат-ботам для паводніцкай актывацыі і выявілі характэрную супярэчнасць: мадэль можа выконваць тэрапеўтычныя пратаколы з высокай дакладнасцю, але «надзейнае клінічнае разважанне застаецца адкрытай задачай» (Kuhlmeier et al., 2025).
Кантэкст: іншыя мета-аналізы не згодныя
Выснова Du et al. не існуе ў вакууме. Найбуйнейшы мета-аналіз Li et al. (2023) — 35 даследаванняў, больш за 17 000 удзельнікаў — паказаў значнае зніжэнне дэпрэсіі для ІІ-чат-ботаў у цэлым: Hedges' g = 0,64 (Li et al., 2023). Але гэты агляд не падзяляў скрыптовыя і LLM-сістэмы на падгрупы так, як гэта зрабілі Du et al.
Больш за тое, Li et al. выявілі, што генератыўныя мадэлі пераўзыходзілі скрыптовыя ў 2,4 разы па памеры эфекту (g = 1,24 vs g = 0,52). Праўда, генератыўных сістэм у выбарцы было ўсяго пяць — і частка з іх была навучана на тэрапеўтычных даных, а не проста ўяўляла сабой «голы» LLM.
Асобныя клінічныя выпрабаванні таксама даюць падставы для аптымізму. Therabot — LLM-чат-бот, пабудаваны на GPT-4 з тэрапеўтычнай структурай, — прадэманстраваў зніжэнне дэпрэсіі на 51% у пілотным РКВ (Sharma et al., 2023). Параўнанне ІІ-тэрапеўта з жывым спецыялістам у паводніцкай актывацыі паказала супастаўную эфектыўнасць (Napiwotzki et al., 2025).
Мета-аналіз Li et al. (2025) пацвердзіў: чат-боты — уключаючы і LLM-сістэмы — значна зніжаюць псіхалагічны дыстрэс у моладзі (Li et al., 2025).
Не «скрыпты vs LLM», а «структура vs хаос»
Калі сабраць усе даныя разам, карціна праясняецца. Падзел праходзіць не па лініі «скрыптовы vs моўная мадэль». Ён праходзіць па лініі «структураваная тэрапія vs неструктураваная размова».
Скрыптовыя чат-боты перамагаюць не таму, што скрыпты лепшыя. Яны перамагаюць таму, што кожны скрыптовы чат-бот па вызначэнні структураваны. У яго няма выбару — ён прытрымліваецца пратаколу. А раннія LLM-чат-боты часта не мелі ніякага пратаколу.
Новае пакаленне LLM-сістэм ужо выпраўляе гэтую праблему. SuDoSys (Chen et al., 2024) — прыклад структураванага падыходу: сістэма выкарыстоўвае кіраўніцтвы СГА па псіхалагічнай першай дапамозе (PM+) як каркас для LLM-дыялогу. Мадэль не проста размаўляе — яна вядзе карыстальніка праз канкрэтныя тэрапеўтычныя тэхнікі, вызначаныя пратаколам (Chen et al., 2024).
Kuhlmeier et al. (2025) паказалі аналагічны падыход: LLM-чат-бот для паводніцкай актывацыі, які прытрымліваецца пратаколу пакрокава. Дакладнасць выканання пратаколу — высокая. Гэта прынцыпова іншая архітэктура, чым «пагавары з ChatGPT пра свае праблемы».
Абмежаванні мета-аналізу Du et al.
Некалькі важных агаворак да вынікаў:
Асіметрыя выбаркі. Скрыптовыя чат-боты прадстаўлены дзясяткамі РКВ з тысячамі ўдзельнікаў. LLM-чат-боты — адзінкавымі выпрабаваннямі з малымі выбаркамі. Параўнанне нераўназначных груп у мета-аналізе можа сістэматычна заніжаць эфект менш вывучанай групы.
Гетэрагеннасць LLM-сістэм. Пад «LLM-чат-ботамі» аб'яднаны зусім розныя сістэмы: ад нетрэніраванага ChatGPT з промптам да спецыялізаваных тэрапеўтычных платформ. Памер мадэлі таксама мае значэнне — кампактныя мадэлі, навучаныя на тэрапеўтычных даных, могуць пераўзыходзіць універсальных гігантаў. Аб'ядноўваць іх у адну групу — усё роўна што параўноўваць «лекі» як адзіную катэгорыю, не адрозніваючы аспірын і антыдэпрэсанты.
Адсутнасць доўгатэрміновых даных. Большасць LLM-даследаванняў доўжыліся 2–4 тыдні. Для ацэнкі тэрапеўтычнага эфекту гэта недастатковы тэрмін — КПТ звычайна патрабуе 8–12 тыдняў.
Хуткае ўстарэнне. Мета-аналіз фіксуе стан доказнай базы на момант пошуку літаратуры. Улічваючы хуткасць развіцця LLM-тэрапіі, вынікі 2025 года могуць не адлюстроўваць магчымасці сістэм 2026-га.
Што гэта значыць на практыцы?
Выснова Du et al. — не прысуд LLM-тэрапіі. Гэта ўказанне на канкрэтную праблему: моўная мадэль без тэрапеўтычнай структуры — гэта размова, а не тэрапія.
Эфектыўны ІІ-тэрапеўт будучыні — гэта не выбар паміж скрыптам і LLM. Гэта LLM, убудаваная ў тэрапеўтычны пратакол. Моўная мадэль забяспечвае гнуткасць, эмпатыю, натуральнасць дыялогу. Пратакол забяспечвае кірунак, паслядоўнасць, тэрапеўтычную мэту кожнай сесіі.
Менавіта па гэтым прынцыпе пабудавана платформа Рядом: LLM-ядро працуе ўнутры структураваных пратаколаў КПТ, а мультыагентная архітэктура раздзяляе эмпатычны дыялог і клінічнае разважанне. Такі падыход аб'ядноўвае моцныя бакі абодвух тыпаў сістэм — гнуткасць моўных мадэляў і даказаную эфектыўнасць тэрапеўтычных пратаколаў.
Частыя пытанні
Ці праўда, што звычайныя чат-боты дапамагаюць пры дэпрэсіі лепш, чым ChatGPT?
Мета-аналіз Du et al. (2025) паказаў сціплы эфект скрыптовых чат-ботаў і адсутнасць значнага эфекту LLM-чат-ботаў. Але гэта адлюстроўвае не перавагу скрыптаў, а розніцу ў доказнай базе: у скрыптовых сістэм — дзесяцігоддзе РКВ, у LLM — адзінкавыя выпрабаванні.
Ці дапамагаюць ІІ-чат-боты пры трывожнасці?
Даныя неадназначныя. Li et al. (2023) не выявілі значнага эфекту ІІ-чат-ботаў на трывожнасць (g = 0,65, давераны інтэрвал перасякае нуль). Аднак асобныя даследаванні, уключаючы Napiwotzki et al. (2025), паказваюць зніжэнне трывожных сімптомаў пры структураваных LLM-інтэрвенцыях.
Чаму структура тэрапеўтычнага пратаколу такая важная для чат-бота?
Скрыптовыя чат-боты па вызначэнні прытрымліваюцца пратаколу — кожны крок прапісаны загадзя. LLM без структуры вядзе свабодную размову, што бліжэй да эмацыйнай падтрымкі, чым да тэрапіі. Даследаванні Kuhlmeier et al. (2025) і Chen et al. (2024) паказваюць, што LLM можа выконваць тэрапеўтычныя пратаколы з высокай дакладнасцю, калі структура зададзена яўна.
Ці варта выкарыстоўваць чат-бот замест псіхатэрапеўта?
Чат-бот — не замена спецыялісту. Мета-аналіз Li et al. (2023) паказаў эфект g = 0,64 для дэпрэсіі — гэта значна, але менш, чым у традыцыйнай КПТ з тэрапеўтам. Чат-бот карысны як інструмент самадапамогі паміж сесіямі, для людзей у чарзе да спецыяліста або тых, хто пакуль не гатовы звярнуцца па дапамогу асабіста (Karki et al., 2025).
Крыніцы
Chen, Y., Zhang, X., Wang, J., Xie, X., Yan, N., Chen, H., & Wang, L. (2024). Structured dialogue system for mental health: An LLM chatbot leveraging the PM+ guidelines. ArXiv. https://doi.org/10.48550/arxiv.2411.10681
Du, Q., Ren, Y., Meng, Z., He, H., & Meng, S. (2025). The efficacy of rule-based versus large language model-based chatbots in alleviating symptoms of depression and anxiety: Systematic review and meta-analysis.
Karki, A., Kamble, C., Chavan, R., & Chapke, N. (2025). Mental health meets machine learning: The rise of chatbots and LLMs in therapy. International Journal for Research Trends and Innovation, 10(5). https://doi.org/10.56975/ijrti.v10i5.203281
Kuhlmeier, F., Hanschmann, L., Rabe, M., Luettke, S., Brakemeier, E.-L., & Maedche, A. (2025). Designing an LLM-based behavioral activation chatbot for young people with depression: Insights from an evaluation with artificial users and clinical experts.
Li, H., Zhang, R., Lee, Y.-C., Kraut, R. E., & Mohr, D. C. (2023). Systematic review and meta-analysis of AI-based conversational agents for promoting mental health and well-being. NPJ Digital Medicine, 6(1), 236. https://doi.org/10.1038/s41746-023-00979-5
Li, Y., et al. (2025). Chatbot interventions for young people: A meta-analysis. Worldviews on Evidence-Based Nursing.
Ma, Z., Mei, Y., & Su, Z. (2023). Understanding the benefits and challenges of using large language model-based conversational agents for mental well-being support. AMIA Annual Symposium Proceedings. https://doi.org/10.48550/arxiv.2307.15810
Napiwotzki, L., et al. (2025). AI versus human therapist in depression: A behavioral activation comparison. Journal of Medical Internet Research.
Pavlopoulos, A., Rachiotis, T., & Maglogiannis, I. (2024). An overview of tools and technologies for anxiety and depression management using AI. Applied Sciences, 14(19), 9068. https://doi.org/10.3390/app14199068
Sharma, A., et al. (2023). Human-centered evaluation of generative AI-based therapy chatbot. NEJM AI, 1(2). https://doi.org/10.1056/AIoa2300127
Vaidyam, A. N., Wisniewski, H., Halamka, J. D., Kashavan, M. S., & Torous, J. B. (2019). Chatbots and conversational agents in mental health: A review of the psychiatric landscape. The Canadian Journal of Psychiatry, 64(7), 456–464.