Сценарийлік чатботтар депрессияда LLM-ден жақсы ма? 2025 жылғы мета-талдау
2025 жылғы мета-талдау парадокс анықтады: қатаң сценарийлері бар сценарийлік чатботтар депрессия белгілерін орташа деңгейде азайтады, ал үлкен тілдік модельдерге негізделген чатботтар — жоқ. Du et al. (2025) жүйелі шолуы екі типтегі жүйелердің рандомизацияланған клиникалық сынақтарын талдап, генеративті ЖИ-дің терапиядағы басымдығы туралы нарративті күмәнге алатын қорытындыға келді.
Мета-талдау нақты нені көрсетті?
Qiuxue Du басшылығындағы зерттеушілер тобы депрессия мен мазасыздық белгілері бар адамдарға арналған екі типтегі чатботтарды салыстыратын РКС-тердің жүйелі шолуы мен мета-талдауын жүргізді (Du et al., 2025). Олар жүйелерді екі категорияға бөлді: rule-based (алдын ала жазылған алгоритмдер бойынша жұмыс істейтін сценарийлік) және LLM-based (үлкен тілдік модельдерге негізделген).
Негізгі нәтиже: сценарийлік чатботтар депрессия белгілерінің шамалы, бірақ статистикалық маңызды жақсаруын көрсетті. LLM-чатботтар маңызды әсер көрсетпеді.
Бұл интуицияға қайшы нәтиже. Тілдік модельдер табиғи жауаптар генерациялайды, контекстті жақсы түсінеді, адамға жақын эмпатия көрсете алады (Karki et al., 2025). Дайын сөз тіркестерімен жауап беретін жүйе қалай жақсырақ жұмыс істей алады?
Неге сценарийлік чатботтар «жеңді»?
Жауап сценарийлер ЖИ-ден жақсы екенінде емес. Жауап — дәлелдемелік базада.
Он жылдық клиникалық деректер. Woebot пен Wysa сияқты сценарийлік жүйелер 2017 жылдан бері бар. Осы уақыт ішінде олар ірі іріктемелермен және ұзақ мерзімді бақылаумен ондаған рандомизацияланған сынақтардан өтті. 2019 жылы Vaidyam et al. шолуы сценарийлік чатботтардың психиатриядағы дәлелдемелік базасының өсуін тіркеген — ChatGPT дәуірінен әлдеқайда бұрын (Vaidyam et al., 2019).
Терапиялық хаттамалар. Woebot когнитивті-мінез-құлықтық терапияны қатаң ұстанады. Әр диалог — нақты мақсаты бар құрылымдалған сеанс: автоматты ойды анықтау, когнитивті қайта құрылымдау жүргізу, мінез-құлықтық эксперимент тағайындау. Сценарий хаттамадан ауытқа алмайды — және бұл оның артықшылығы.
LLM үшін бірлі-жарым РКС. Үлкен тілдік модельдер терапиялық қосымшалар үшін тек 2023–2024 жылдары қолжетімді болды. LLM-чатботтар үшін аяқталған РКС саны бірлікпен есептеледі. Үш-төрт шағын сынақты біріктіретін мета-талдау статистикалық маңыздылықты көрсете алмайды — оған жеткілікті қуат жоқ.
Ерте LLM-зерттеулерде мәселе неде?
Мәселе тек сынақтар санында емес. Ментальді денсаулыққа арналған алғашқы LLM-чатботтар көбінесе терапиялық құрылымсыз жасалған.
2023 жылдың типтік сценарийі: зерттеушілер GPT-3.5 немесе GPT-4 алады, «сен — эмпатиялық психологсың» деген жүйелік промпт жазады және пайдаланушыларды еркін диалогқа шығарады. Мұндай чатбот жұбату, тыңдау, дұрыс сөз табу мүмкін. Бірақ ол адамды терапиялық маршрутпен жүргізбейді. Ол реактивті — пайдаланушы айтқанға жауап береді, сөйлесуді нақты терапиялық мақсаттарға бағыттаудың орнына.
Ma et al. (2023) бұл іргелі мәселені сипаттады: LLM-агенттер керемет тілдік қабілеттерге ие, бірақ қосымша архитектурасыз құрылымдалған клиникалық ойлау жетіспейді (Ma et al., 2023). Pavlopoulos et al. (2024) шолуы растады: депрессия мен мазасыздыққа арналған ЖИ-құралдары ішінде ең жоғары әсер дәлелдемеге негізделген терапиялық фреймворктерге кіріктірілгендерде байқалады (Pavlopoulos et al., 2024).
Kuhlmeier et al. (2025) мінез-құлықтық белсендіруге арналған LLM-чатботпен эксперимент жүргізіп, тән қайшылықты анықтады: модель терапиялық хаттамаларды жоғары дәлдікпен орындай алады, бірақ «сенімді клиникалық ойлау ашық міндет болып қалады» (Kuhlmeier et al., 2025).
Контекст: басқа мета-талдаулар келіспейді
Du et al. қорытындысы вакуумда жоқ. Li et al. (2023) ірі мета-талдауы — 35 зерттеу, 17 000-нан астам қатысушы — ЖИ-чатботтар үшін жалпы алғанда депрессияның маңызды төмендеуін көрсетті: Hedges' g = 0,64 (Li et al., 2023). Бірақ бұл шолу сценарийлік пен LLM-жүйелерді Du et al. сияқты бөлек топтарға бөлмеген.
Оған қоса, Li et al. генеративті модельдер сценарийліктерді әсер мөлшері бойынша 2,4 есе асып түскенін анықтады (g = 1,24 vs g = 0,52). Рас, іріктемеде генеративті жүйелер бар-жоғы бес болды — және олардың бір бөлігі жай «жалаңаш» LLM емес, терапиялық деректерде оқытылған.
Жеке клиникалық сынақтар да оптимизмге негіз береді. Therabot — LLM-чатбот, терапиялық құрылыммен GPT-4-те құрылған, — пилоттық РКС-те депрессияның 51%-ға төмендеуін көрсетті (Sharma et al., 2023). Мінез-құлықтық белсендіруде ЖИ-терапевт пен тірі маманды салыстыру салыстырмалы тиімділікті көрсетті (Napiwotzki et al., 2025).
Li et al. (2025) мета-талдауы растады: чатботтар — LLM-жүйелерді қоса — жастардың психологиялық дистрессін маңызды деңгейде азайтады (Li et al., 2025).
«Сценарий vs LLM» емес, «құрылым vs хаос»
Барлық деректерді жинақтасақ, сурет анықтала түседі. Бөліну «сценарийлік vs тілдік модель» сызығымен емес. «Құрылымдалған терапия vs құрылымсыз сөйлесу» сызығымен өтеді.
Сценарийлік чатботтар жеңеді, өйткені сценарийлер жақсы емес. Олар жеңеді, өйткені әрбір сценарийлік чатбот анықтамасы бойынша құрылымдалған. Оның таңдауы жоқ — хаттаманы ұстанады. Ал алғашқы LLM-чатботтарда көбінесе хаттаманың өзі болмаған.
Жаңа буын LLM-жүйелер бұл мәселені қазірдің өзінде түзетуде. SuDoSys (Chen et al., 2024) — құрылымдалған тәсілдің мысалы: жүйе ДДҰ-ның PM+ психологиялық алғашқы көмек нұсқаулықтарын LLM-диалогтың қаңқасы ретінде пайдаланады. Модель тек сөйлесіп қоймайды — пайдаланушыны хаттамамен анықталған нақты терапиялық техникалар арқылы жүргізеді (Chen et al., 2024).
Kuhlmeier et al. (2025) ұқсас тәсілді көрсетті: мінез-құлықтық белсендіруге арналған LLM-чатбот, хаттаманы қадамдап ұстанады. Хаттаманы орындау дәлдігі — жоғары. Бұл «ChatGPT-мен мәселелеріңді талқыла» дегеннен түбегейлі өзгеше архитектура.
Du et al. мета-талдауының шектеулері
Нәтижелерге бірнеше маңызды ескертулер:
Іріктеме асимметриясы. Сценарийлік чатботтар мыңдаған қатысушысы бар ондаған РКС-мен ұсынылған. LLM-чатботтар — кішігірім іріктемелі бірлі-жарым сынақтармен. Мета-талдаудағы тең емес топтарды салыстыру аз зерттелген топтың әсерін жүйелі түрде бағаламауы мүмкін.
LLM-жүйелердің гетерогендігі. «LLM-чатботтар» деп мүлдем әртүрлі жүйелер біріктірілген: промпты бар оқытылмаған ChatGPT-ден мамандандырылған терапиялық платформаларға дейін. Модель өлшемі де маңызды — терапиялық деректерде оқытылған шағын модельдер әмбебап алыптарды басып озуы мүмкін. Оларды бір топқа біріктіру — аспирин мен антидепрессанттарды ажыратпай «дәрілерді» бір категория ретінде салыстыру сияқты.
Ұзақ мерзімді деректердің жоқтығы. LLM-зерттеулердің көпшілігі 2–4 апта созылды. Терапиялық әсерді бағалау үшін бұл жеткіліксіз мерзім — КМТ әдетте 8–12 апта талап етеді.
Тез ескіру. Мета-талдау әдебиет іздеу сәтіндегі дәлелдемелік базаның жағдайын тіркейді. LLM-терапияның даму жылдамдығын ескерсек, 2025 жылдың нәтижелері 2026 жылғы жүйелердің мүмкіндіктерін көрсетпеуі мүмкін.
Бұл іс жүзінде нені білдіреді?
Du et al. қорытындысы LLM-терапияға үкім емес. Бұл нақты мәселеге нұсқау: терапиялық құрылымы жоқ тілдік модель — сөйлесу, терапия емес.
Болашақтың тиімді ЖИ-терапевті — сценарий мен LLM арасындағы таңдау емес. Бұл терапиялық хаттамаға кіріктірілген LLM. Тілдік модель икемділікті, эмпатияны, диалогтың табиғилығын қамтамасыз етеді. Хаттама бағытты, бірізділікті, әр сеанстың терапиялық мақсатын қамтамасыз етеді.
Рядом платформасы дәл осы принцип бойынша құрылған: LLM-ядро құрылымдалған КМТ-хаттамалары ішінде жұмыс істейді, ал мультиагенттік архитектура эмпатиялық диалог пен клиникалық ойлауды бөледі. Бұл тәсіл екі типтегі жүйелердің күшті жақтарын — тілдік модельдердің икемділігін және терапиялық хаттамалардың дәлелденген тиімділігін — біріктіреді.
Жиі қойылатын сұрақтар
Шынымен қарапайым чатботтар депрессияда ChatGPT-ден жақсы көмектесе ме?
Du et al. (2025) мета-талдауы сценарийлік чатботтардың шамалы әсерін және LLM-чатботтардың маңызды әсерінің жоқтығын көрсетті. Бірақ бұл сценарийлердің басымдығын емес, дәлелдемелік базадағы айырмашылықты көрсетеді: сценарийлік жүйелерде — он жылдық РКС, LLM-де — бірлі-жарым сынақтар.
ЖИ-чатботтар мазасыздыққа көмектесе ме?
Деректер бірмәнді емес. Li et al. (2023) ЖИ-чатботтардың мазасыздыққа маңызды әсерін анықтамады (g = 0,65, сенімділік аралығы нөлді қиып өтеді). Алайда жеке зерттеулер, оның ішінде Napiwotzki et al. (2025), құрылымдалған LLM-интервенциялар кезінде мазасыздық белгілерінің төмендеуін көрсетеді.
Неге терапиялық хаттаманың құрылымы чатбот үшін маңызды?
Сценарийлік чатботтар анықтамасы бойынша хаттаманы ұстанады — әр қадам алдын ала жазылған. Құрылымсыз LLM еркін сөйлесу жүргізеді, бұл терапиядан гөрі эмоциялық қолдауға жақын. Kuhlmeier et al. (2025) мен Chen et al. (2024) зерттеулері көрсеткендей, құрылым нақты берілгенде LLM терапиялық хаттамаларды жоғары дәлдікпен орындай алады.
Чатботты психотерапевттің орнына пайдалану керек пе?
Чатбот маманды алмастырмайды. Li et al. (2023) мета-талдауы депрессия үшін g = 0,64 әсерін көрсетті — бұл маңызды, бірақ терапевтпен дәстүрлі КМТ-ден аз. Чатбот сеанстар арасындағы өзіне-өзі көмек құралы ретінде, маманға кезекте тұрғандар немесе жеке көмекке әзірше дайын болмағандар үшін пайдалы (Karki et al., 2025).
Дереккөздер
Chen, Y., Zhang, X., Wang, J., Xie, X., Yan, N., Chen, H., & Wang, L. (2024). Structured dialogue system for mental health: An LLM chatbot leveraging the PM+ guidelines. ArXiv. https://doi.org/10.48550/arxiv.2411.10681
Du, Q., Ren, Y., Meng, Z., He, H., & Meng, S. (2025). The efficacy of rule-based versus large language model-based chatbots in alleviating symptoms of depression and anxiety: Systematic review and meta-analysis.
Karki, A., Kamble, C., Chavan, R., & Chapke, N. (2025). Mental health meets machine learning: The rise of chatbots and LLMs in therapy. International Journal for Research Trends and Innovation, 10(5). https://doi.org/10.56975/ijrti.v10i5.203281
Kuhlmeier, F., Hanschmann, L., Rabe, M., Luettke, S., Brakemeier, E.-L., & Maedche, A. (2025). Designing an LLM-based behavioral activation chatbot for young people with depression: Insights from an evaluation with artificial users and clinical experts.
Li, H., Zhang, R., Lee, Y.-C., Kraut, R. E., & Mohr, D. C. (2023). Systematic review and meta-analysis of AI-based conversational agents for promoting mental health and well-being. NPJ Digital Medicine, 6(1), 236. https://doi.org/10.1038/s41746-023-00979-5
Li, Y., et al. (2025). Chatbot interventions for young people: A meta-analysis. Worldviews on Evidence-Based Nursing.
Ma, Z., Mei, Y., & Su, Z. (2023). Understanding the benefits and challenges of using large language model-based conversational agents for mental well-being support. AMIA Annual Symposium Proceedings. https://doi.org/10.48550/arxiv.2307.15810
Napiwotzki, L., et al. (2025). AI versus human therapist in depression: A behavioral activation comparison. Journal of Medical Internet Research.
Pavlopoulos, A., Rachiotis, T., & Maglogiannis, I. (2024). An overview of tools and technologies for anxiety and depression management using AI. Applied Sciences, 14(19), 9068. https://doi.org/10.3390/app14199068
Sharma, A., et al. (2023). Human-centered evaluation of generative AI-based therapy chatbot. NEJM AI, 1(2). https://doi.org/10.1056/AIoa2300127
Vaidyam, A. N., Wisniewski, H., Halamka, J. D., Kashavan, M. S., & Torous, J. B. (2019). Chatbots and conversational agents in mental health: A review of the psychiatric landscape. The Canadian Journal of Psychiatry, 64(7), 456–464.