Скрипттик чатботтор депрессияда LLMден жакшыраакбы? 2025-жылдын мета-анализи
2025-жылдын мета-анализи парадокс ачты: катуу сценарийлери бар скрипттик чатботтор депрессия симптомдорун орточо азайтат, ал эми чоң тилдик моделдерге негизделген чатботтор — жок. Du et al. (2025) систематикалык серебу эки типтеги системалардын рандомизацияланган клиникалык сыноолорун анализдеп, терапияда генеративдүү ЖИнин артыкчылыгы жөнүндөгү нарративди суроо астына алган жыйынтыкка келди.
Мета-анализ эмнени так көрсөттү?
Qiuxue Du жетектеген изилдөөчүлөр тобу депрессия жана тынчсыздануу симптомдору бар адамдар үчүн эки типтеги чатботторду салыштырган РКИлердин систематикалык серебин жана мета-анализин жүргүздү (Du et al., 2025). Алар системаларды эки категорияга бөлдү: rule-based (алдын ала жазылган алгоритмдер боюнча иштеген скрипттик) жана LLM-based (чоң тилдик моделдерге негизделген).
Негизги натыйжа: скрипттик чатботтор депрессивдүү симптомдордун жөнөкөй, бирок статистикалык маанилүү жакшыруусун көрсөттү. LLM-чатботтор маанилүү эффект көрсөтпөдү.
Бул контринтуитивдүү натыйжа. Тилдик моделдер табигыйраак жооптор түзөт, контекстти жакшыраак түшүнөт, адамдыкка жакын эмпатия көрсөтө алат (Karki et al., 2025). Даяр фразалар менен жооп берген система кантип жакшыраак иштеши мүмкүн?
Эмне үчүн скрипттик чатботтор «жеңди»?
Жооп скрипттер ЖИден жакшы дегенде эмес. Жооп — далилдик базада.
Он жылдык клиникалык маалыматтар. Woebot жана Wysa сыяктуу скрипттик системалар 2017-жылдан бери бар. Бул убакыттын ичинде алар чоң тандоо жана узак байкоо менен ондогон рандомизацияланган сыноолордон өттү. 2019-жылда эле Vaidyam et al. серебу психиатрияда скрипттик чатботтордун өсүп жаткан далил базасын белгилеген — ChatGPT доорунан алда канча мурун (Vaidyam et al., 2019).
Терапиялык протоколдор. Woebot когнитивдик-жүрүм-турумдук терапияны (КТТ) так аткарат. Ар бир диалог конкреттүү максаты бар структураланган сеанс: автоматтык ойду аныктоо, когнитивдик кайра түзүмдөө, жүрүм-турумдук эксперимент дайындоо. Скрипт протоколдон четтей албайт — жана бул анын артыкчылыгы.
LLM үчүн бирдиктүү РКИлер. Чоң тилдик моделдер терапиялык колдонмолор үчүн 2023–2024-жылдары гана жеткиликтүү болду. LLM-чатботтор үчүн аяктаган РКИлердин саны бирдиктер менен эсептелет. Үч-төрт кичинекей сыноону бириктирген мета-анализ статистикалык маанилүүлүктү көрсөтө албайт — жөн гана күчү жетишсиз.
Алгачкы LLM-изилдөөлөрдө эмне туура эмес?
Маселе сыноолордун санында гана эмес. Алгачкы психикалык ден соолук үчүн LLM-чатботтор көбүнчө терапиялык структурасыз иштелип чыккан.
2023-жылдын типтүү сценарийи: изилдөөчүлөр GPT-3.5 же GPT-4 алышат, «сен — эмпатиялык психолог» деген системалык промпт жазышат жана колдонуучуларды эркин диалогго чыгарышат. Мындай чатбот сооротуп, угуп, туура сөздөрдү тандай алат. Бирок ал адамды терапиялык маршрут боюнча жетектебейт. Ал реактивдүү — колдонуучу айткан нерсеге жооп берет, конкреттүү терапиялык максаттарга сүйлөшүүнү багыттоонун ордуна.
Ma et al. (2023) бул фундаменталдуу кыйынчылыкты сүрөттөшкөн: LLM-агенттер таасирдүү тилдик жөндөмдөргө ээ, бирок кошумча архитектурасыз структураланган клиникалык ой жүгүртүүгө жетишсиз (Ma et al., 2023). Pavlopoulos et al. (2024) серебу тастыктады: депрессия жана тынчсыздануу үчүн ЖИ-куралдарынын арасында эң чоң эффектти далилдүү терапиялык фреймворктарга камтылгандары көрсөтөт (Pavlopoulos et al., 2024).
Kuhlmeier et al. (2025) жүрүм-турумдук активация үчүн LLM-чатбот менен эксперимент жүргүзүп, мүнөздүү карама-каршылыкты аныкташкан: модель терапиялык протоколдорду жогорку тактык менен аткара алат, бирок «ишенимдүү клиникалык ой жүгүртүү ачык маселе бойдон калууда» (Kuhlmeier et al., 2025).
Контекст: башка мета-анализдер макул эмес
Du et al. жыйынтыгы вакуумда бар эмес. Li et al. (2023) эң чоң мета-анализи — 35 изилдөө, 17 000ден ашык катышуучу — жалпысынан ЖИ-чатботтор үчүн депрессиянын маанилүү азайышын көрсөттү: Hedges' g = 0,64 (Li et al., 2023). Бирок бул сереп скрипттик жана LLM-системаларды Du et al. жасагандай подтопторго бөлгөн эмес.
Андан тышкары, Li et al. генеративдүү моделдер скрипттиктерди эффект өлчөмү боюнча 2,4 эсе ашканын аныктады (g = 1,24 vs g = 0,52). Бирок тандоодо генеративдүү системалар бешөө гана болгон — жана алардын бир бөлүгү жөн гана «жылаңач» LLM эмес, терапиялык маалыматтарда үйрөтүлгөн.
Жеке клиникалык сыноолор да оптимизмге негиз берет. Therabot — терапиялык структурасы бар LLM-чатбот, GPT-4де курулган, — пилоттук РКИде депрессияны 51%ке азайтууну көрсөттү (Sharma et al., 2023). Жүрүм-турумдук активацияда ЖИ-терапевтти тирүү адис менен салыштыруу окшош натыйжалуулукту көрсөттү (Napiwotzki et al., 2025).
Li et al. (2025) мета-анализи тастыктады: чатботтор — LLM-системаларды камтып — жаштардын психологиялык дистрессин маанилүү азайтат (Li et al., 2025).
«Скрипт vs LLM» эмес, «структура vs хаос»
Бардык маалыматтарды бириктирсе, сүрөт тактанат. Бөлүнүү «скрипттик vs тилдик модель» чек аралында эмес. Ал «структураланган терапия vs структурасыз сүйлөшүү» чек аралында.
Скрипттик чатботтор скрипттер жакшы болгондуктан эмес, жеңишке жетет. Алар ар бир скрипттик чатбот түзүлүшү боюнча структураланган болгондуктан жеңет. Анын тандоосу жок — протоколду аткарат. Ал эми алгачкы LLM-чатботтордун көбүндө эч кандай протокол жок болчу.
Жаңы муундагы LLM-системалар бул маселени мурунтан чечүп жатат. SuDoSys (Chen et al., 2024) — структураланган мамиленин мисалы: система LLM-диалогдун каркасы катары ДДУнун психологиялык биринчи жардам (PM+) колдонмолорун колдонот. Модель жөн сүйлөшпөйт — протокол аныктаган конкреттүү терапиялык техникалар аркылуу колдонуучуну жетектейт (Chen et al., 2024).
Kuhlmeier et al. (2025) окшош мамилени көрсөтүштү: протоколду кадам-кадам аткарган жүрүм-турумдук активация үчүн LLM-чатбот. Протоколду аткаруу тактыгы — жогору. Бул «ChatGPT менен көйгөйлөрүң жөнүндө сүйлөш» дегенден принципиалдуу башка архитектура.
Du et al. мета-анализинин чектөөлөрү
Натыйжаларга бир нече маанилүү эскертүүлөр:
Тандоо асимметриясы. Скрипттик чатботтор миңдеген катышуучулар менен ондогон РКИлер менен берилген. LLM-чатботтор — кичинекей тандоолуу бирдиктүү сыноолор менен. Мета-анализде тең эмес топторду салыштыруу азыраак изилденген топтун эффектин системалуу түрдө төмөндөтүшү мүмкүн.
LLM-системалардын гетерогендүүлүгү. «LLM-чатботтор» деп такыр башка системалар бириктирилген: промпту бар үйрөтүлбөгөн ChatGPTден адистештирилген терапиялык платформаларга чейин. Моделдин өлчөмү да маанилүү — терапиялык маалыматтарда үйрөтүлгөн компакттуу моделдер универсалдуу гиганттардан жакшыраак болушу мүмкүн. Аларды бир топко бириктирүү — аспирин менен антидепрессантты айырмалабай, «дарылар» деп бир категория катары салыштыргандай эле.
Узак мөөнөттүү маалыматтардын жоктугу. LLM-изилдөөлөрдүн көбү 2–4 жума созулган. Терапиялык эффектти баалоо үчүн бул жетишсиз мөөнөт — КТТ адатта 8–12 жуманы талап кылат.
Тез эскирүү. Мета-анализ адабият издөө учурундагы далил базасынын абалын белгилейт. LLM-терапиянын өнүгүү ылдамдыгын эске алганда, 2025-жылдын натыйжалары 2026-жылдын системаларынын мүмкүнчүлүктөрүн чагылдырбашы мүмкүн.
Бул практикада эмнени билдирет?
Du et al. жыйынтыгы — LLM-терапияга үкүм эмес. Бул конкреттүү маселеге көрсөткүч: терапиялык структурасыз тилдик модель — бул сүйлөшүү, терапия эмес.
Келечектин натыйжалуу ЖИ-терапевти — скрипт менен LLMдин ортосундагы тандоо эмес. Бул терапиялык протоколго камтылган LLM. Тилдик модель ийкемдүүлүктү, эмпатияны, диалогдун табигыйлыгын камсыз кылат. Протокол багытты, ырааттуулукту, ар бир сессиянын терапиялык максатын камсыз кылат.
Рядом платформасы дал ушул принцип боюнча курулган: LLM-өзөк структураланган КТТ протоколдорунун ичинде иштейт, ал эми мультиагенттик архитектура эмпатиялык диалог менен клиникалык ой жүгүртүүнү бөлөт. Бул мамиле эки типтеги системалардын күчтүү жактарын бириктирет — тилдик моделдердин ийкемдүүлүгүн жана терапиялык протоколдордун далилденген натыйжалуулугун.
Көп берилүүчү суроолор
Депрессияда кадимки чатботтор чынында ChatGPTден жакшыраак жардам беребу?
Du et al. (2025) мета-анализи скрипттик чатботтордун жөнөкөй эффектин жана LLM-чатботтордун маанилүү эффектинин жоктугун көрсөттү. Бирок бул скрипттердин артыкчылыгын эмес, далилдик базадагы айырманы чагылдырат: скрипттик системаларда — он жылдык РКИлер, LLMде — бирдиктүү сыноолор.
ЖИ-чатботтор тынчсыздануу учурунда жардам беребу?
Маалыматтар бир мааниге келбейт. Li et al. (2023) ЖИ-чатботтордун тынчсыздануу үчүн маанилүү эффектин аныктаган эмес (g = 0,65, ишеним аралыгы нөлдү кесип өтөт). Бирок Napiwotzki et al. (2025) камтылган жеке изилдөөлөр структураланган LLM-интервенциялар менен тынчсыздануу симптомдорунун азайышын көрсөтөт.
Эмне үчүн терапиялык протоколдун структурасы чатбот үчүн ушунчалык маанилүү?
Скрипттик чатботтор түзүлүшү боюнча протоколду аткарат — ар бир кадам алдын ала жазылган. Структурасыз LLM эркин сүйлөшүү жүргүзөт, бул терапияга караганда эмоциялык колдоого жакын. Kuhlmeier et al. (2025) жана Chen et al. (2024) изилдөөлөрү структура так берилгенде LLM терапиялык протоколдорду жогорку тактык менен аткара аларын көрсөтөт.
Чатботту психотерапевттин ордуна колдонуу керекпи?
Чатбот адистин ордуна эмес. Li et al. (2023) мета-анализи депрессия үчүн g = 0,64 эффектин көрсөттү — бул маанилүү, бирок терапевт менен салттуу КТТден аз. Чатбот сессиялар ортосунда өзүн-өзү жардам куралы, адиске кезекте тургандар же жеке кайрылууга даяр эмес адамдар үчүн пайдалуу (Karki et al., 2025).
Булактар
Chen, Y., Zhang, X., Wang, J., Xie, X., Yan, N., Chen, H., & Wang, L. (2024). Structured dialogue system for mental health: An LLM chatbot leveraging the PM+ guidelines. ArXiv. https://doi.org/10.48550/arxiv.2411.10681
Du, Q., Ren, Y., Meng, Z., He, H., & Meng, S. (2025). The efficacy of rule-based versus large language model-based chatbots in alleviating symptoms of depression and anxiety: Systematic review and meta-analysis.
Karki, A., Kamble, C., Chavan, R., & Chapke, N. (2025). Mental health meets machine learning: The rise of chatbots and LLMs in therapy. International Journal for Research Trends and Innovation, 10(5). https://doi.org/10.56975/ijrti.v10i5.203281
Kuhlmeier, F., Hanschmann, L., Rabe, M., Luettke, S., Brakemeier, E.-L., & Maedche, A. (2025). Designing an LLM-based behavioral activation chatbot for young people with depression: Insights from an evaluation with artificial users and clinical experts.
Li, H., Zhang, R., Lee, Y.-C., Kraut, R. E., & Mohr, D. C. (2023). Systematic review and meta-analysis of AI-based conversational agents for promoting mental health and well-being. NPJ Digital Medicine, 6(1), 236. https://doi.org/10.1038/s41746-023-00979-5
Li, Y., et al. (2025). Chatbot interventions for young people: A meta-analysis. Worldviews on Evidence-Based Nursing.
Ma, Z., Mei, Y., & Su, Z. (2023). Understanding the benefits and challenges of using large language model-based conversational agents for mental well-being support. AMIA Annual Symposium Proceedings. https://doi.org/10.48550/arxiv.2307.15810
Napiwotzki, L., et al. (2025). AI versus human therapist in depression: A behavioral activation comparison. Journal of Medical Internet Research.
Pavlopoulos, A., Rachiotis, T., & Maglogiannis, I. (2024). An overview of tools and technologies for anxiety and depression management using AI. Applied Sciences, 14(19), 9068. https://doi.org/10.3390/app14199068
Sharma, A., et al. (2023). Human-centered evaluation of generative AI-based therapy chatbot. NEJM AI, 1(2). https://doi.org/10.1056/AIoa2300127
Vaidyam, A. N., Wisniewski, H., Halamka, J. D., Kashavan, M. S., & Torous, J. B. (2019). Chatbots and conversational agents in mental health: A review of the psychiatric landscape. The Canadian Journal of Psychiatry, 64(7), 456–464.