Беш КТТ-чатбот, беш дизайн чечими: 2024–2025-жылдардагы изилдөөлөр талааны кантип карталайт
2024–2025-жылдары беш адистештирилген КТТ-чатбот клиникалык баалоодон өттү, ар бири өз техникасына байланган: SuDoSys ДСУнун PM+ протоколу боюнча (Chen et al., 2024), когнитивдик кайра курулуш системасы (Wang et al., 2025), когнитивдик кайра баалоо үчүн Socrates 2.0 (Held et al., 2025), жаштар үчүн жүрүм-турумдук активация чатботу (Kuhlmeier et al., 2025) жана GPT-4тө көйгөйгө багытталган терапия системасы (Mo et al., 2025). Бештөөсү тең протоколго жогорку чындыкка жетет. Алар LLMдин директивдүүлүгү боюнча дизайн чечими менен кескин айырмаланат — дал ушул октон системанын КТТнын ичинде коопсуз калабы же директивдик кеңешке дрейф кылабы аныкталат. Бул макала ар бир системаны өз дизайн чечими жана ал ачкан кемчилик режими менен салыштырат.
Психикалык ден соолуктагы ЖИ-чатботтор боюнча жалпы эффект чоңдугунун далилдерин (депрессия үчүн Hedges' g = 0,64, генеративдик моделдерде сценарийликтерге салыштырмалуу 2,4× артыкчылык) биз Li et al. 2023 мета-анализинин талдоосунда жана Du et al. 2025 LLM менен сценарийликтерди салыштырган эмгекте чечкенбиз. Бул жерде 2024–2025-жылдары пайда болгон система боюнча клиникалык баалоолорго көңүл бурабыз.
Эмне үчүн КТТ — автоматташтырылуучу техника
КТТ операционалдашкан блокторго бөлүнөт: көйгөйлүк баалоо, психобилим берүү, техникалардын топтому (когнитивдик кайра курулуш, жүрүм-турумдук активация, экспозиция, жүрүм-турумдук эксперименттер, сократтык диалог), өзгөрүүлөрдүн мониторинги жана рецидивдин алдын алуу. Ар бир техниканын скрипти бар: качылган кырдаалдардын иерархиясы, автоматтык ойлордун жазуу форматы, маанай баалоо шкалалары.
Дал ушул структура — «жалпы ChatGPT»де жок жана коопсуз автоматташтыруу үчүн сын-чегерим маанилүү нерсе. Karki et al. (2025) системалуу серебинде чатботтор менен LLMдер адам менен салыштырмалуу эмпатияны жана 24/7 жеткиликтүүлүктү көрсөтөрүн, бирок коопсуз болуу үчүн тепкичтүү жардамга интеграцияны талап кыларын баса белгилейт.
Ошондуктан 2024–2025-жылдардагы толкун — «дагы бир генеративдик аңгемелешүүчү» эмес. Бул гибрид: структураланган КТТ-протокол + LLM, ал протоколдун рельстеринин ичинде табигый-тилдик жоопторду түзөт. Кызыктуу суроо — ар бир система рельстерди кантип ишке ашырат — жана дал бул бештөөнү бөлөт.
1-система — SuDoSys: ДСУ протоколу боюнча стадиялык архитектура
Chen et al. (2024) SuDoSysти сунушташты — Дүйнөлүк саламаттык сактоо уюмунун Problem Management Plus (PM+) протоколу боюнча сүйлөшүүнү жүргүзүүчү LLM-чатбот, ал адистердин жетишсиздиги бар шарттар үчүн иштелип чыккан кыска 5-сессиялык кийлигишүү.
Дизайн чечими: эң төмөн директивдүүлүктөгү рельс. Чатбот иштин учурдагы стадиясын кармайт (контрактинг → көйгөйдү баалоо → психобилим берүү → жөнгө салуу техникалары → өзгөрүүлөрдү пландаштыруу → бекемдөө) жана стадиядан чыгуу критерийлери аткарылмайынча алдыга жылуудан баш тартат. LLM табигый жоопторду стадиянын ичинде түзөт; протокол өтүүлөрдү көзөмөлдөйт.
Бул эмнени чечет: «жалпы ChatGPT» эмоциялык жактан байытылган учурларда терапевттик багытты жоготот — Proceedings of the ACM on Human-Computer Interaction (Q1) журналындагы Song et al. (2024) сапаттык түрдө катаган бузулууну. Стадиялык архитектура бузулууну структуралык түрдө мүмкүн эмес кылат: модель дрейф кыла албайт, анткени өтүүлөр ага таандык эмес.
Эмне үчүн бул коопсуздук үчүн маанилүү: SuDoSys буга чейин валидацияланган протоколду өткөрөт (PM+ депрессия жана тынчсыздануу боюнча бир нече өлкөдө жарыяланган РКС-далилдерине ээ), LLM ойлоп тапканды эмес. Чатбот — буга чейинки кийлигишүүнү жеткирүү кабыгы. Бул «ЖИнин терапиясын» нөлдөн баалагандан кыйла кичине валидация бети.
2-система — Когнитивдик кайра курулуш чатботу: директивдүүлүк кай жактан өтөт
Wang et al. (2025) когнитивдик кайра курулуш үчүн LLM-чатботту баалашты — кардар автоматтык дисфункционалдык ойлорду таанып, текшерүүнү үйрөнгөн КТТнын борбордук техникасы. Эксперт-психологдор системанын клиникалык сапатын баалашты.
Дизайн чечими: SuDoSyske караганда жогорураак директивдүүлүк бюджети. Чатботко конкреттүү когнитивдик бурмалоолорду текшерген запростарды генерациялоого уруксат берилет.
Изилдөө ачкан кемчилик режими: модель изилдөөчүлүк суроолордон («бул ойдун пайдасына жана каршы кандай аргументтер бар?») директивдик кеңешке («андан көрө мындай ойло») дрейф кылат. Бул КТТнын негиздөөчү принциптеринин бирин бузат — кардардын альтернативдик чечмелөөлөрдү өз алдынча табуусу активдүү ингредиент болуп саналат, терапевттин жогорудан жеткирилген туура жообу эмес.
Сабак: КТТ-чатботтун сапаты моделдин билиминин көлөмү менен эмес, протокол анын директивдүүлүгүн керектүү жерлерде канчалык чеберчилик менен бууганы менен аныкталат. Дал ушундай көйгөй Boit & Patil промпт-инжиниринг фреймворкунда (психикалык ден соолук чатботтору үчүн промпт-инжиниринг сереби) жана MIND-SAFE архитектурасында да каралат.
3-система — Socrates 2.0: автоматташтыруу үчүн эң татаал техника
Held et al. (2025) JMIR Mental Health журналында Socrates 2.0тин — сократтык диалог аркылуу когнитивдик кайра баалоо үчүн ЖИ-системасынын — аралаш ыкмалардагы ишке ашыруу мүмкүнчүлүгүнүн изилдөөсүн жарыялашты. Сократтык диалог — терапевт ачык суроолордун ырааттуулугу аркылуу кардарга сырттан «туура жоопту» алуу эмес, тең салмактуу чечмелөөгө өз алдынча келүүгө жардам берген техника.
Дизайн чечими: промптка ачыктан-ачык кошулган изилдөөчүлүк позициянын рельси. Тактоочу суроолорду берүү, чечмелөөлөрдү текшерүү, сессиянын максатына фокусту кармоо — жоопту бербестен.
Эмне иштеди: заманбап LLMдер сократтык диалогду терапевттикке жакын форматта жүргүзө алышат жана сессия бою максатка фокусту кармашат.
Кай жерде бузулду: татаал когнитивдик бурмалоо учурларында модель кеңештерге дрейф кылып, изилдөөчүлүк позицияны жоготту — Wang et al. (2025) когнитивдик кайра курулуш үчүн белгилеген ошол эле кемчилик режими. Эки көз каранды эмес дизайндын бир чекке жакындашы муну Socrates 2.0го гана таандык чек эмес, КТТ-чатботтордун жалпы чегине айлантат: бүгүнкү LLMдер когнитивдик техникаларды орточо татаалдыкта өткөрө алышат, бирок татаал учурларды иштетүү үчүн изилдөөчүлүк позициянын guard railsтерин талап кылат.
4-система — Жаштар үчүн жүрүм-турумдук активация чатботу
Kuhlmeier et al. (2025) депрессиясы бар жаштарда жүрүм-турумдук активация (BA) үчүн LLM-чатботту иштеп чыгышты жана аны жасалма колдонуучулар (кардар симуляторлору) жана клиникалык эксперттер менен баалашты. BA — депрессия үчүн КТТнын эң далилдүү техникасы — ойлор менен иштөөнүн ордуна кардар баалуулуктар жана ыракат менен байланышкан активдүүлүктөрдүн санын акырындык менен көбөйтөт, депрессивдик жабык чөйрөнү бузат.
Дизайн чечими: протоколго чындыктын катуу рельстери. BA сессиясынын структурасын өткөрүү, туура үй тапшырмаларын берүү, прогрессти мониторингтөө.
Баалоо эмнени тастыктады: LLM-чатботтор КТТ-протоколду жогорку чындык менен аткара алышат — сессиянын структурасына ээрчишет, туура үй тапшырмаларын беришет, шкалалар боюнча прогрессти көзөмөлдөшөт.
Ачык фронтир: робастык клиникалык ой жүгүртүү — кардардын стандарттуу эмес жоопторуна реакция, жашыруун тобокелдерди таануу, интенсивдүүлүктүн динамикалык адаптациясы. Бул ар бир чатбот изилдөөсүндө пайда болгон ошол эле «1-роль vs. 3-роль» чеги: протоколду өткөрүү чечилген; клиникалык ой жүгүртүү — жок. CaiTI (Nie et al., 2024, ACM Transactions on Computing for Healthcare, Q1, 35 цитата) сыяктуу жанаша дизайндар — күнүмдүк акылдуу түзмөктөр аркылуу жеткирилген LLM-«терапевт» — туура учурдагы just-in-time КТТ-кийлигишүүгө карай түртөт, бул бекетти андан да жогорулатат.
5-система — GPT-4тө көйгөйгө багытталган терапия чатботу
Mo et al. (2025) Frontiers in Digital Health журналында жаштар үчүн өзүнө-өзү жардам үчүн GPT-4тө PST-чатботту сунушташты. Көйгөйгө багытталган терапия (Problem Solving Therapy, PST) — КТТдан туунду кыска мамиле: көйгөйдү аныктоо → альтернативаларды генерациялоо → баалоо жана тандоо → ишке ашыруу планы → натыйжаны текшерүү.
Дизайн чечими: LLM диалогдун көп бөлүгүн ээлейт, анткени протокол ушунчалык катуу пошагалуу, ал өзү дрейфти ичинен чектейт.
Эмне үчүн PST чатбот үчүн өзгөчө ылайыктуу:
- Протокол катуу пошагалуу жана диалогдо оңой кармалат — модель тарап-тарапка кетүү үчүн орун жокко эсе.
- Ал ишенимдерди терең кайра курулуш менен эмес, актуалдуу жашоо тапшырмалары менен иштейт — бул системанын «терапевттик интуициясына» талаптарды азайтат.
- Чатбот колдонуучунун ой жүгүртүүсүн структуралоого жардам берет, терең терапевттин ролуна талашпайт.
Бул PSTни LLM ээлей алгандын жогорку чегине айлантат. Протокол ушунчалык жакшы чектелген болсо, чатбот коопсуз территорияда; болбосо (когнитивдик кайра курулуш, сократтык кайра баалоо) — LLMге сырткы рельс керек.
Беш система = беш рельс. Катар салыштыруу
| Система | Техника | Дизайн чечими | Эмне иштеди | Кемчилик режими |
|---|---|---|---|---|
| SuDoSys (Chen 2024) | ДСУ PM+ протоколу | Stage-gateтер өтүүлөрдү башкарат; LLM стадиянын ичинде гана | Дрейф кыла албайт; алдын ала валидацияланган ДСУ кийлигишүүсүн өткөрөт | PM+тин 5-сессиялык көлөмү менен чектелген |
| Когнитивдик кайра курулуш (Wang 2025) | Кайра курулуш | Жогорураак директивдүүлүк бюджети | Эмпатиялык валидация, протоколду кармоо | Директивдик кеңешке дрейф — «кардардын өз ачылышын» бузат |
| Socrates 2.0 (Held 2025) | Когнитивдик кайра баалоо | Промптта изилдөөчүлүк позиция рельси | Орточо татаалдыкта сократтык диалогду кармайт | Татаал когнитивдик бурмалоодо кеңештерге дрейф |
| BA-чатбот (Kuhlmeier 2025) | Жүрүм-турумдук активация | Протоколго чындыктын катуу рельстери | BA сессиясынын структурасына жогорку чындык | Кардардын стандарттуу эмес жооптору; тобокелди таануу |
| PST-чатбот (Mo 2025) | Көйгөйгө багытталган терапия | Ичинен пошагалуу структура дрейфти чектейт | LLM диалогдун көп бөлүгүн коопсуз ээлейт | Актуалдуу тапшырма менен иштөө, тереңдик эмес |
Беш системага жалпы чектөөлөр
Беш системада ошол эле тобокел зоналары пайда болот:
- Директивдүүлүккө дрейф — КТТ-чатботтун борбордук кемчилик режими. Беш системанын экөө (Wang 2025; Held 2025) КТТ биргеликтеги изилдөөнү талап кылган жерлерде моделдин директивдик кеңешке өтүшүн көз каранды эмес көрсөтүштү. Рельстин дизайны — бул коопсуздук суроосу.
- Подгруппалар боюнча бирдей эмес эмпатия. LLMдин эмпатиясы пациент топтору боюнча айырмаланат (Gabriel et al., 2024). Тең салмактуу корпустарсыз жана guard railsсыз жетишсиз көрсөтүлгөн топтордогу колдонуучулар башкаларга караганда сапаттуу эмес жоопторду алат.
- Атайын guard railsсыз кризис менен иштөө зыян жаратат. Li et al. (2023) серебиндеги системалардын жарымынан азы коопсуздук чараларын билдирген. Атайын механизмдерсиз жайылтылган жалпы багыттагы LLMдер реалдуу зыян жаратат (De Choudhury et al., 2023).
- Валидация бети кичине — беш техника, беш система. 2024–2025-жылдардын далилдери когнитивдик кайра курулуш, сократтык кайра баалоо, BA, PST жана ДСУ протоколу үчүн эмне иштээрин көрсөтөт. Алар экспозициялык терапияны, ОКР үчүн жүрүм-турумдук эксперименттерди же үчүнчү толкундун техникаларын (ACT, DBT көндүмдөрү) азырынча камтыган жок.
Беш система эмнеге келишет
Клиникалык колдонула турган КТТ-чатботтун байланышкан дизайн спецификациясы төмөнкүдөй окулат:
- Stage-gateтер, LLM ээ болгон өтүүлөр эмес. Сессиянын так аныкталган структурасы бар протоколдор (BA, PM+, PST) үчүн SuDoSys стилиндеги стадиялык архитектураны тандаңыз.
- Промптта изилдөөчүлүк позиция рельси. LLMге стадиянын ичинде диалогду генерациялоого уруксат берилген техникалар үчүн (кайра курулуш, сократтык) рельс директивдүүлүктү бууганы керек — анан да татаал когнитивдик бурмалоодо ал сынат, ошондуктан эскалациялаңыз.
- Өзүнчө коопсуздук бети. Кризисти таануу жана handoff промпттун бөлүмү боло албайт; ал көз каранды эмес катмар болушу керек. EmoAgent (Qiu et al., 2025) жана MIND-SAFE фреймворку архитектураны көрсөтөт.
- Чектелген колдонуу аймагы. Жеңил жана орточо симптоматика, курч кризис же татаал коморбиддүүлүк эмес. Протокол колдонуучуга чекти ачык көрсөтүүсү керек.
«Рядом» дал ушул спецификацияны ишке ашырат: техниканы өткөрүүнү коопсуздуктан бөлгөн мультиагенттик архитектура менен КТТ-протоколдор, директивдүүлүктүн басымын төмөндөткөн структураланган профайлинг жана протоколдун көлөмүнөн тышкары клиницистке айкын эскалация. Бул мейкиндикте кийинки 12 айда кызыктуу иш «дагы күчтүү негизги моделдер» эмес. Бул жакшыраак рельстер.
Көп берилүүчү суроолор
КТТ-чатботту баалоо адабияты кайсы дизайн чечимине багыттайт?
Стадиялык архитектурага, анда протокол фазалар арасындагы өтүүлөрдү ээлейт, ал эми LLM фазанын ичинде гана генерациялайт. Chen et al. (2024) ДСУ PM+ протоколу боюнча SuDoSys — эң таза мисал: контрактинг → баалоо → психобилим берүү → жөнгө салуу → пландаштыруу → бекемдөө, моделдин чыгуу критерийлери аткарылмайынча жылбашы менен. Mo et al. (2025) PST-чатботу окшош коопсуздук профилине жетет, анткени PST ушунчалык катуу пошагалуу, структура дрейфти ичинен чектейт.
Эмне үчүн директивдүүлүктүн дрейфи клиникалык маанилүү?
КТТ биргеликтеги изилдөөгө таянат: кардар альтернативдик чечмелөөлөрдү багытталган суроолор аркылуу ачат, терапевттин «туура жообун» алуу менен эмес. 2024–2025-жылдардагы беш баалоонун экөө (Wang 2025; Held 2025) татаал учурларда LLMдин директивдик кеңешке өтүшүн көрсөттү. Бул терапевттик байланышты бузат жана кардардын өзгөрүүгө автордук сезимин азайтат — когнитивдик техникалардын активдүү ингредиентин.
2024–2025-жылдары кайсы КТТ техникалары чындап клиникалык бааланды?
Бешөө: ДСУ PM+ протоколу боюнча структураланган диалог (SuDoSys, Chen et al., 2024), когнитивдик кайра курулуш (Wang et al., 2025), сократтык кайра баалоо (Socrates 2.0, Held et al., 2025), жаштарда жүрүм-турумдук активация (Kuhlmeier et al., 2025) жана GPT-4тө көйгөйгө багытталган терапия (Mo et al., 2025). Экспозициялык терапия, ОКР үчүн жүрүм-турумдук эксперименттер жана үчүнчү толкундун техникалары (ACT, DBT көндүмдөрү) азырынча камтылган жок.
Ар бир система кай жерде сынат жана бул бизге эмнени айтат?
SuDoSys көлөмдө гана сынат (ал PM+ка байланган). Wang когнитивдик кайра курулуш чатботу менен Socrates 2.0 бир эле кемчилик режиминде сынат — татаал когнитивдик бурмалоодо кеңешке дрейф — бул муну системага гана таандык баг эмес, бүгүнкү LLMдердин жалпы чегине айлантат. Kuhlmeier BA-чатботу эң таза чындык профилине ээ, бирок 3-ролдун чегин ачат: протоколду өткөрүү чечилген, робастык клиникалык ой жүгүртүү — жок. Mo PST-чатботу — протокол катуу пошагалуу болгондо моделдин коопсуз ээлей алган жогорку чеги.
Айкын коопсуздук катмарысыз КТТ-чатбот коопсузбу?
Жок. Li et al. (2023) серебиндеги чатботтордун жарымынан азы кандайдыр бир коопсуздук механизмин билдирген. Атайын guard railsсыз жайылтылган жалпы багыттагы LLMдер катталган зыян жаратат (De Choudhury et al., 2023). Кризисти таануу жана handoff көз каранды эмес катмар болушу керек — промпттун бөлүмү эмес.
Булактар
Boit, S., & Patil, R. (2025). A prompt engineering framework for large language model–based mental health chatbots: Conceptual framework. JMIR Mental Health. https://doi.org/10.2196/75078
Chen, Y., Zhang, X., Wang, J., Xie, X., Yan, N., Chen, H., & Wang, L. (2024). Structured dialogue system for mental health: An LLM chatbot leveraging the PM+ guidelines. ArXiv. https://doi.org/10.48550/arxiv.2411.10681
De Choudhury, M., Pendse, S. R., & Kumar, N. (2023). Benefits and harms of large language models in digital mental health. ArXiv. https://doi.org/10.48550/arxiv.2311.14693
Du, Q., Ren, Y., Meng, Z., He, H., & Meng, S. (2025). The efficacy of rule-based versus large language model–based chatbots in alleviating symptoms of depression and anxiety: Systematic review and meta-analysis. Journal of Medical Internet Research.
Gabriel, S., Puri, I., Xu, X., Malgaroli, M., & Ghassemi, M. (2024). Can AI relate: Testing large language model response for mental health support. ArXiv. https://doi.org/10.48550/arxiv.2405.12021
Held, P. et al. (2025). AI-facilitated cognitive reappraisal via Socrates 2.0: Mixed methods feasibility study. JMIR Mental Health. https://doi.org/10.2196/80461
Karki, A., Kamble, C., Chavan, R., & Chapke, N. (2025). Mental health meets machine learning: The rise of chatbots and LLMs in therapy. International Journal for Research Trends and Innovation. https://doi.org/10.56975/ijrti.v10i5.203281
Kuhlmeier, F., Hanschmann, L., Rabe, M., Luettke, S., Brakemeier, E.-L., & Maedche, A. (2025). Designing an LLM-based behavioral activation chatbot for young people with depression: Insights from an evaluation with artificial users and clinical experts.
Li, H., Zhang, R., Lee, Y.-C., Kraut, R. E., & Mohr, D. C. (2023). Systematic review and meta-analysis of AI-based conversational agents for promoting mental health and well-being. NPJ Digital Medicine, 6(1), 236. https://doi.org/10.1038/s41746-023-00979-5
Mo, F. et al. (2025). Self-help psychological intervention for young individuals: PST chatbot using GPT-4. Frontiers in Digital Health. https://doi.org/10.3389/fdgth.2025.1627268
Nie, J., Shao, H., Fan, Y., Shao, Q., You, H., Preindl, M., & Jiang, X. (2024). LLM-based conversational AI therapist for daily functioning screening and psychotherapeutic intervention via everyday smart devices. ACM Transactions on Computing for Healthcare. https://doi.org/10.48550/arxiv.2403.10779
Obradovich, N. et al. (2024). Opportunities and risks of large language models in psychiatry. NPP Digital Psychiatry and Neuroscience. https://doi.org/10.1038/s44277-024-00010-z
Omar, M., Soffer, S., Charney, A. W., Landi, I., Nadkarni, G. N., & Klang, E. (2024). Applications of large language models in psychiatry: A systematic review. Frontiers in Psychiatry. https://doi.org/10.3389/fpsyt.2024.1422807
Sharma, A. et al. (2023). Human-centered evaluation of generative AI-based therapy chatbot. NEJM AI, 1(2). https://doi.org/10.1056/AIoa2300127
Song, I., Pendse, S. R., Kumar, N., & De Choudhury, M. (2024). The typing cure: Experiences with large language model chatbots for mental health support. Proceedings of the ACM on Human-Computer Interaction. https://doi.org/10.1145/3757430
Wang, Y. et al. (2025). Evaluating an LLM-powered chatbot for cognitive restructuring: Insights from mental health professionals. ArXiv. https://doi.org/10.48550/arxiv.2501.15599