DSM5AgentFlow — табиғи диалог арқылы психикалық бұзылыстардың скринингін жүргізетін және әрбір қорытындыны DSM-5-тің нақты критерийлеріне сілтемелермен негіздейтін үш ЖИ-агенттен тұратын мультиагенттік жүйе. 8 000 диалогта тестілегенде ең жақсы модель 70% дәлдік пен F1 = 77% көрсетті, ал мазасыздық бұзылыстары бойынша — 94%-ға дейін (Ozgun et al., 2025).

Диагностика ашықтығы неге аса маңызды

Психикалық денсаулыққа арналған ЖИ-жүйелердің көпшілігі «қара жәшік» ретінде жұмыс істейді: нәтижеге қалай келгенін түсіндірмей жауап береді. Пайдаланушы үшін бұл «ЖИ сізде депрессия бар деді» — себебін түсіну мүмкіндігінсіз.

Клиникалық тәжірибеде ашықтық — негізгі талап. Психотерапевт өз болжамдарын түсіндіреді, диагностикалық критерийлерге сілтеме жасайды, байқауларын клиенттің нақты айтқандарына байланыстырады. Бұл пациентке де, супервизорға да ой жүрісінің логикасын тексеруге мүмкіндік береді.

Жүйелі шолулар LLM-нің психиатрияда қолданылуының артып келе жатқанын тіркейді (Guo et al., 2024; Omar et al., 2024), бірақ түсіндірілетін диагностикасы бар жүйелер — сирек кездеседі. Амстердам еркін университеті мен Эйндховен техникалық университетінің командасы әзірлеген DSM5AgentFlow дәл осы мәселені шешеді.

Үш агент: терапевт, клиент, диагност

Жүйенің архитектурасы нақты диагностикалық процесті үш мамандандырылған агент арқылы модельдейді:

Агент-терапевт клиникалық сұхбат жүргізеді. DSM-5 Level-1 кросс-диагностикалық сауалнамасындағы 23 стандартты сұрақты алып, оларды табиғи, сөйлесу стиліндегі сұрақтарға қайта құрастырады. «Панигі ұстамаларыңыздың жиілігін 0-ден 4-ке дейін бағалаңыз» деудің орнына: «Айтыңызшы, сізді кенеттен қорқыныш немесе дүр сілкініс басатын сәттер бола ма?» деп сұрайды. 13 симптоматикалық доменді қамтиды.

Агент-клиент берілген психологиялық профилі бар пациентті симуляциялайды. Бірінші жақтан жауап береді, диагностикалық терминдерді қолданбай белгілерді сипаттайды. Бұл жүйені ауқымды тестілеуге мүмкіндік береді: 8 000 диалог мазасыздық пен депрессиядан шизофрения мен заттарды теріс пайдалануға дейін 10 негізгі бұзылысты қамтиды.

Агент-диагност әңгіме транскриптін талдайды және төрт бөлімнен тұратын құрылымдық есеп жасайды:

Пациент жағдайының жанашырлық тұрғысынан қорытындысы
Диагностикалық болжам
Диалогтан дәйексөздермен және DSM-5 критерийлеріне сілтемелермен негіздеме
Емдеу бойынша ұсыныстар

Мультиагенттік тәсіл — әрбір агент өз рөліне жауапты болғанда — терапияда да, жағдайды бағалауда да монолитті шешімдерден тиімдірек екенін көрсеткен. DSM5AgentFlow бұл тенденцияны диагностика жағынан растайды.

RAG дәлелдемелікті қалай қамтамасыз етеді

Негізгі техникалық ерекшелік — RAG (Retrieval-Augmented Generation) DSM-5-тің толық мәтінімен интеграциясы. Диагност модельдің салмақтарына «тігілген» білімге сүйенбейді. Оның орнына ол:

Диалог транскриптін алады
DSM-5-тен ең сәйкес 5 фрагментті шығарады (512–1024 токен чанктар)
Пациенттің айтқандарын критерийлерге нақты байланыстырып диагноз қалыптастырады

Байланыстарды белгілеу үшін XML-тегтер қолданылады: <sym> — белгі, <quote> — диалогтан тікелей дәйексөз, <med> — медициналық критерий. Бұл ой жүрісінің тізбегін қадағалауға мүмкіндік береді: пациенттің нақты сөзі → DSM-5-тің нақты критерийі → диагностикалық қорытынды.

DSM-5 (Diagnostic and Statistical Manual of Mental Disorders, 5th edition) — Америка психиатриялық қауымдастығының стандартты жіктемесі, барлық негізгі психикалық бұзылыстардың диагностикалық критерийлерін қамтиды. Оны RAG білім базасы ретінде пайдалану әрбір қорытындының беделді клиникалық дерекке негізделуін қамтамасыз етеді.

Дәлдік: орта есеппен 70%-дан мазасыздық бұзылыстары бойынша 94%-ға дейін

Жүйе төрт тілдік модельде тестіленді: Llama-4-Scout-17B, Mistral-Saba-24B, Qwen-QWQ-32B және GPT-4.1-Nano. Ой жүрісіне оңтайландырылған Qwen-QWQ ең жақсы нәтижелер көрсетті:

Жалпы дәлдік: 70%, F1: 77%
Панигі бұзылысы: 93,65%
ПТСБ: 94,36%
Әлеуметтік мазасыздық: 93,89%

GPT-4.1-Nano 83% дәлдікке жетті, бірақ F1 төменірек (73%). Диалог сапасы бөлек бағаланды: Llama-4 мен Mistral LLM рубрика шкаласы бойынша 5-тен 4,26–4,41 алса, GPT-4.1-Nano — тек 1,89–2,54 (Ozgun et al., 2025).

Ең осал тұсы — бейімделу бұзылысы: F1 2,78%-дан 40,25%-ға дейін. Жүйе оны депрессиямен жүйелі түрде шатастырды — бұл таңқаларлық емес: клиникалық тәжірибеде де бұл диагноздарды ажырату ең қиын міндеттердің бірі болып қала береді.

Түсіндірмелердің сапасы: барлық модельдер бірдей ашық емес

Түсіндіру қабілеті — модельдің өз қорытындысын негіздеу мүмкіндігі — бөлек бағаланды. Айырмашылық елеулі болды:

Qwen-QWQ (ең жақсы): 11 белгі тегі, диалогтан 4 тікелей дәйексөз, DSM критерийлеріне нақты сілтемелер, нөмірленген логика қадамдары. Байқаудан қорытындыға дейін толық ашық процесс.

GPT-4.1-Nano: тегтер көп, бірақ құрылымдық ой жүрісі жоқ. Жауап дұрыс, бірақ себебі түсініксіз — байқаулар мен қорытынды арасындағы байланыс жоғалады.

Llama-4: негіздеме ең аз, критерийлерге сілтемелер жоқ. Шын мәнінде, жүйе жоюға тырысатын дәл сол «қара жәшік».

Бұл нәтиже маңызды: түсіндірмесіз диагноз дәлдігі клиникалық контексте аз пайдалы. Маман ой жүрісінің әрбір қадамын тексере алуы тиіс — вычислительді психиатрия психикалық процестердің математикалық модельдерін ашық етуге ұмтылғандай.

Шектеулер: неге бұл әзірге психиатрды алмастыра алмайды

Авторлар зерттеудің шекараларын адал көрсетеді:

Тек синтетикалық деректер — барлық 8 000 диалог ЖИ-мен генерацияланған. Экологиялық валидтілік расталмаған
Бір өтулік генерация — жүйе сұхбат барысында алдыңғы жауаптар негізінде сұрақтарды бейімдемейді
Шектеулі модельдер пулы — тестілеу тек Groq-хостинг пен OpenAI-да жүргізілді
Қиылысқан белгілер — ұқсас клиникалық көрінісі бар бұзылыстар (бейімделу vs депрессия) нашар ажыратылады
Авторлардың ұстанымы: жүйе — зерттеу құралы, медициналық құрылғы емес

Барлық деректер мен код басқа зерттеушілердің қайта жаңғыртуы үшін ашық — сенім аса маңызды салада ғылыми ашықтық үшін маңызды қадам.

Бұл ЖИ-скринингтің болашағы үшін нені білдіреді

DSM5AgentFlow келесі қадам қандай болуы мүмкін екенін көрсетеді: маманды алмастыру емес, алдын ала скринингтің ашық құралы. Әрбір қорытындыны түсіндіретін жүйе:

Маманға бармас бұрын пайдаланушыға өз белгілерін ұғынуға көмектесе алады
Терапевтке бастапқы бағалауды жеделдету үшін құрылымдық есеп бере алады
Психиатр тапшылығы бар аймақтарда скринингті стандарттай алады

«Рядом» үшін бұл мультиагенттік тәсілдің дұрыстығын растайды: агенттер арасында — терапевтік, аналитикалық және бақылаушы — жауапкершілікті бөлу дәлірек те, ашығырақ та нәтижелер береді.

Жиі қойылатын сұрақтар

ЖИ психикалық бұзылыс диагнозын қоя ала ма?

Әзірге жоқ — клиникалық мағынада. DSM5AgentFlow бақыланатын жағдайларда 70% дәлдік пен F1 77% көрсетеді, бірақ тек синтетикалық деректерде тестіленді. Авторлар жүйені зерттеу құралы ретінде позициялайды, психиатриялық диагностиканы алмастырушы ретінде емес (Ozgun et al., 2025).

DSM-5 дегеніміз не және ол ЖИ-жүйеге не үшін қажет?

DSM-5 (Diagnostic and Statistical Manual of Mental Disorders, 5th edition) — Америка психиатриялық қауымдастығының стандартты жіктемесі. Барлық негізгі психикалық бұзылыстардың диагностикалық критерийлерін қамтиды. DSM5AgentFlow оны RAG арқылы білім базасы ретінде пайдаланып, әрбір қорытындыны нақты критерийге байланыстырады.

Жүйе қандай бұзылыстарды жақсы диагностикалайды?

Мазасыздық бұзылыстарын: панигі (93,65%), ПТСБ (94,36%), әлеуметтік мазасыздық (93,89%). Ең нашар — бейімделу бұзылысы (F1 2,78%-дан 40,25%-ға дейін), оны жүйе депрессиямен жиі шатастырады.

DSM5AgentFlow кәдімгі ЖИ-скринингтен немен ерекшеленеді?

Үш айырмашылық: (1) рөлдерді бөлетін мультиагенттік архитектура, (2) DSM-5-тің толық мәтінімен RAG-интеграция, (3) белгі тегтері мен диалогтан дәйексөздермен әрбір қорытындының құрылымдық негіздемесі. Кәдімгі ЖИ-скринингтер нәтижені түсіндірмесіз береді.

DSM5AgentFlow нәтижелерін өзін-өзі диагностикалау үшін пайдалануға бола ма?

Жоқ. Авторлар тікелей көрсетеді: жүйе — зерттеу құралы, медициналық құрылғы емес. Кез келген скрининг — ЖИ-мен де, қағаз сауалнамалармен де — маманға жүгінуге себеп, өз бетінше қорытынды жасау үшін негіз емес.

Дереккөздер

Ozgun, M. C., Pei, J., Hindriks, K. V., Donatelli, L., Liu, Q., & Wang, J. (2025). Trustworthy AI psychotherapy: Multi-agent LLM workflow for counseling and explainable mental disorder diagnosis. Proceedings of the 34th ACM International Conference on Information and Knowledge Management (CIKM 2025). https://doi.org/10.1145/3746252.3761164

Guo, J., et al. (2024). Large language models for mental health: A systematic review. ArXiv. https://doi.org/10.48550/arxiv.2403.15401

Omar, A., et al. (2024). Applications of large language models in psychiatry: A systematic review. Frontiers in Psychiatry, 15. https://doi.org/10.3389/fpsyt.2024.1422807

Chen, Y., et al. (2025). MIND: Towards immersive psychological healing with multi-agent inner dialogue. ArXiv. https://doi.org/10.48550/arxiv.2502.19860