Ці можа ШІ ацаніць псіхічны стан падчас размовы
Сістэма MoPHES, апісаная ў IEEE у кастрычніку 2025 года, вызначае ўзровень трывогі падчас размовы з чалавекам — з дакладнасцю 80,5%. Для дэпрэсіі паказчык ніжэйшы — 63%, але і гэта пераўзыходзіць вынікі мадэляў, якія ў сем разоў большыя. Упершыню ацэнка псіхічнага стану ўбудаваная ў сам дыялог, а не вынесеная ў асобны тэст.
Чаму чат-боты дагэтуль не ўмелі гэтага рабіць?
Большасць ШІ-сістэм для ментальнага здароўя працуюць па адной з дзвюх схем: альбо задаюць стандартызаваныя апытальнікі (PHQ-9, GAD-7), альбо вядуць падтрымліваючы дыялог без якой-небудзь клінічнай ацэнкі. Першыя стамляюць і не ўпісваюцца ў натуральнае зносіны. Другія — размаўляюць, але не «чуюць».
Прафесійны псіхолаг так не працуе. Ён пастаянна ацэньвае стан кліента: па словах, інтанацыі, выбары тэм. Пры лёгкай трывозе дастаткова падтрымкі і тэхнік самарэгуляцыі. Пры выяўленай — патрэбна іншая стратэгія, аж да накіравання да псіхіятра. Без гэтай зваротнай сувязі дыялог застаецца проста размовай.
Сістэматычны агляд Abd-Alrazaq і калег (2020), апублікаваны ў Journal of Medical Internet Research, прааналізаваў 12 даследаванняў чат-ботаў для ментальнага здароўя. Выснова: боты сапраўды дапамагаюць знізіць сімптомы дэпрэсіі і стрэсу, але большасць з іх не здольныя адаптаваць адказы да бягучага стану карыстальніка. Менавіта гэтую праблему і вырашае MoPHES.
Як уладкаваная MoPHES?
Група даследчыкаў з Кітая (Wei, Zhou, Wang) прапанавала архітэктуру з дзвюх кампактных моўных мадэляў, кожная памерам 0,5 мільярда параметраў. Першая мадэль — ацэначная: яна аналізуе рэплікі карыстальніка і вызначае ўзровень трывогі (4 ступені) і дэпрэсіі (4 ступені). Другая — дыялогавая: яна вядзе размову, абапіраючыся на вынікі ацэнкі.
Ключавы механізм: ацэнка адбываецца кожныя 5 рэплік. Мадэль не чакае, пакуль чалавек пажаліцца — яна сама адсочвае змяненні. Вынікі захоўваюцца лакальна на прыладзе, а не адпраўляюцца на сервер.
Для навучання ацэначнай мадэлі выкарыстоўваўся датасет з 6 046 размечаных узораў. Прыкладна 30% з іх адпавядалі ўмераным узроўням трывогі і дэпрэсіі адначасова — гэта значыць, мадэль навучалася не толькі на крайніх выпадках, але і на самых распаўсюджаных станах.
Наколькі дакладна гэта працуе?
MoPHES на базе MiniCPM4-0.5B паказала дакладнасць 80,5% пры вызначэнні трывогі і 63% пры вызначэнні дэпрэсіі. Для параўнання: DeepSeek-R1-7B (мадэль у 14 разоў большая) дасягнула толькі 59% і 51,5% адпаведна. Qwen2.5-7B — 33% і 51,5%.
Нармалізаваная ацэнка для трывогі ў MoPHES склала 0,927 з 1 — амаль бездакорнае ранжыраванне па ступені цяжкасці. У DeepSeek-R1-7B гэты паказчык — 0,853.
Дэпрэсія аказалася больш складанай задачай. Гэта чаканы вынік: дэпрэсіўныя станы праяўляюцца ў маўленні менш відавочна, чым трывога. Трывожны чалавек часцей гаворыць пра страхі, напружанне, будучыню. Дэпрэсія выяўляецца праз апатыю, запавольванне, пазбяганне — сігналы, якія цяжэй уловіць у тэкставым дыялогу.
Чаму гэта важна менавіта зараз?
Паводле Сусветнага дакладу ВАЗ аб псіхічным здароўі (2022), каля мільярда чалавек у свеце жывуць з псіхічнымі расстройствамі — гэта 13% насельніцтва планеты. Пры гэтым больш за 70% з іх ніколі не атрымліваюць эфектыўнай дапамогі. Праблема не толькі ў нястачы спецыялістаў — многія людзі проста не ведаюць, што маюць патрэбу ў дапамозе, або не могуць ацаніць, наколькі сур'ёзны іх стан.
Тэхналогія, якая ацэньвае стан падчас звычайнай размовы, мяняе саму кропку ўваходу. Чалавеку не трэба запаўняць апытальнік, запісвацца да лекара або прызнаваць, што нешта не так. Дастаткова проста размаўляць.
Што з гэтага вынікае для ШІ-тэрапіі?
MoPHES паказвае, што вылічальныя мадэлі псіхічных станаў могуць быць не проста даследчым інструментам, а часткай рэальнага прадукту. Убудаваная ацэнка дазваляе ШІ-сістэме рабіць тое, што ўжо робяць лічбавыя інструменты для выяўлення дэпрэсіі: заўважаць праблему да таго, як чалавек сам яе ўсвядоміць.
Вядома, 63% дакладнасці для дэпрэсіі — гэта не ўзровень клінічнага інструмента. Але MoPHES працуе на прыладзе карыстальніка, не патрабуе інтэрнэту і захоўвае даныя лакальна. Для скрынінгу — першага набліжэння, а не пастаноўкі дыягназу — гэта сур'ёзны крок наперад.
Важна і тое, што малыя мадэлі аказаліся дакладнейшымі за вялікія. Гэта азначае, што ацэнка псіхічнага стану можа працаваць на смартфоне, без воблачных сервераў і без рызык уцечкі даных — пры ўмове правільнай налады пад канкрэтную задачу.
Падобныя вынікі пацвярджаюць кірунак, у якім рухаюцца і клінічныя выпрабаванні ШІ-тэрапеўтаў: будучыня — не за ўніверсальнымі чат-ботамі, а за сістэмамі, якія разумеюць, з кім размаўляюць. Дадатак «Рядом» развівае менавіта гэты падыход — адаптыўны дыялог, які ўлічвае эмацыйны стан карыстальніка.
Пытанні, якія часта задаюць
Ці можа ШІ паставіць дыягназ «дэпрэсія» або «трывожны расстройства»?
Не. MoPHES і падобныя сістэмы выконваюць скрынінг — папярэднюю ацэнку ўзроўню сімптомаў. Дыягназ ставіць толькі лекар-псіхіятр або клінічны псіхолаг на падставе паўнавартаснага абследавання. ШІ дапамагае заўважыць праблему раней, але не замяняе спецыяліста.
Ці бяспечна захоўванне вынікаў ацэнкі?
У архітэктуры MoPHES усе даныя апрацоўваюцца і захоўваюцца на прыладзе карыстальніка. Нічога не адпраўляецца на знешнія серверы. Гэта прынцыповае адрозненне ад воблачных рашэнняў і адна з галоўных пераваг кампактных мадэляў.
Чаму дакладнасць для дэпрэсіі ніжэйшая, чым для трывогі?
Трывога праяўляецца ў маўленні больш відавочна: чалавек часцей згадвае страх, непакой, напружанне. Дэпрэсія выяўляецца праз зніжэнне актыўнасці, апатыю і пазбяганне — гэтыя прыкметы складаней вылучыць з тэксту. Па меры развіцця мадэляў і назапашвання даных дакладнасць, верагодна, будзе расці.
Калі такія сістэмы з'явяцца ў рэальных дадатках?
Асобныя элементы — адаптыўныя адказы на аснове эмацыйнага стану — ужо выкарыстоўваюцца ў некаторых дадатках для ментальнага здароўя. Паўнавартасная інтэграцыя ацэнкі ў дыялог, як у MoPHES, пакуль застаецца на стадыі даследаванняў, але разрыў паміж лабараторыяй і прадуктам скарачаецца хутка.