ЖИ сөйлесу кезінде психикалық жағдайды бағалай ала ма
2025 жылдың қазанында IEEE-де сипатталған MoPHES жүйесі адаммен сөйлесу кезінде үрей деңгейін анықтайды — дәлдігі 80,5%. Депрессия үшін көрсеткіш төменірек — 63%, бірақ бұл өзінен жеті есе үлкен модельдердің нәтижелерінен асып түседі. Психикалық жағдайды бағалау алғаш рет диалогтың өзіне енгізілді, бөлек тестке шығарылмады.
Неге чат-боттар мұны бұрын істей алмады?
Ментальдік денсаулыққа арналған ЖИ-жүйелердің көпшілігі екі схеманың бірімен жұмыс істейді: не стандартталған сауалнамалар (PHQ-9, GAD-7) беруді, не ешқандай клиникалық бағалаусыз қолдау диалогын жүргізуді. Біріншісі шаршатады және табиғи қарым-қатынасқа сәйкес келмейді. Екіншісі — сөйлеседі, бірақ «естімейді».
Кәсіби психолог олай жұмыс істемейді. Ол клиенттің жағдайын үнемі бағалайды: сөздері, интонациясы, тақырып таңдауы арқылы. Жеңіл үрей кезінде қолдау мен өзін-өзі реттеу техникалары жеткілікті. Айқын белгілер кезінде — басқа стратегия қажет, тіпті психиатрға жіберуге дейін. Бұл кері байланыссыз диалог жай ғана сөйлесу болып қала береді.
Abd-Alrazaq және әріптестерінің (2020) Journal of Medical Internet Research журналында жарияланған жүйелі шолуы ментальдік денсаулыққа арналған 12 чат-бот зерттеуін талдады. Қорытынды: боттар депрессия мен стресс белгілерін азайтуға шынымен көмектеседі, бірақ олардың көпшілігі жауаптарын пайдаланушының ағымдағы жағдайына бейімдей алмайды. MoPHES дәл осы мәселені шешеді.
MoPHES қалай жұмыс істейді?
Қытайлық зерттеушілер тобы (Wei, Zhou, Wang) әрқайсысы 0,5 миллиард параметрлі екі ықшам тілдік модельден тұратын архитектураны ұсынды. Бірінші модель — бағалау моделі: ол пайдаланушының репликаларын талдап, үрей (4 деңгей) мен депрессия (4 деңгей) дәрежесін анықтайды. Екіншісі — диалогтық модель: ол бағалау нәтижелеріне сүйеніп сөйлеседі.
Негізгі механизм: бағалау әрбір 5 репликада жүреді. Модель адамның шағымдануын күтпейді — өзгерістерді өзі бақылайды. Нәтижелер құрылғыда жергілікті сақталады, серверге жіберілмейді.
Бағалау моделін оқыту үшін 6 046 белгіленген үлгіден тұратын деректер жиынтығы пайдаланылды. Олардың шамамен 30%-ы бір мезгілде үрей мен депрессияның орташа деңгейлеріне сәйкес келді — яғни модель тек шеткі жағдайларда ғана емес, ең жиі кездесетін күйлерде де оқытылды.
Бұл қаншалықты дәл жұмыс істейді?
MiniCPM4-0.5B негізіндегі MoPHES үрейді анықтауда 80,5% дәлдік, депрессия бойынша 63% көрсетті. Салыстыру үшін: DeepSeek-R1-7B (14 есе үлкен модель) тек 59% және 51,5%-ға жетті. Qwen2.5-7B — 33% және 51,5%.
MoPHES-тің үрей бойынша нормаланған бағасы 1-ден 0,927 құрады — ауырлық дәрежесін дерлік қатесіз ранжирлеу. DeepSeek-R1-7B-дің бұл көрсеткіші — 0,853.
Депрессия күрделірек тапсырма болып шықты. Бұл күтілген нәтиже: депрессиялық күйлер сөйлеуде үрейге қарағанда анық емес көрінеді. Үрейленген адам қорқыныш, шиеленіс, болашақ туралы жиірек сөйлейді. Депрессия апатия, баяулау, жалтару арқылы білінеді — мәтіндік диалогта оларды анықтау қиынырақ.
Неге бұл дәл қазір маңызды?
ДДҰ-ның психикалық денсаулық туралы Бүкіләлемдік баяндамасына (2022) сәйкес, әлемде шамамен бір миллиард адам психикалық бұзылыстармен өмір сүреді — бұл планета халқының 13%-ы. Оның үстіне, олардың 70%-дан астамы тиімді көмек ешқашан алмайды. Мәселе тек мамандардың жетіспеушілігінде емес — көптеген адамдар көмекке мұқтаж екенін білмейді немесе жағдайының қаншалықты маңызды екенін бағалай алмайды.
Қарапайым сөйлесу кезінде жағдайды бағалайтын технология кіру нүктесін өзгертеді. Адамға сауалнама толтырудың, дәрігерге жазылудың немесе бірдеңе дұрыс емес екенін мойындаудың қажеті жоқ. Жай ғана сөйлесу жеткілікті.
Бұл ЖИ-терапия үшін нені білдіреді?
MoPHES психикалық күйлердің есептеу модельдерінің тек зерттеу құралы ғана емес, нақты өнімнің бөлігі бола алатынын көрсетеді. Кіріктірілген бағалау ЖИ-жүйеге депрессияны анықтауға арналған цифрлық құралдардың жасап жатқанын жасауға мүмкіндік береді: мәселені адамның өзі сезінгенге дейін байқау.
Әрине, депрессия бойынша 63% дәлдік — бұл клиникалық құрал деңгейі емес. Бірақ MoPHES пайдаланушының құрылғысында жұмыс істейді, интернетті қажет етпейді және деректерді жергілікті сақтайды. Скрининг үшін — бірінші жуықтау, диагноз қою емес — бұл маңызды қадам.
Кіші модельдердің ірілерден дәлірек болғаны да маңызды. Бұл психикалық жағдайды бағалау смартфонда, бұлтты серверлерсіз және деректер ағып кету қаупінсіз жұмыс істей алатынын білдіреді — модель нақты тапсырмаға дұрыс баптау шартымен.
Мұндай нәтижелер ЖИ-терапевттердің клиникалық сынақтарының бағытын растайды: болашақ — әмбебап чат-боттарда емес, кіммен сөйлесіп отырғанын түсінетін жүйелерде. «Рядом» қосымшасы дәл осы тәсілді дамытуда — пайдаланушының эмоциялық жағдайын ескеретін бейімді диалог.
Жиі қойылатын сұрақтар
ЖИ «депрессия» немесе «үрей бұзылысы» диагнозын қоя ала ма?
Жоқ. MoPHES және ұқсас жүйелер скрининг жүргізеді — симптомдар деңгейін алдын ала бағалау. Диагнозды тек дәрігер-психиатр немесе клиникалық психолог толық тексеру негізінде қояды. ЖИ мәселені ертерек байқауға көмектеседі, бірақ маманды алмастырмайды.
Бағалау нәтижелерін сақтау қауіпсіз бе?
MoPHES архитектурасында барлық деректер пайдаланушының құрылғысында өңделеді және сақталады. Сыртқы серверлерге ештеңе жіберілмейді. Бұл бұлтты шешімдерден түбегейлі айырмашылық және ықшам модельдердің басты артықшылықтарының бірі.
Неге депрессия бойынша дәлдік үрейге қарағанда төмен?
Үрей сөйлеуде айқынырақ көрінеді: адам қорқыныш, алаңдаушылық, шиеленіс туралы жиірек айтады. Депрессия белсенділіктің төмендеуі, апатия мен жалтару арқылы білінеді — бұл белгілерді мәтіннен бөліп алу қиынырақ. Модельдер дамып, деректер жинақталған сайын дәлдік артуы мүмкін.
Мұндай жүйелер нақты қосымшаларда қашан пайда болады?
Жекелеген элементтер — эмоциялық жағдайға негізделген бейімді жауаптар — кейбір ментальдік денсаулыққа арналған қосымшаларда қазірдің өзінде қолданылады. MoPHES сияқты диалогқа бағалауды толық интеграциялау әзірге зерттеу сатысында, бірақ зертхана мен өнім арасындағы алшақтық тез қысқаруда.