Кішкентай ЖИ-модель психотерапияда алпауыттарды қалай басып озды
500 миллион параметрлі модель терапиялық диалогтарда ROUGE-1 метрикасы бойынша GPT-4.1-ді басып озды — 41,32 қарсы 40,04. Бұл IEEE-де 2025 жылдың қазан айында жарияланған MoPHES зерттеуінің нәтижесі. Авторлар — Вэй, Чжоу және Ван — психологиялық қолдауда модель көлемі емес, оқыту деректерінің сапасы маңызды екенін көрсетті.
MoPHES дегеніміз не?
MoPHES (Mobile Psychological Health Evaluation and Support) — көп қадамды терапиялық диалогтар жүргізу үшін арнайы дәл бапталған MiniCPM4-0.5B тілдік моделіне негізделген жүйе. Түйінді сөз — «арнайы». Зерттеушілер алып модельді бәріне бірдей үйретудің орнына, шағын модельді алып, оны мұқият іріктелген психологиялық кеңестер корпусында дәл баптады.
Корпус екі қытай деректер жинағынан — PsyQA және EmoLLM-ден жиналды. Бастапқы 113 552 «сұрақ-жауап» жұбы сүзіліп, нақты кеңестерді имитациялайтын 34 827 көп қадамды диалогқа түрлендірілді. Тақырыптар: отбасы мен неке (50,6%), эмоциялық мәселелер (24,7%), тұлғалық даму (13,4%).
Неліктен кішкентай модель үлкенін басып озады?
ChatGPT және GPT-4.1 сияқты әмбебап модельдер интернеттен алынған триллиондаған токендерге оқытылған. Олар бәрін біледі — бірақ ештеңені терең білмейді. Психологиялық контексте бұл нақты көрінеді: олар тыңдаудың орнына кеңес береді, бірдей тұжырымдарды қайталайды, ұзақ әңгімелерде эмоциялық контексті нашар ұстайды.
Дәл бапталған MiniCPM4-0.5B басқаша — энциклопедия емес, кеңесші сияқты әрекет етуді үйренді. ROUGE-1 метрикасы бойынша ол label стратегиясында 41,32 балл жинады, ал GPT-4.1 — 40,04. Бұл кішкентай модельдің жауаптары мазмұны мен лексикасы бойынша эталондық терапиялық репликаларға дәлірек сәйкес келгенін білдіреді.
Қолмен жүргізілген сараптамалық бағалауда — түсіну, эмпатия, кәсібилік, пайдалылық және қауіпсіздік бойынша — MoPHES label стратегиясында 10 балдан 7,204 жинады. GPT-4.1 — 8,685. Алшақтық бар, бірақ MoPHES барлық коммерциялық емес модельдер арасында үздік болды. GPT-4.1 миллиардтаған доллар бюджеті бар өнім екенін ескерсек, 0,5B-модельдің нәтижесі таңғаларлық.
Неліктен «ойлайтын» модельдер сәтсіздікке ұшырады?
Зерттеудің ең күтпеген нәтижесі: логикалық пайымдау үшін оңтайландырылған DeepSeek-R1-7B моделі барлық тексерілген жүйелер арасында ең нашар нәтиже көрсетті. Бұл интуицияға қайшы: «пайымдаушы» модель клиенттің мәселесін жақсырақ талдауы тиіс сияқты.
Бірақ терапия — логикалық есеп емес. Өз жан азабын айтып отырған адамға жағдайды қадаммен талдау қажет емес. Оған тыңдалу қажет. Пайымдау тізбектеріне бейімделген модельдер қолдау көрсетудің орнына сөзбе-сөз «дауыстап ойлайды». Олар дұрыс жауап табуға оңтайландырылған — ал терапияда дұрыс жауап жиі болмайды.
Бұл ЖИ-терапияның болашағы үшін нені білдіреді?
Есте сақтауға тұрарлық бірнеше қорытынды.
Қолжетімділік. MoPHES бір A100 GPU-да оқытылды. Бұл суперкомпьютер емес — бұл бұлтта сағатына ондаған долларға қолжетімді стандартты жабдық. Егер сапалы терапиялық модельді Google деңгейіндегі инфрақұрылымсыз жасауға болатын болса, психикалық денсаулық сервистерін әзірлеушілер үшін кіру табалдырығы күрт төмендейді.
Құпиялылық. 500 миллион параметрлі модель деректерді серверге жібермей-ақ тікелей смартфонда жұмыс істей алады. Психологиялық қолдау үшін бұл аса маңызды: адамдар сөздері бұлтқа кетпейтініне сенімді болғанда көбірек көмек сұрайды.
Мамандандыру масштабтан маңыздырақ. Соңғы жылдардағы зерттеулер — SMILE, MeChat (2023), SoulChat (2023) — терапиялық модельдерді оқыту үшін синтетикалық және курацияланған деректер жинақтарының күшті нәтижелер беретінін көрсеткен болатын. MoPHES трендті растады: тар мамандандыру әмбебаптылықты жеңеді.
Шекара қайда?
Прогресті дайындықпен шатастырмау маңызды. MoPHES қытай тіліндегі деректерде оқытылды — басқа тілдер мен мәдени контекстерге ауыстыру жеке жұмысты қажет етеді. Қолмен бағалау эмпатия мен кәсібилік бойынша әлі де коммерциялық модельдерге басымдық береді. Тексерілген жүйелердің ешқайсысы клиникалық сынақтардан өткен жоқ — депрессия белгілерін 51%-ға азайтқан Therabot-тан айырмашылығы осы.
ДДҰ деректері бойынша (2022), әлемде әрбір сегізінші адам психикалық бұзылыспен өмір сүреді, ал табысы төмен елдердегі адамдардың 75%-ы ешқандай көмек алмайды. Шағын мамандандырылған модельдер — бұл алшақтықты жоюдың нақты жолдарының бірі.
«Рядом» жобасы дәл осы логикаға сүйенеді: модель көлемін қуламай, контексті түсінетін, эмпатияны ұстайтын және дәлелді тәсілдер аясында жұмыс істейтін қолдау жүйесін құру.
Жиі қойылатын сұрақтар
500 млн параметрлі ЖИ-модель тірі психотерапевтті алмастыра ала ма? Жоқ. MoPHES және ұқсас жүйелер — бұл қолдау құралы, маманды алмастырушы емес. Олар сеанстар аралығында, терапевтке қолжетімсіз аймақтарда немесе адамға жүгінуге әлі дайын емес адамдар үшін алғашқы қадам ретінде көмектесе алады.
Модельдің кішкентай болуы неліктен маңызды? Шағын модельдер интернетке қосылмай-ақ — телефонда немесе ноутбукте — жергілікті жұмыс істей алады. Бұл құпиялылықты қорғайды және желі қамтуы нашар аймақтарда да көмекті қолжетімді етеді.
Дәл бапталған модель «терапевт» рөліндегі ChatGPT-ден неімен ерекшеленеді? ChatGPT және GPT-4.1 — промпт арқылы сұранысқа бейімделетін әмбебап модельдер. MoPHES сияқты дәл бапталған модель ондаған мың нақты терапиялық диалогта оқытылып, кәсіби қолдау паттерндерін: белсенді тыңдауды, эмоцияларды растауды, сеанс құрылымын меңгерді. Терапиядағы LLM мүмкіндіктері мен тәуекелдері туралы толығырақ — ChatGPT терапевт ретінде: мүмкіндіктер мен тәуекелдер мақаласында.
Есептеу психиатриясы дегеніміз не және ол ЖИ-терапиямен қалай байланысты? Есептеу психиатриясы психикалық бұзылыстарды түсіну үшін математикалық модельдерді пайдаланады. ЖИ-терапия — оның практикалық қолданбаларының бірі: клиникалық деректерде оқытылған модельдер осы принциптерді адамдарды нақты уақытта қолдау үшін қолданады.