Психолог в кармане: зачем запускать ИИ-терапевта прямо на телефоне
Языковая модель размером 280 мегабайт, запущенная прямо на Android-смартфоне, способна вести терапевтический диалог со скоростью 17 токенов в секунду — и при этом ни один байт информации не покидает устройство. Это не концепт и не слайд на конференции: такую систему — MoPHES — создали исследователи Вэй, Чжоу и Ван и описали в журнале IEEE в 2025 году.
Почему приватность — центральная проблема цифровой терапии?
По данным ВОЗ, более 70% людей с ментальными расстройствами так и не обращаются за помощью. Среди причин — стигма и страх, что личная информация утечёт. Этот страх обоснован: даже в научных исследованиях этические комитеты запрещают передавать реальные данные терапевтических сессий для анализа. Если приватность невозможно гарантировать в лабораторных условиях — что говорить о массовых приложениях?
Традиционные онлайн-сервисы психологической поддержки, включая чат-ботов, показавших эффективность в клинических испытаниях, работают через облако. Каждое сообщение уходит на удалённый сервер, обрабатывается и возвращается. Даже при сквозном шифровании данные где-то хранятся — и теоретически могут быть скомпрометированы.
Что такое on-device модель и как она работает?
On-device означает буквально: модель работает на вашем телефоне. Нет сервера, нет облака, нет интернет-соединения. MoPHES использует два компактных языковых модуля по 0,5 миллиарда параметров каждый, запущенных через фреймворк llama.cpp. После квантизации Q4_K_M каждая модель занимает около 280 МБ — меньше, чем средняя мобильная игра.
На тестовом устройстве Xiaomi 13 Ultra (8 ядер, 16 ГБ оперативной памяти) система генерирует ответы в диалоге со скоростью 17,3 токена в секунду. Оценка психического состояния занимает 4,2 секунды. Это комфортная скорость — пользователь не чувствует задержки.
Зачем нужны два модуля вместо одного?
Архитектура MoPHES разделяет задачи. Один модуль ведёт диалог — отвечает на реплики пользователя, задаёт уточняющие вопросы, использует техники поддерживающего общения. Второй модуль работает как аналитик: он оценивает психическое состояние по ходу беседы и сохраняет результаты в локальный конфигурационный файл на устройстве.
Это разделение важно: диалоговая модель может быть эмпатичной и свободной в формулировках, тогда как аналитическая — строгой и структурированной. Агент извлекает историю предыдущих сессий из локальной памяти, чтобы персонализировать каждый следующий разговор. Всё это — без единого обращения к серверу.
Что это значит для почти миллиарда людей?
По оценкам ВОЗ, почти миллиард человек в мире нуждается в поддержке психического здоровья. Большинство из них не получает помощи — из-за нехватки специалистов, стоимости терапии, географической удалённости или страха осуждения. Чат-боты для ментального здоровья уже доказали свою эффективность как минимум при лёгких и умеренных симптомах (Abd-Alrazaq и др., 2020).
Но доверие остаётся узким местом. Исследование Song и коллег (2024) показало: пользователи готовы открываться ИИ-собеседнику, но только если уверены, что их слова не будут прочитаны третьей стороной. On-device модели снимают этот барьер технически, а не юридически — данные просто физически не покидают устройство.
Какие ограничения есть у on-device подхода?
Было бы нечестно умолчать о границах. Модели в 0,5 миллиарда параметров значительно уступают облачным аналогам по глубине и гибкости ответов. Они хорошо справляются со структурированными задачами — скрининг, поддерживающий диалог по протоколу — но для сложной психотерапевтической работы их пока недостаточно.
Кроме того, не все смартфоны имеют 16 ГБ оперативной памяти. Для массового распространения нужны ещё более компактные модели или гибридный подход: базовые функции на устройстве, а расширенные — в облаке с согласия пользователя. Важно также помнить, что цифровые инструменты мониторинга поднимают собственные вопросы о границах сбора данных.
Что дальше?
MoPHES — первая полностью автономная система ИИ-поддержки психического здоровья, работающая на мобильном устройстве. Она демонстрирует, что приватность и доступность не обязаны противоречить друг другу. По мере развития технологий квантизации и оптимизации мобильных чипов on-device модели станут ещё компактнее и точнее.
Уже сейчас сервисы вроде «Рядом» используют доказательные подходы к поддержке ментального здоровья. А по мере того как этические стандарты ИИ в психотерапии становятся яснее, граница между лабораторным экспериментом и повседневным инструментом заботы о себе продолжает стираться.
Часто задаваемые вопросы
Может ли ИИ на телефоне заменить психотерапевта?
Нет. On-device модели подходят для поддерживающего диалога, скрининга и мониторинга состояния, но не для полноценной психотерапии. Они дополняют, а не заменяют работу с живым специалистом.
Насколько точны компактные модели по сравнению с GPT-4 и подобными?
Модели в 0,5 миллиарда параметров заметно уступают крупным облачным моделям в генерации свободного текста. Однако для узких задач — структурированная оценка настроения, поддерживающие ответы по протоколу — их точность достаточна для практического применения.
Правда ли, что данные вообще никуда не отправляются?
В архитектуре MoPHES — да. Модель работает полностью офлайн, все записи хранятся локально. Однако каждое конкретное приложение может реализовать эту архитектуру по-разному, поэтому всегда стоит проверять политику конфиденциальности сервиса.
Какой смартфон нужен для запуска такой модели?
Исследователи тестировали на Xiaomi 13 Ultra с 16 ГБ оперативной памяти. Для комфортной работы желательно устройство с 8+ ГБ RAM и современным процессором. По мере оптимизации моделей требования будут снижаться.