Если прямо сейчас вы думаете о суициде или самоповреждении, пожалуйста, обратитесь к человеку. Немедленно свяжитесь с местными экстренными службами или кризисной линией и скажите тому, кому доверяете. Эта статья — о технологии распознавания риска; она не является кризисной службой и не может помочь в экстренной ситуации. Обученные люди — могут, и они доступны.

Психиатры давно знают неудобную правду: традиционные шкалы суицидального риска работают лишь чуть лучше случайности. Мета-анализ 365 исследований за 50 лет (Franklin et al., 2017) показал, что предсказательная сила классических факторов риска близка к AUC 0.58 — почти бесполезна для реальных клинических решений. Именно эта неудача толкнула исследователей к машинному обучению и обработке естественного языка.

Как текст выдаёт суицидальный риск

Суицидальные мысли оставляют след не столько в словах «я хочу умереть», сколько в структуре речи. Исследования группы John Pestian в Детской больнице Цинциннати показали, что модели, обученные на транскриптах интервью, отличают суицидальных подростков от несуицидальных с точностью около 85% — не полагаясь на прямые заявления, а на паттерны: сниженную когнитивную сложность, рост абсолютистских формулировок («всегда», «никогда»), сужающийся временной горизонт, сдвиг местоимений к «я» в сочетании с эмоциональной диссоциацией.

Al-Mosaiwi и Johnstone (2018) проанализировали свыше 6 400 постов на англоязычных форумах и обнаружили, что доля абсолютистских слов в сообществах о депрессии и тревоге была на 50% выше, чем в контроле, — и на 80% выше в сообществах, сфокусированных на суицидальных мыслях. Это сигнал, который трудно уловить на слух, но легко измерить статистически. Смежные NLP-работы по клиническому тексту показывают, как далеко это зашло: Tauscher и коллеги (2023, Psychiatric Services) применили дообученную модель BERT к сообщениям между пациентами с тяжёлыми психическими расстройствами и клиницистами и достигли F1 = 0.62 — фактически на уровне человеческих рейтеров (0.63).

На масштабе цифры ещё выразительнее. Walsh, Ribeiro и Franklin (2017) обучили модель на электронных медицинских записях 5 167 пациентов и достигли AUC 0.84 для предсказания суицидальной попытки в ближайшие 7 дней — намного выше любой клинической шкалы. Похожие результаты дают данные соцсетей: ежегодные соревнования CLPsych используют посты Reddit (сабреддит SuicideWatch) как размеченный корпус, и лучшие системы достигают F1 0.55–0.60 в классификации уровня риска. С 2017 года Facebook развернул систему, выявляющую суицидальные сигналы в постах и трансляциях; по данным самой компании, за первый год она инициировала более 3 500 проверок благополучия, а Instagram и TikTok выпустили похожие алгоритмы. В 2023 году JAMA Psychiatry опубликовал систематический обзор 54 ML-исследований: средний AUC составил 0.81, что делает NLP самым точным известным методом краткосрочного прогноза.

От детекции к интервенции

Выявить риск полезно, только если дальше происходит что-то помогающее, и это «дальше» — отдельное поле исследований. Фреймворк называется адаптивной интервенцией «точно в нужный момент» (JITAI) и определён Nahum-Shani и коллегами (2018, Annals of Behavioral Medicine): интервенция, спроектированная давать нужный тип и объём поддержки в нужный момент, адаптируясь к меняющемуся состоянию человека. У JITAI шесть компонентов — дистальный исход, проксимальный исход, точки принятия решений, варианты интервенции, настроечные переменные и правила решений, — вместе образующие замкнутый контур: уловить сигнал, решить, действовать, наблюдать результат, скорректировать.

Thomas Insel уловил амбицию метафорой: непрерывный мониторинг как «пожарная сигнализация» для психического здоровья — раннее предупреждение, дающее время действовать. Но честное состояние доказательств скромно. Мета-анализ 2025 года в BMJ Open (K = 23 исследования, N = 2 563) обнаружил лишь малый эффект JITAI (g = 0.15), а систематический обзор в Frontiers in Digital Health (2025) насчитал всего пять полностью реализованных JITAI для психического здоровья. Контур реален и перспективен, но он ранний, а скачок от «мы что-то обнаружили» к «мы помогли» — как раз там, где наука наиболее тонка. Мы подробнее разбираем идею замкнутого контура в материале об интервенциях «точно в нужный момент» в ИИ-поддержке кризиса.

Ложные срабатывания и цена ошибок

Высокая точность — лишь половина истории. Базовая частота суицидальных попыток так низка, что даже модель с чувствительностью 90% и специфичностью 90% даст десятки ложных срабатываний на каждый истинный случай в популяции. Это не изъян алгоритма — это математика редких событий, и никакая настройка модели её не устраняет. Каждая система, отмечающая риск, должна выбрать точку на компромиссе чувствительность–специфичность, и оба направления чего-то стоят: пропустить реальные кризисы или утопить реальные в ложных тревогах.

Быстрая иллюстрация делает проблему конкретной. Допустим, 1 из 1 000 человек за неделю в подлинном остром риске. Запустите модель на 100 000 человек — и она верно отметит большинство из ~100 истинных случаев, но 10% из ~99 900 остальных тоже будут отмечены, что даёт почти 10 000 ложных тревог. На каждый реальный кризис — примерно сотня ошибочно помеченных людей. Именно это соотношение делает автоматический ответ с высокими ставками на сырой флаг таким опасным и делает выбор порога этическим решением, а не только техническим.

Отсюда — практический вред. Во-первых, стигма: ложная метка «высокий риск» в медицинской записи может повлиять на страховку, трудоустройство, родительские права. Во-вторых, культурные слепые зоны: почти все обучающие корпуса — от англоязычных пациентов в США и Великобритании, и модели плохо переносятся на другие языки и культурные идиомы дистресса. В-третьих, сдвиг распределения: паттерны выражения меняются со временем, и модель, обученная в 2019 году, к 2024-му может быть плохо откалибрована.

Есть и более глубокий вопрос, на который не отвечает ни одна цифра точности: даже идеальный детектор не решает, что делать с сигналом. Вызвать экстренные службы без согласия? Показать баннер с номером линии помощи? Уведомить близкого? Каждый выбор несёт свою этическую цену, а исследований о том, какие интервенции реально снижают риск после детекции, всё ещё мало. Детектор, срабатывающий без продуманного гуманного плана ответа, может причинить больше вреда, чем пользы.

Что делают ответственные продукты

Когда инструмент работает с человеком в уязвимом состоянии, детекция риска — не функция, которую можно включить и забыть. Это обязательство: слушать внимательнее, отвечать осторожнее, признавать пределы собственной компетенции и передавать человека обученным людям, когда сигналы переходят порог. Ответственный ИИ-компаньон не конкурирует с кризисной линией — он помогает вовремя до неё добраться и честен в том, что он программа, а не клиницист. Более широкий набор механизмов безопасности, отличающих аккуратный продукт от сырого чат-бота — детекция кризиса, эскалация к человеку, честное обрамление, — тема нашего руководства по гардрейлам для ИИ в психическом здоровье.

Часть наиболее убедительных данных указывает на то, что ИИ ассистирует людям-респондентам, а не заменяет их. Система HAILEY (Sharma et al., 2020, 2023) находится в контуре платформы взаимной поддержки, предлагая правки к сообщениям волонтёров, а не говоря с людьми в дистрессе напрямую. В рандомизированном исследовании она повысила выраженную эмпатию консультантов на 19.6% в целом и на 38.9% среди тех, кто справлялся хуже всего. Именно этот паттерн стоит целить: машина ловит сигналы и оттачивает человеческий ответ, а решение остаётся в руках человека. Детекция без этого человеческого якоря — как раз та часть, что идёт не так.

Технология способна уловить то, что ускользает от самого человека. Но что делать с уловленным — остаётся решением, в котором должен участвовать человек.

FAQ

Может ли ИИ выявить суицидальные мысли?

В значимой степени да — лучше традиционных опросников. NLP-модели улавливают структурные паттерны в языке (абсолютистские слова, сужающийся временной горизонт, сдвиги местоимений) и достигают среднего AUC около 0.81 по десяткам исследований против примерно 0.58 у классических шкал риска. Но «выявить статистический сигнал» — не то же, что «знать, что конкретный человек в опасности». Это скрининговые инструменты, поднимающие флаг, а не оракулы, ставящие диагноз.

Что происходит, когда ИИ отмечает риск кризиса?

Это целиком зависит от продукта, и это самый важный вопрос. Ответственная система трактует флаг как повод отвечать осторожнее и вывести реальную помощь — кризисную линию, экстренный номер, доверенного человека, — а не как основание действовать в одностороннем порядке. Поскольку на уровне популяции ложные срабатывания многократно превосходят истинные кризисы, автоматический ответ вроде вызова служб без согласия сам может причинить вред. Правильный дизайн держит человека в контуре и направляет к обученной помощи.

Напоминание: если вы или кто-то из ваших близких в кризисе, свяжитесь с местными экстренными службами или кризисной линией прямо сейчас. ИИ может помочь заметить проблему — но не может быть самой помощью. Важнее всего — добраться до обученного человека.

«Рядом» — инструмент поддержки, использующий принципы доказательной психологии. Он не заменяет психолога, психотерапевта, психиатра или экстренную службу.