Почему я не доверяю нейросетям. Где они ошибаются и как это может навредить

*К сожалению, у нейронок не растет нос, когда они врут.*

Сейчас уже почти все привыкли к нейросетям, но есть в них одна коварная особенность, о которой многие не задумываются, считая, что технологии уже дошли до точки, в которой им можно безоговорочно доверять. Дело в том, что они отвечают одинаково уверенно и когда правы, и когда на голубом глазу несут полную чушь. Никакого «эээ, я не уверен» или «дайте подумать». Вместо этого почти любая модель просто дает готовый ответ и даже не предупреждает, что в нем может быть ошибка. Мы уже привыкли скармливать ИИ все подряд: от рабочих писем до подбора комплектующих своего ПК. И тут надо ответить самому себе честно. Как часто вы проверяете их ответы? Важно понимать, что уверенная ошибка опаснее очевидной, ведь ее легко не заметить и утащить в работу. Сейчас разберемся, откуда берутся эти ошибки и как ловить их за руку.

Почему нейросети ошибаются

Начать стоит с основ. Языковая модель — это не волшебная палочка, и она не хранит факты как база данных. А еще она не понимает исходные данные как человек. В основе лежит принцип предсказания следующего слова. То есть, нейронка строит ответ так, что каждое последующее слово является наиболее вероятным на основе гигантского массива текстов, на которых ее обучали.

Это такое умное автодополнение, а не ответ системы, которая разбирается во всем. Чаще всего вероятное слово оказывается правильным, ведь модель видела миллионы похожих предложений. Вот только встроенного и надежного механизма проверки нет. Именно поэтому, когда данных или возможностей их обработки не хватает, она все равно достроит ответ. Он будет гладким, связным и абсолютно убедительным.

*В истории нейронки разбираются хорошо, в гаджетах тоже. Но могут с полной уверенностью смешать это воедино.*

Это можно сравнить с другом, который есть почти у всех. Он знает минимум, но почти из каждой сферы и поэтому в разговоре всегда кажется, что он разбирается во всем. Но если копнуть чуть глубже, сразу становится понятно, что кроме пары умных слов и способа их связать у него ничего нет.

Что такое галлюцинации в нейросетях и откуда они берутся

Теперь про галлюцинации. Это самый известный тип ошибок. Так называют ситуацию, когда модель выдумывает то, чего не существует. Это может быть несуществующая цитата, ссылка на статью, которой нет, кривые характеристики, выдуманная модель видеокарты и тому подобное.

Самое главное, что встречается это часто, а выдается тем же ровным уверенным тоном, что и истинная информация. Они берутся из того самого механизма, который мы рассмотрели выше. Модель просто заполняет пробел самым правдоподобным вариантом. Даже если ее просят сослаться на источник, которого у нее на самом деле нет, она создаст ссылку, которая выглядит как настоящая, но не будет никуда вести. Хорошо хоть таким способом ее можно довольно легко проверить.

Нейросеть выдает старые данные

Еще одна причина ошибок — устаревшие данные. И сейчас я говорю не о том, что нейронке скормили протухшую информацию. У каждой модели есть дата, на которой обучение закончилось. Все, что случилось после нее, для нейросети просто не существует.

То есть, про времена Петра Первого почти любая нейронка ответит хорошо, а вот в новых моделях она может путаться и, как мы только что поняли, додумывать их и их характеристики. Особенно если спросить ее не «вышел ли iPhone 27», а «расскажи про iPhone 27». Для нее такая уверенность является знаком, что такой смартфон существует, и надо что-то про него рассказать.

*Вот как Claude 4.8 Max описывает iPhone 27. Согласитесь, получилось что-то среднее между iPhone 7 и iPhone 17*

В некоторых случаях модель растеряется и скажет об этом, но в большом количестве случаев может уверенно рассказать про прошлое поколение как про новое, подмешав туда слухов и другой ереси.

Особенно коварно это с ценами и характеристиками. Железо дешевеет (хотя и не все), спецификации уточняются, а новинки выходят каждый месяц. При этом модель без тени сомнения назовет вам цифры годичной давности. На практике именно устаревшие данные подводят чаще галлюцинаций, хотя часто являются причиной их появления. Главное, что такой ответ все равно легко принять за верный, но он уже будет неактуальным.

Как проверить ответ нейросети на правильность

Хорошая новость в том, что вычислить ошибку проще, чем может показаться. Главное понимать, как работают нейронки, и относиться к нейросетям как к исполнительному, но туповатому работнику в вашем подчинении. За таким работником надо все проверять самому, хотя бы поверхностно. Иногда нейросеть и сама неплохо ловит чужие огрехи. Мы скормили ей сотню сборок ПК с Хабра, и проблемы нашлись почти в каждой второй.

Тут надо завести всего несколько привычек. Во-первых, любой важный факт (цифру, цитату, характеристику) надо сверять с первоисточником, или хотя бы просить саму нейронку ее перепроверить и дать ссылку на источник. Пусть хотя бы этот источник существует.

Во-вторых, числа и расчеты пересчитывайте руками. Арифметика у моделей хромает чаще, чем хотелось бы. А в-третьих, не ведитесь на уверенный тон. Уверенность модели не означает вообще ничего. Она выглядит убедительной и когда права, и когда несет полный бред. Как говорится в известной цитате: «если несешь чушь — делай это уверенно. Тогда это будет считаться точкой зрения».

Есть и хитрый прием для проверки самой модели. Задайте ей вопрос из какой-то узкой темы, в которой точно разбираетесь сами. Посмотрите, как она держится на знакомой вам территории. И сразу станет понятно, насколько ей можно доверять на незнакомой. Это не стопроцентный способ, но для проверки можно использовать и его.

Стоит ли доверять нейросетям

Все сказанное не означает, что надо перестать пользоваться нейронками. Сейчас это невозможно, и я сам ими пользуюсь в своей работе. Нейросеть — это отличный инструмент, который экономит часы на черновиках, поиске, рутине и идеях. Но это именно инструмент, а не истина в последней инстанции. Ей нельзя как оракулу верить на слово, а надо всегда проверять то, что она говорит, и держать ее под контролем.

Я сам проверяю почти все сказанное нейронками, кроме того, в чем сам полностью уверен, не потому что не доверяю в принципе, а потому что цена уверенной ошибки бывает слишком высокой. Я всегда помню одну вещь, и этого почти достаточно: модель никогда не скажет «я не знаю». Понять, знает ли она на самом деле, надо именно вам.

ссылка на оригинал статьи https://habr.com/ru/articles/1048108/