
Белый дом и Anthropic совместно работают над методикой, которая позволит оценивать серьезность уязвимостей в новых ИИ-моделях и определять, когда государство вправе вмешаться. Об этом сообщает Politico со ссылкой на двух чиновников администрации. Спор вокруг блокировки самых мощных моделей компании, похоже, перерастает из частного конфликта в попытку задать общие правила.
Поводом стал экспортный контроль, который вынудил Anthropic отключить Fable 5 и Mythos 5 для всех пользователей из-за так называемого джейлбрейка — найденного способа обойти защиту модели. Администрация и гендиректор Anthropic Дарио Амодеи разошлись в оценке того, насколько эта дыра серьезна, — и выяснилось, что у государства попросту нет инструментов, чтобы такие споры разрешать. Технологии обогнали регуляторную инфраструктуру.
Новый фреймворк как раз должен закрыть этот пробел. Стороны вырабатывают единый набор бенчмарков для оценки будущих джейлбрейков: насколько глубоко обойдена защита, какие возможности модели при этом вскрываются и каковы практические последствия взлома. Со стороны Anthropic переговоры ведут руководитель по связям с органами власти Сара Хек и сооснователь компании Том Браун.
Подход примечателен тем, что встраивает в правила исходный аргумент самой Anthropic: полностью неуязвимой к взлому модели не существует. Одновременно администрация получает то, чего ей не хватало, — стандартную шкалу и формальное основание для вмешательства. Похожую мысль на этой неделе озвучивали и на встречах G7 во Франции: руководители ведущих ИИ-компаний и лидеры стран сходились на том, что задавать правила оценки рисков должно государство.
Сами экспортные ограничения пока не сняты, но сдвиг очевиден. Еще в пятницу переговоры фактически развалились: Anthropic отказалась снимать Fable 5 с публичного, настаивая, что уязвимость узкая и на полноценную брешь не тянет. В ответ Белый дом и ввел экспортный контроль. За выходные стороны провели серию долгих созвонов — с участием Тома Брауна, министра торговли Говарда Латника и кибердиректора Шона Кэрнкросса, — а затем почти неделю встречались уже очно в Вашингтоне. Сроков возврата моделей по-прежнему нет.
P.S. Поддержать меня можно подпиской на канал «сбежавшая нейросеть», где я рассказываю про ИИ с творческой стороны.
ссылка на оригинал статьи https://habr.com/ru/articles/1049310/