
В одном из кампусов Массачусетского техинститута в 1966 году стали происходить очень странные дела. У дверей одной из лабораторий начали собираться стайки студенток и лаборанток, которым очень нужно было попасть внутрь хотя бы на 10 минут.
Нет, там не крутили только xnj вышедший битловский “Revolver”. Приманка для прекрасного пола была несколько технологичней: внутри располагался первый в истории созданный человеком чатбот. Его, а вернее её, звали ELIZA и она умела пленять собеседников не хуже античной сирены.
И это пугало ее создателя.
Бабушка ChatGPT
К началу 1960-х Джозеф Вейценбаум (1923 — 2008) был заметной личностью в MIT, но “звездного” статуса пока еще не имел. Сын еврейских эмигрантов, сбежавших от нацистов в Америку, он успел поработать военным метеорологом, а после принял участие в разработке системы ERMA для Дженерал Электрик. Это был бухгалтерский суперкомпьютер, ставший прообразом современных ERP.
К тому моменту когда Вейценбаум пришел в МИТ, Марвином Минским была предложена остроумная модель доступа к вычислительным мощностям института: таймшер. То есть несколько юзеров могут коннектиться к компьютеру одновременно, при этом физически будучи в разных местах. Так был дан старт систематической разработке ИИ, а заодно и появился прообраз интернета, на тот момент пилившийся под эгидой ARPA.
Профессор Вейценбаум был заинтригован такой возможностью и приступил к работе над невиданным доселе проектом: компьютер, который мог бы разговаривать с людьми на понятном, человеческом языке. Но как претворить такую алхимию в жизнь?
За основу для скрипта Вейценбаум берет роджерсовскую терапию, также известную как “клиенто-центрированная психотерапия” (КЦП). Ее суть заключается в том, что психотерапевт принимает пациента без оценочных суждений и через недирективный метод помогает раскрыть душевные проблемы с помощью участливого слушания и наводящих вопросов.
Но как это все перевести в код?
Код Für ELISE
Итак, технически стесненный Вейценбаум находит выход следующим образом: чтобы программа, нареченная ЭЛИЗой, могла вести “осмысленный диалог”, ее логику нужно поместить меж двух ключевых компонентов:
-
Поиска ключевых слов (keyword spotting). ЭЛИЗа разбирала фразу пользователя пословно и искала ключевые слова из встроенного вокабуляра: «отец», «мама», «болит», «ненавижу», “грустно”, “весело”. За словами закреплялся ранг важности, поэтому слово “папа” имело высокий ранговый уровень, а нейтральные слова “да/нет” или “возможно” низкий.
-
Сопоставление шаблонов (pattern matching). После нахождения ключевого слова применялись два этапа преобразования. Первый — разбивка реплики собеседника на части по регулярным шаблонам, с участием ключевого слова в роли лексического якоря и плейсхолдеров для захвата определенных фрагментов. Второй — финальная “сборка” ответа, когда захваченные части подставлялись в шаблон ответа по номеру заранее подготовленного правила.
Далее Вейценбаум вносит модификации в тогдашний ЯП Michigan Algorithmic Decoder (MAD) свой собственный форк, названный MAD-SLIP. Добавленный аппендикс означает симметричный списочный процессор (Symmetric List Processor), который хорошо подходил для составления таких шаблонов.
ЭЛИЗа была развернута на суперкомпьютере IBM 7094 с 36-битной архитектурой и памятью достаточной для 32 тысяч слов. Следуя довольно-таки несложному алгоритму, она произнесла свои первые слова монохромным текстом на сентиментально желтой бумажной ленте телетайпа и было это приблизительно в декабре 1965 — январе 1966 года.
Правда о чем была беседа первого чатбота со своим Пигмалионом история умалчивает. Но мы знаем, что было дальше: в институте началась натуральная ЭЛИЗОмания.
ЭЛИЗа не похожа на современные ЛЛМ, потому что она не умеет учиться и анализировать контекст. Но что в ней было поистине революционно, так это как раз-таки ранжирование слов по важности. Можно сказать, что этот метод в какой-то степени предтеча сегодняшних алгоритмов, понимающих эмоционально-температурную окраску лексики.
Lend me your ears and I’ll sing you a song…
Слухи о том, что в огромном IBMовском шкафу замуровано человеческое сознание быстро облетели университет. Все началось с того, что Вейценбаум протестировал ЭЛИЗу на своей секретарше. По-началу скептически настроенная, минут 20 спустя эта дама попросила профессора оставить ее наедине с ЭЛИЗой, чтобы отвести душу. К вящему неудовольствию профессора.
Вскоре после этого к ней “на прием” стали ломиться студенты — особенно юные студентки — которые хотели побеседовать с чудесной программой обо всем на свете.
Вот пример одного из диалогов, опубликованных в 1966 году:

И Вейценбауму происходящее не нравилось. По его словам, его целью было просто создать искусственного собеседника, которому не нужно было бы знать вообще ничего и оперировать исключительно готовыми паттернами для составления ответов. Возможно на эту мысль его натолкнул тест Тьюринга, который Вейценбаум хотел пройти с минимальными ресурсозатратами и показать, что машина может успешно притвориться человеком.
ЭЛИЗомания приобретала нездоровый характер в его глазах: “Подумай ещё на десять минут дольше и я бы просто изобрел барменов”, впоследствии скажет он в интервью 20 лет спустя. И хотя его изобретение высоко ценили коллеги — например Карл Саган был в восторге от идеи развернуть мобильные пункты экстренной психотерапии наподобие телефонных будок с ЭЛИЗой внутри — Вейценбаум был категорически против.
«Есть определенные задачи, которые компьютеры не должны выполнять, независимо от того, можно ли заставить их делать это или нет», — напишет он в 1976 году в своей книге «Вычислительная мощность и человеческий разум».
Вейценбаум считал, что люди попадают в иллюзорный плен к компьютеру, потому что чувствуют ложный эмпатический отклик от машины, дополнительно усиленный мгновенным фидбэком. Но это ощущение все равно иллюзия, так как действия машины целиком и полностью зависят от человеческого инпута — иными словами, это разговор с собственным эхо. Такой сюжет однажды был в греческой мифологии и мы знаем, что он печально закончился.
ЭЛИЗа, не исчезай…
К сожалению, Вейценбаум не застал появление БЯМ. Но, вероятно, он понимал, что его работа опережала свое время на годы вперед, так как он успел осознать какие опасности очеловеченная говорящая коробка таит в себе. И не только осознал, но и предупредил нас.
А ЭЛИЗа по-прежнему доступна вот здесь и на Гитхабе. Ее можно запустить прямо в браузере и поговорить с эхом патлатых 60-х, когда даже такой простой скрипт казался абсолютным волшебством.
ссылка на оригинал статьи https://habr.com/ru/articles/1027292/