Загадочный чатбот из 60-х, к которому стояли очереди из девушек

В одном из кампусов Массачусетского техинститута в 1966 году стали происходить очень странные дела. У дверей одной из лабораторий начали собираться стайки студенток и лаборанток, которым очень нужно было попасть внутрь хотя бы на 10 минут.

Нет, там не крутили только xnj вышедший битловский “Revolver”. Приманка для прекрасного пола была несколько технологичней: внутри располагался первый в истории созданный человеком чатбот. Его, а вернее её, звали ELIZA и она умела пленять собеседников не хуже античной сирены.

И это пугало ее создателя.

Бабушка ChatGPT

К началу 1960-х Джозеф Вейценбаум (1923 — 2008) был заметной личностью в MIT, но “звездного” статуса пока еще не имел. Сын еврейских эмигрантов, сбежавших от нацистов в Америку, он успел поработать военным метеорологом, а после принял участие в разработке системы ERMA для Дженерал Электрик. Это был бухгалтерский суперкомпьютер, ставший прообразом современных ERP.

Джозеф Вейценбаум за работой с, по всей видимости, телетайпом IBM 7094

К тому моменту когда Вейценбаум пришел в МИТ, Марвином Минским была предложена остроумная модель доступа к вычислительным мощностям института: таймшер. То есть несколько юзеров могут коннектиться к компьютеру одновременно, при этом физически будучи в разных местах. Так был дан старт систематической разработке ИИ, а заодно и появился прообраз интернета, на тот момент пилившийся под эгидой ARPA.

Профессор Вейценбаум был заинтригован такой возможностью и приступил к работе над невиданным доселе проектом: компьютер, который мог бы разговаривать с людьми на понятном, человеческом языке. Но как претворить такую алхимию в жизнь?

Четыре “битла” ИИ-революции. У них даже были Шеннон (крайний слева) и Маккарти (рядом с Шенноным). Рядом с Вейценбаумом Эдвард Фредкин, придумавший “вентиль Фредкина”.

За основу для скрипта Вейценбаум берет роджерсовскую терапию, также известную как “клиенто-центрированная психотерапия” (КЦП). Ее суть заключается в том, что психотерапевт принимает пациента без оценочных суждений и через недирективный метод помогает раскрыть душевные проблемы с помощью участливого слушания и наводящих вопросов.

Но как это все перевести в код?

Код Für ELISE

Итак, технически стесненный Вейценбаум находит выход следующим образом: чтобы программа, нареченная ЭЛИЗой, могла вести “осмысленный диалог”, ее логику нужно поместить меж двух ключевых компонентов:

Поиска ключевых слов (keyword spotting). ЭЛИЗа разбирала фразу пользователя пословно и искала ключевые слова из встроенного вокабуляра: «отец», «мама», «болит», «ненавижу», “грустно”, “весело”. За словами закреплялся ранг важности, поэтому слово “папа” имело высокий ранговый уровень, а нейтральные слова “да/нет” или “возможно” низкий.

Сопоставление шаблонов (pattern matching). После нахождения ключевого слова применялись два этапа преобразования. Первый — разбивка реплики собеседника на части по регулярным шаблонам, с участием ключевого слова в роли лексического якоря и плейсхолдеров для захвата определенных фрагментов. Второй — финальная “сборка” ответа, когда захваченные части подставлялись в шаблон ответа по номеру заранее подготовленного правила.

Далее Вейценбаум вносит модификации в тогдашний ЯП Michigan Algorithmic Decoder (MAD) свой собственный форк, названный MAD-SLIP. Добавленный аппендикс означает симметричный списочный процессор (Symmetric List Processor), который хорошо подходил для составления таких шаблонов.

ЭЛИЗа была развернута на суперкомпьютере IBM 7094 с 36-битной архитектурой и памятью достаточной для 32 тысяч слов. Следуя довольно-таки несложному алгоритму, она произнесла свои первые слова монохромным текстом на сентиментально желтой бумажной ленте телетайпа и было это приблизительно в декабре 1965 — январе 1966 года.

Правда о чем была беседа первого чатбота со своим Пигмалионом история умалчивает. Но мы знаем, что было дальше: в институте началась натуральная ЭЛИЗОмания.

ЭЛИЗа не похожа на современные ЛЛМ, потому что она не умеет учиться и анализировать контекст. Но что в ней было поистине революционно, так это как раз-таки ранжирование слов по важности. Можно сказать, что этот метод в какой-то степени предтеча сегодняшних алгоритмов, понимающих эмоционально-температурную окраску лексики.

Схема работы генеративного, предварительно обученного трансформера (ГПТ) сильно отличается от первого чатбота:

Lend me your ears and I’ll sing you a song…

Слухи о том, что в огромном IBMовском шкафу замуровано человеческое сознание быстро облетели университет. Все началось с того, что Вейценбаум протестировал ЭЛИЗу на своей секретарше. По-началу скептически настроенная, минут 20 спустя эта дама попросила профессора оставить ее наедине с ЭЛИЗой, чтобы отвести душу. К вящему неудовольствию профессора.

Вскоре после этого к ней “на прием” стали ломиться студенты — особенно юные студентки — которые хотели побеседовать с чудесной программой обо всем на свете.

Вот пример одного из диалогов, опубликованных в 1966 году:

И Вейценбауму происходящее не нравилось. По его словам, его целью было просто создать искусственного собеседника, которому не нужно было бы знать вообще ничего и оперировать исключительно готовыми паттернами для составления ответов. Возможно на эту мысль его натолкнул тест Тьюринга, который Вейценбаум хотел пройти с минимальными ресурсозатратами и показать, что машина может успешно притвориться человеком.

ЭЛИЗомания приобретала нездоровый характер в его глазах: “Подумай ещё на десять минут дольше и я бы просто изобрел барменов”, впоследствии скажет он в интервью 20 лет спустя. И хотя его изобретение высоко ценили коллеги — например Карл Саган был в восторге от идеи развернуть мобильные пункты экстренной психотерапии наподобие телефонных будок с ЭЛИЗой внутри — Вейценбаум был категорически против.

Телетайп-лента с jhbubyfkmysv диалогом с ЭЛИЗой

«Есть определенные задачи, которые компьютеры не должны выполнять, независимо от того, можно ли заставить их делать это или нет», — напишет он в 1976 году в своей книге «Вычислительная мощность и человеческий разум».

Вейценбаум считал, что люди попадают в иллюзорный плен к компьютеру, потому что чувствуют ложный эмпатический отклик от машины, дополнительно усиленный мгновенным фидбэком. Но это ощущение все равно иллюзия, так как действия машины целиком и полностью зависят от человеческого инпута — иными словами, это разговор с собственным эхо. Такой сюжет однажды был в греческой мифологии и мы знаем, что он печально закончился.

ЭЛИЗа, не исчезай…

Программа была названа по имени Элизы Дулиттл из “Моей прекрасной леди” (по мотивам пьесы Бернарда Шоу). По сюжету ее тоже учат говорить “по-человечески”.

К сожалению, Вейценбаум не застал появление БЯМ. Но, вероятно, он понимал, что его работа опережала свое время на годы вперед, так как он успел осознать какие опасности очеловеченная говорящая коробка таит в себе. И не только осознал, но и предупредил нас.

А ЭЛИЗа по-прежнему доступна вот здесь и на Гитхабе. Ее можно запустить прямо в браузере и поговорить с эхом патлатых 60-х, когда даже такой простой скрипт казался абсолютным волшебством.

ссылка на оригинал статьи https://habr.com/ru/articles/1027292/