Пожалуй, одно из самых важных для нас событий – сборник научных трудов «Диалога» наконец-то будет индексироваться международной системой SCOPUS. Почему это важно? Для подтверждения своего научного статуса все отечественные ученые должны иметь публикации в наиболее авторитетных изданиях, входящих в т.н. список ВАК (Высшей аттестационной комиссии). К таковым относятся, в частности, журналы, входящие в базу SCOPUS. Скопусовский статус сборника Диалога, придает конференции более высокий статус и мы рады, что теперь участие в «Диалоге» будет придавать больше «веса» научным трудам наших докладчиков.
В этом году одной из доминант «Диалога» была вычислительная семантика, ей был посвящен первый день конференции. Эта область компьютерной лингвистики изучает различные способы компьютерного моделирования значений слов, фраз, предложений, целых текстов. Проблема важная для решения и очень сложная, имеются разные подходы. Например, самый новый — дистрибуционная семантика, в которой значение описывается на основании статистики сочетаемости слов, рассчитываемой по большим текстовым корпусам. В онтологической семантике упор делается на учет знаний о мире, формальная семантика широко использует для описания значений предложений математическую логику, операциональная семантика делает упор на инструктивных аспектах языка: интерпретирует фразы как команды, управляющие некоторым исполнительным устройством, например, роботом. Наконец, традиционная «объяснительная» семантика пытается полностью описать значение с помощью специальных языков толкований.
На конференцию приехали известные ученые, лидеры этих направлений компьютерной семантики: Марко Барони, Барбара Парти, Сергей Ниренбург, Константин Воронцов, Елена Падучева. Днем были интересные доклады, а вечером состоялся специальный круглый стол, на котором можно было сопоставить разные модели, увидеть не только отличия, но и возможности взаимодействия этих подходов. Кажется, что идея «смотра семантических подходов» удалась, и можно ожидать появления новых исследований и исследователей в этой области.
Второй день «Диалога» был объявлен «Днем технологий». По сути «День технологий» — это попытка сделать нечто подобное DOCFLOW (крупнейшая российская конференция-выставка, посвященная документообороту) применительно к лингвистическим технологиям. Рынок таких технологий в России еще не вполне сформировался, поэтому очень важно создать площадку, на которой потенциальные заказчики могут ознакомиться с предлагаемыми решениями и получить их объективную сравнительную оценку. С приглашенными докладами выступили представители компаний и организаций, лидирующих в области разработки лингвистических технологий: RCO, ABBYY, Яндекс, IBM, научные группы ВЦ МГУ, НИИ системного программирования, НИИ системного анализа. Вечером состоялся круглый стол, на котором обсуждались проблемы взаимодействия науки, инженерии и бизнеса в нашей стране. Прозвучало много интересных и конструктивных идей, как помочь разработчикам и заказчикам понять друг друга. Этот «День технологий» был первым, и эксперимент можно считать удавшимся: на следующем «Диалоге» можно будет провести уже более масштабное мероприятие.
В последний день «Диалога» состоялся вечер памяти Ильи Сегаловича, внесшего огромный вклад в развитие компьютерной лингвистики в России.
А ещё на конференции были подведены итоги соревнования по автоматическому разрешению анафоры и кореферентности. Такие соревнования для русского языка проводились впервые. В состязании приняли участие семь разработчиков систем автоматического анализа текста: ABBYY, RCO, SemSyn, Open Corpora (St.Petersburg), Mail.ru, Институт системного анализа РАН, Сергей Пономарев. Подробнее об этом – во второй части статьи.
ссылка на оригинал статьи http://habrahabr.ru/company/abbyy/blog/229087/
Добавить комментарий