
25 июня проект Vesuvius Challenge объявил, что впервые прочитал обугленный геркуланумский свиток целиком — от начала до конца и ни разу не развернув его физически. Папирус PHerc. 1667 почти две тысячи лет пролежал спекшимся комком угля: он пережил извержение Везувия в 79 году, но стал слишком хрупким, чтобы раскрыть его руками и не превратить в труху. Текст в прямом смысле достали из этого угля, не вскрывая свиток.
Свиток просканировали рентгеновской микротомографией высокого разрешения на синхротроне ESRF в Гренобле. По объемному скану исследователи восстановили геометрию свернутого папируса, виртуально «развернули» его в плоский лист, а дальше модели машинного обучения вытянули следы чернил, почти неотличимые от обугленной основы. Важно понимать, что именно делает ИИ: он помогает обнаружить чернила и собрать обучающую разметку, но читают, расшифровывают и трактуют текст папирологи — так что работа здесь совместная.
Тут важен нюанс: прочитали целиком уцелевшую часть свитка, а не весь исходный папирус. Попытки развернуть PHerc. 1667 руками в XIX веке, а затем в 1969-м и 1980-х уничтожили внешние слои, и до нас дошел только спрессованный внутренний керн высотой около 8 см. Зато этот керн впервые прочли непрерывно, от начала до конца, а не отдельными словами — получилось порядка 22 колонок греческого текста, около 1,4 метра. По содержанию это философский трактат по этике, судя по всему — стоическое сочинение II века до нашей эры о природе человека и нравственном развитии (в финальной колонке назван Аристокреон, ученик Хрисиппа). Той же методикой команда разобрала еще два свитка: в PHerc. Paris 4 более четкий скан впервые показал чернила напрямую и один в один совпал с расшифровкой, за которую в начале 2024 года вручили главный приз проекта — $700 тысяч за первое чтение крупных фрагментов закрытого свитка. А в PHerc. 139 восстановили заглавие и автора — это «О богах» Филодема, книга восьмая.
Раньше, чтобы физически развернуть и прочитать свиток, его приходилось повреждать. С виртуальным разворачиванием больше не нужно выбирать между тем, чтобы сохранить эти артефакты и прочитать их, — мы можем и то, и другое — ведущий папиролог проекта Федерика Николарди
Все данные, код и модели выложили в открытый доступ, а вместе с публикацией объявили новый приз — $1 млн первому, кто полностью прочтет любой другой свиток (всего проект уже раздал $1,8 млн). В этом и суть: метод дотянули от отдельных слов до системного чтения целых свитков, и впереди — сотни пока нечитаных геркуланумских папирусов, которые раньше были недоступны в принципе.
P.S. Поддержать меня можно подпиской на канал «сбежавшая нейросеть», где я рассказываю про ИИ с творческой стороны.
ссылка на оригинал статьи https://habr.com/ru/articles/1052634/