![](https://api.theins.ru/images/akYDdyRbaMsBSLIPvHOQLBsXBWTCv-DZ-jkBsrZF8D4/rs:auto:877:579:0:0/dpr:2/q:100/bG9jYWw6L3B1Ymxp/Yy9zdG9yYWdlL3Bv/c3QvMjY1OTIyL2Zp/bGUtMjBlMzIyYThm/ZGIyZjUwZDcxZjYz/ZjA0MTJkYzIzZjAu/anBn.jpg)
Двум студентам, участникам конкурса «Первые письма» проекта Vesuvius Challenge, удалось независимо друг от друга расшифровать фрагмент из геркуланумского папируса. Этому предшествовали работа и открытия других участников проекта.
Начало проекта
Геркуланумские папирусы — древние свитки, хранившиеся в библиотеке частной виллы вблизи Помпеи, — были погребены в пепле и лаве в результате извержения Везувия в 79 году нашей эры. Почти две тысячи лет эта единственная сохранившаяся библиотека античности оставалась под 20-метровым слоем вулканической грязи. В 1700-х годах их раскопали, но, хотя они в какой-то мере сохранились благодаря извержению, открыть и прочитать их невозможно: при неправильном обращении свитки превратились бы в пыль.
В 2019 году профессор Брент Силз из лаборатории EduceLab Университета Кентукки получил 3D-изображение геркуланумских свитков, создав трехмерные томограммы с разрешением до 4 мкм. Аспирант профессора Силса, Стивен Парсонс, работал над обнаружением чернил на КТ-сканах с помощью моделей машинного обучения и добился успеха в работе с отдельными фрагментами.
![](https://api.theins.ru/images/_hmsHbkVnSsthkClpSO8r5iDnkIWUscO5XX70cLXoug/rs:fit:866:0:0:0/dpr:2/q:80/bG9jYWw6L3B1Ymxp/Yy9zdG9yYWdlL2Nv/bnRlbnRfYmxvY2sv/aW1hZ2UvMTk0MDUv/ZmlsZS04YTA1NzU3/ZDU1MmU0ZGNhMmQx/ZTIzZDhmYmJiMWRl/Ny5qcGc.jpg)
Это привлекло внимание технологических предпринимателей Ната Фридмана и Дэниела Гросса, которые организовали проект Vesuvius Challenge с конкурсом для ускорения этого прогресса. Они объявили открытый конкурс в марте 2023 году и наряду с главным призом в $700 тысяч объявили, что дадут несколько призов за разработку инструментов и методов с открытым исходным кодом.
В начале лета к команде изучавших свиток присоединились несколько аннотаторов. Они начали картировать трехмерную структуру свитка и к июлю сегментировали и виртуально «сплющили» сотни квадратных сантиметров папируса.
![](https://api.theins.ru/images/UpTSTctk1O6mjJakP1J4m9CSr9sSjx4lPACQ00Itzk0/rs:fit:866:0:0:0/dpr:2/q:80/bG9jYWw6L3B1Ymxp/Yy9zdG9yYWdlL2Nv/bnRlbnRfYmxvY2sv/aW1hZ2UvMTkzOTYv/ZmlsZS1lZDc0MTEw/YzBjNzI1ZTUyZmVl/ZjJkZWUyMDRiOTdh/NS5wbmc.jpg)
Не трещины, а чернила
В начале августа участник конкурса Кейси Хэндмер, архитектор ПО в Лаборатории реактивного движения NASA, сообщил в блоге о своем открытии «узора из трещин», похожего на следы чернил. Он обнаружил этот узор, глядя на сегментированные томограммы свитка в течение нескольких часов подряд. Стивен Парсонс и раньше видел прямые свидетельства наличия чернил в отделившихся кусочках папируса, но внутри свитка их еще не наблюдали. Кейси стал первым человеком за последние две тысячи лет, обнаружившим чернила и текст внутри нераспечатанного свитка.
![](https://api.theins.ru/images/Iw2ctt90XVj81v6SEsEQnrEDQj4yaO65-QT97tX9lcY/rs:fit:866:0:0:0/dpr:2/q:80/bG9jYWw6L3B1Ymxp/Yy9zdG9yYWdlL2Nv/bnRlbnRfYmxvY2sv/aW1hZ2UvMTkzODIv/ZmlsZS1mZGQ1NGYz/MjE2OTk3ZjQxNTZm/NjdkMDNkNTI4ZTY4/Zi5wbmc.jpg)
Модель Люка Фарритора
![](https://api.theins.ru/images/lKTbOxkmqaYqHJr2IJWBAB42OoGr-N9p5Rzs1X4PzI0/rs:fit:866:0:0:0/dpr:2/q:80/bG9jYWw6L3B1Ymxp/Yy9zdG9yYWdlL2Nv/bnRlbnRfYmxvY2sv/aW1hZ2UvMTk0MDAv/ZmlsZS0yZjhmMzU1/MThhMGMxZGVmMjNh/MjljNGU2NzJkNzNk/ZC5qcGc.jpg)
После находки Хэндмера участники конкурса стали активно искать похожие трещины, но это оказалось сложной задачей. Студент колледжа и стажер SpaceX Люк Фарритор узнал о конкурсе «Везувий» из подкаста. Он увидел, что модель трещин Кейси обсуждается в Discord, и начал тренировать модель машинного обучения на изучение трещин. С каждой новой найденной трещинкой модель улучшалась. Фарритор нашел несколько десятков чернильных штрихов и несколько целых букв, которые можно было пометить и использовать в качестве обучающих данных.
![](https://api.theins.ru/images/vpgCls8Aq_LZANlvGSlWop0A2NvrjJe_YcdO3ScSqrE/rs:fit:866:0:0:0/dpr:2/q:80/bG9jYWw6L3B1Ymxp/Yy9zdG9yYWdlL2Nv/bnRlbnRfYmxvY2sv/aW1hZ2UvMTkzOTcv/ZmlsZS1iNzFjYWM4/MTYyZjhiZWMwZDQ5/ZDM3OWJiMTRjNTc3/ZC5qcGc.jpg)
Вскоре очертания начали складываться в буквы и стали похожи на настоящие слова. Тогда Фарритор подал заявку на участие в конкурсе «Первые письма», в рамках которого участники должны были найти не менее десяти букв на площади 4 кв. см. Вот поданная им работа:
![](https://api.theins.ru/images/82QVx3fVR26ipC_tYOq_5lmO0ic3QcjkjZJU2mB9a44/rs:fit:866:0:0:0/dpr:2/q:80/bG9jYWw6L3B1Ymxp/Yy9zdG9yYWdlL2Nv/bnRlbnRfYmxvY2sv/aW1hZ2UvMTkzOTgv/ZmlsZS05ZGI2OGI1/YTljY2Y5ZDdlNTNh/ZmNmZmM5MDhjYmFk/Yy5qcGc.jpg)
Профессор Силс показал это изображение группе папирологов проекта Vesuvius Challenge — ученых, специализирующихся на дешифровке древних текстов, — и те сразу же смогли прочитать слово porphyras (πορφyραс), несмотря на то что буквы были нечеткими. Оно означает «пурпурный» и встречается в древних текстах довольно редко.
![Каждый квадрат обозначает одно мнение специалиста. Зеленый: более 80% уверенности в том, какая это буква, желтый — 50–80% уверенности, красный — менее 50% уверенности](https://api.theins.ru/images/1D02Bf5hk_Xln4F0Ng0Iedm_s8Wgf6j7vcMohW_ZPnc/rs:fit:866:0:0:0/dpr:2/q:80/bG9jYWw6L3B1Ymxp/Yy9zdG9yYWdlL2Nv/bnRlbnRfYmxvY2sv/aW1hZ2UvMTkzOTkv/ZmlsZS00OTBjZDE5/ZTA1YjVjMzhhMWI0/ZGNmMTRmNDgzMmI3/ZS5qcGc.jpg)
Каждый квадрат обозначает одно мнение специалиста. Зеленый: более 80% уверенности в том, какая это буква, желтый — 50–80% уверенности, красный — менее 50% уверенности
Модель Юссефа Надера
![](https://api.theins.ru/images/58T-QWSiF8AnoRLuE80izeR10K6T1XjwsfZNio3yelA/rs:fit:866:0:0:0/dpr:2/q:80/bG9jYWw6L3B1Ymxp/Yy9zdG9yYWdlL2Nv/bnRlbnRfYmxvY2sv/aW1hZ2UvMTk0MDEv/ZmlsZS0xMDlkOTQ2/YmExMmFhMzJlZTE4/MzAzMGE2ZWU1MTVm/Mi5qcGc.jpg)
Тем временем другой участник конкурса, Юссеф Надер, египетский аспирант, изучающий биоробототехнику в Берлине, использовал другой подход. Вдохновленный результатами Хэндмера и Фарритора, он проанализировал работы победителей одного из конкурсов Kaggle по распознаванию чернил, в частности, изучил совершенствование подхода Стивена Парсонса (упомянутого выше) к машинному обучению на отдельных фрагментах. Юссеф также подал свою заявку на премию «Первые письма». Он увидел первые результаты Люка, которыми тот делился в Twitter и Discord, и решил сфокусироваться на той же области в рамках свитка. Он нашел похожие на буквы символы, присвоил им метки.
![](https://api.theins.ru/images/66XRMXSRb39nZRSylQlZVB31EiG48pzmbF8vEigZJ_U/rs:fit:866:0:0:0/dpr:2/q:80/bG9jYWw6L3B1Ymxp/Yy9zdG9yYWdlL2Nv/bnRlbnRfYmxvY2sv/aW1hZ2UvMTk0MDIv/ZmlsZS01OTM3Mzhm/MWUzM2RhNTA0NmQ5/Y2MxYzYxZmEwODRl/MC5wbmc.jpg)
Модели, обученные на этих метках, были способны обнаруживать чернила внутри свитка. В итоге Юссефу удалось получить изображение, представленное ниже.
![](https://api.theins.ru/images/TOHT48MjdP2D8Ys1mkcg7h277wtm-jxKjLoWGDAgufs/rs:fit:866:0:0:0/dpr:2/q:80/bG9jYWw6L3B1Ymxp/Yy9zdG9yYWdlL2Nv/bnRlbnRfYmxvY2sv/aW1hZ2UvMTk0MDMv/ZmlsZS0xNjY3Mjc0/MGFjOTA5OWI4MDFk/OGFmZjgyMTVkMTgy/ZS5qcGc.jpg)
Папирологи пришли к выводу, что их догадки были верны, а также начали строить предположения о возможных словах выше (ανυοντα / ANYONTA, «достижение») и ниже (ομοιων / OMOIωN, «подобный»). Юссеф Надер получили приз в $10 тысяч.
Кроме того, модель Юссефа создала новое изображение свитка — значительное по размеру и четкости. На этом изображении хорошо видны четыре с половиной колонки текста, разделенные полями. Теперь видно гораздо больше букв, хотя не все из них можно сразу разобрать. Сейчас их изучают папирологи.
![](https://api.theins.ru/images/a8XaNID-HPdmMwYiDSzBSu2GEWTjx73GBCxI31gZHn8/rs:fit:866:0:0:0/dpr:2/q:80/bG9jYWw6L3B1Ymxp/Yy9zdG9yYWdlL2Nv/bnRlbnRfYmxvY2sv/aW1hZ2UvMTk0MDQv/ZmlsZS1mZjlmZmNj/M2I4MzFmODExMTJj/N2U2NTU3NTlkYWI5/Yy5qcGc.jpg)