«Пушкин цифровой». Открытий будет много

Светлана НИКОЛОВА | ФОТО Дмитрия СОКОЛОВА

ФОТО Дмитрия СОКОЛОВА

Гость редакции — заместитель директора Института русской литературы РАН Светлана НИКОЛОВА

К 225‑летию со дня рождения Александра Пушкина Институт русской литературы (больше известный как Пушкинский Дом) представит проект «Пушкин цифровой». Его создатели предполагают собрать воедино все материалы и документы, связанные с жизнью и творчеством поэта: рукописи и тексты его сочинений, комментарии к ним и даже его любимые книги. В разработке и реализации нового научно-просветительского портала принимают участие специалисты Санкт-Петербургского федерального исследовательского центра и DH-центра Университета информационных технологий, механики и оптики. Финансовую поддержку оказывает Министерство науки и высшего образования России. О том, кому адресован «Пушкин цифровой», о структуре этого ресурса и о возможностях, которые он предоставит пользователям, «Санкт-Петербургским ведомостям» рассказывает наш сегодняшний собеседник.

— Светлана Геннадьевна, когда вы планируете представить публике проект «Пушкин цифровой»?

— 6 июня мы представим его журналистам и коллегам, расскажем, какие результаты достигнуты, покажем, что у нас получилось. Доступ для публики пока открыть не сможем, потому что не успеваем вычитать тексты, надеемся сделать это за лето.

Следующая дата — 19 октября, когда мы будем презентовать уже готовый продукт и откроем его для широкой аудитории. Это будет базовая часть. Дальше наш ресурс будет жить, пополняться, развиваться. Он построен как своего рода конструктор, в который разработчики заверстают ту часть, которая уже сделана, а наши сотрудники смогут вносить новые тексты, добавлять новые картинки.

— Какова структура проекта?

— На сегодняшний момент он включает в себя четыре основных раздела: рукописи, тексты, научные комментарии к ним и ­библиотеку «Золотого века», книги, которые читал и упоминал в своих сочинениях Пушкин.

Структура вполне логичная — четыре базы данных, в которые собираются разные типы документов. Поиск в них осуществляется через систему автоматического тегирования. Есть и определенная рубрикация внутри. В итоге там будет выложена вся пушкинская библиография — аналог библиотечной картотеки в цифровом варианте.

— Основные разделы уже готовы?

— За предыдущие годы мы оцифровали все рукописи, которые хранятся в наших фондах, не осталось ни одной не оцифрованной страницы.

Дальше — тексты Пушкина в цифровом варианте (мы брали те, что опубликованы в собраниях сочинений, предыдущем и новом, которое сейчас издается). К текс­там прилагается научный комментарий из пушкинской энциклопедии. Она тоже уже оцифрована и распознана.

Дальше — сканирование всей научной литературы, которая была посвящена Пушкину. У нас уже сделано около трех миллионов страниц, но это капля в море. Работа продолжается и будет идти весь следующий год. В перспективе мы надеемся получить ресурс, который позволит представить наследие писателя со всем богатством научного осмысления его произведений.

— Библиотека «Золотого века» тоже в работе?

— К этому блоку мы еще не приступали. В задумке — это то, что читал Пушкин. И в отличие от всей прочей литературы эти книги мы будем размещать в формате pdf. Все остальное распознано, переведено в машиночитаемый текст, а здесь будут картинки. И пока мы предполагаем вывешивать только оригиналы — на том языке, на котором они были написаны. Дальше, возможно, дадим и переводы.

— Среди оцифрованных вами рукописей, автографов Пушкина есть те, которые раньше не публиковались?

— Далеко не все автографы Пушкина публиковались и использовались в научной практике. Открытий будет много. Сейчас мы одновременно с материалом для проекта создали полноценную страховую копию пушкинского ­наследия, оцифровав все до пос­ледней страницы.

— Раньше такой копии не су­ществовало?

— В советский период делалась страховая копия, рукописи снимали на стеклянные пластины, которые увезли куда‑то в хранилище на Алтай. Но тогда фотографировали только сами автографы Пушкина, а единица хранения может включать в себя не только их. Скажем, альбом, в который он внес какую‑то запись. Теперь мы сделали страховые копии каждого листа, всего их чуть больше пятнадцати тысяч.

— Может ли искусственный интеллект, машина помочь в расшифровке рукописей?

— Не может, ей не справиться. Это пока доступно только человеческому разуму.

— Многие тексты Пушкина известны в нескольких редакциях…

— Да, всегда есть несколько вариантов опубликованного текста, и во многих случаях он отличается от рукописи.

— Предполагаете ли вы выложить на вашем ресурсе все варианты?

— Есть такая идея. Не уверена, что мы успеем сделать это в 2024 году, но впоследствии все возможно. Пока у нас представлены только эталонные тексты.

— Как выбрать из нескольких версий эталонную?

— Обычно специалисты смотрят, сверяют разные варианты и коллективным мнением принимают решение. Мы ориентируемся на то, что было опубликовано в двух последних собраниях сочинений.

— На кого ориентирован ваш проект? Он больше научный или образовательный?

— Мы хотим совместить оба варианта. Это будет мощнейшая база, платформа для специалис­тов. Там планируется создать личные кабинеты ученых, в которые они смогут заходить и работать. Так сократится время на поиск — не надо будет идти в архив. На свой запрос человек тут же получит максимальное количество нужных документов. Кроме того, исследователи смогут внутри системы добавлять какие‑то комментарии.

На самом деле это революционная система, которая поменяет весь процесс работы филолога. Да, конечно, общение с подлинником — отдельное событие для ученого. Но на практике рукописи Пушкина мы не выдаем. Люди уже давно работают с копиями, просто сейчас это будут цифровые копии. И если раньше их можно было посмотреть только здесь, в Пушкинском Доме, то теперь они будут доступны всем.

— А что для широкой публики, молодежи?

— Для них в нашем проекте задумана просветительская часть. Это абсолютно не характерно для академического института, который популярными изданиями почти не занимается. Стиль наших публикаций всегда был сугубо научный, с большим количеством терминов, непонятных многим. «Пушкин цифровой» — первая попытка выйти на просветительский формат. Сотрудники отдела пушкиноведения уже подготовили около двадцати сюжетов по произведениям Пушкина — для неискушенного пользователя.

Каждый такой сюжет включает в себя текст стихотворения и комментарий к нему. Причем это более подробный комментарий, чем тот, что дан в собрании сочинений. Здесь раскрывается каждое устаревшее слово, есть исторический и биографический комментарий, написанный доступным языком. Есть завлекательные моменты, игры, тестовые задания. Мы постарались освоить игровой формат, интересный для молодежи.

— Вы привлекали к этой работе писателей, литераторов?

— Нет. С одной стороны, нам хочется, чтобы такое научно-популярное направление существовало теперь внутри института. С другой — наши ученые старались сохранить научную основательность в этом и боялись передавать дело в другие руки.

— Но ведь это совместный проект. Чем занимались ваши партнеры?

— Институт информатики и автоматизации Федерального исследовательского центра делал базы данных, куда мы выкладываем наши тексты, рукописи, комментарии. И сейчас разрабатывает систему поиска по этим документам, который машина будет осуществлять сама, обучаясь в процессе.

Внешнюю, пользовательскую, часть, то есть сам сайт, создал Университет информационных технологий, механики и оптики. Они провели предварительные исследования, проанализировали, как Пушкин представлен в Интернете, какие ресурсы пользуются популярностью. И разработали несколько вариантов дизайна — более сдержанный, аскетичный для научной части и более привлекательный для просветительской.

— Будут ли тексты, выложенные на сайт, дополнены иллюстрациями?

— Да, конечно. Предусмотрен большой массив иллюстративного материала — что‑то берется из нашего архива, музея, что‑то создается искусственным интеллектом. Там будут портреты, изображения не знакомых молодежи предметов, виды Петербурга пушкинской поры, виды Михайловского и так далее.

— Планируете ли вы включить в проект уже существующие популярные и художественные тексты о Пушкине?

— Только научные комментарии из собрания сочинений и пушкинской энциклопедии. В предыдущем нашем ресурсе мы хотели сделать такую «обвязку» — фильмы, художественная литература, постановки, оперы… Сейчас мы это отложили в сторону. Может быть, вернемся к этой идее потом. Разместить такие тексты и записи вряд ли сможем в связи с авторским правом, но по крайней мере в формате перечисления сказать о них вполне реально.

— Есть ли у вашего проекта аналоги?

— Да, существует похожий проект «Лев Толстой» (или Tolstoy Digital), есть зарубежный ресурс, посвященный Шекспиру, хотя они не полностью аналогичны нашему.

Кроме того, уже сейчас на сайте Пушкинского Дома есть раздел «Александр Сергеевич Пушкин. Электронное академическое издание» — прототип «Пушкина цифрового». Он был создан несколько лет назад, когда мы получили грантовую поддержку и начали работать над концепцией. Там размещены четыре пьесы из «Маленьких трагедий», «Подражания Корану», «Сцены из рыцарских времен» — с комментариями, рукописями, листами прижизненных изданий. Работая над этим разделом, мы определили, сколько и какого материала можно включить в подобный ресурс, как это организовать. Многое было додумано, доработано в концепции, и теперь этот опыт нам очень пригодился.

Подготовила Екатерина ГИНДИНА



Материалы рубрики

21 июня, 10:12
Сергей ЕКИМОВ
17 мая, 10:12
Сергей БЫЗГУ

Комментарии