У российских библиотек будет свое облако
В поисковой системе Российской национальной библиотеки читательский запрос может выглядеть так: «книжка про то, как большой человек попал в страну маленьких человечков». И мы понятия не имеем, какие технологии задействованы, чтобы система сообразила: речь о Гулливере. Те, кто имеет об этом понятие (библиотечные программисты), 12 лет назад начали собираться на международные конференции для обмена опытом. В этом году форум (собрались более 400 специалистов из 38 стран) впервые прошел в России, в Петербурге. «По итогам» мы поговорили с Олегом ШОРИНЫМ, одним из организаторов конференции, замдиректора РНБ по информатизации.
ФОТО предоставлено Российской национальной библиотекой
- Олег Николаевич, не всякий библиотекарь понял бы доклады на этой конференции...
- Да, конференция такая... полупрограммистская. Многие считают, что основная задача нашей библиотеки - выдавать книги, но это не совсем так. Наша задача как национальной библиотеки состоит и в том, чтобы принимать новые книги, каталогизировать их и хранить. Если книга неправильно внесена в каталог - считайте, ее нет. Вы ее не найдете.
По закону об обязательном экземпляре, в РНБ каждый год поступает около полумиллиона экземпляров печатной продукции - книги, газеты, карты и т. д. Рабочих дней в году около 250 - нетрудно посчитать, что в каждый из них в библиотеку поступает около 2 тысяч экземпляров. Все надо обработать и поставить на полку. Это и есть процесс каталогизации - создание описания книги, в котором содержится информация об авторе, названии, количестве страниц, годе издания, издательстве и прочем. При этом описание книг отличается от описания других видов печатной продукции.
В одних странах для каталогизации используют одно специализированное программное обеспечение, в других - другое, но игроков на этом поле - всего два-три. На данный момент лидер - компания Ex Libris, этот софт внедрен во многих национальных библиотеках мира, и уже 12 лет библиотекари разных стран, пользователи этого программного обеспечения, встречаются на конференциях и обмениваются опытом: софт сложный, его надо настраивать, «докручивать».
В нашей библиотеке это программное обеспечение было внедрено четыре года назад, участие в подобных конференциях помогло нам избежать ошибок - не наступить на грабли, на которые наши коллеги из других стран уже наступали. Например, когда мы обдумывали, какой должна быть архитектура серверов, чтобы читатель моментально и безотказно получал информацию о книге, нам помогли советы британских коллег, которые еще лет десять назад перепробовали разные конфигурации.
Серверы, которые принимают читательские запросы; серверы для интеллектуальной обработки этих запросов; серверы, которые следят, чтобы вся система была пропорционально загружена; сервер, с помощью которого наши администраторы настраивают всю систему, - это многоуровневая архитектура с возможностью балансировки и автоматического «переноса» задач с сервера, давшего сбой, на действующий. И эта структура позволяет оперировать громаднейшими данными. На открытии нашей конференции вице-президент компании Ex Libris Офер Моссери сказал, что РНБ за эти четыре года достигла феноменальных результатов - по количеству обрабатываемых запросов в единицу времени, количеству каталогизированных книг, уровню технической экспертизы.
- Как происходит каталогизация? Вот получает сотрудник экземпляр книги...
- Это конвейер. Один сотрудник вбивает в программу имя автора - допустим, «Достоевский», и передает книгу дальше. Берет следующую: «Пушкин», передает. Второй сотрудник отвечает за название: он, получив книгу от предшествующего коллеги, вбивает «Преступление и наказание», потом - «Руслан и Людмила». Дальше - сотрудники, вбивающие количество страниц, издательство, год издания и т. д. В итоге книжка встает на определенную полку в зависимости от направленности, от того, российская она или зарубежная, в зависимости даже от высоты корешка.
- Это ж сколько человек задействованы?
- Сейчас в системе зарегистрированы 719 сотрудников. Одновременно в среднем 519 человек заносят данные в систему. Сейчас в базе больше 11 млн 260 записей.
Надо отметить, что система работает в круглосуточном режиме. Если она начнет сбоить, то перестанет работать электронный каталог, поиск станет невозможен, не будет работать электронная библиотека, читатель не сможет читать наши оцифрованные книги. Более того: поскольку в Российской национальной библиотеке располагается, пожалуй, половина всех ресурсов Национальной электронной библиотеки, эта половина станет недоступной и в ней.
- Такое бывало?
- РНБ подключена к системе SiteUptime: каждую минуту делается автоматический запрос на наш сайт из трех различных точек мира. Допустим, из Лондона, Сан-Франциско и Сингапура. И если запрос остается без ответа, наши системные администраторы тут же получают уведомление и могут отреагировать.
Были ли простои? Были: за 2016 год - три. Пять минут, 55 минут и 2,5 часа. Но это были запланированные простои: в санитарные дни, чтобы подключить новое оборудование. Таким образом, беспрерывное рабочее время составило за год 99,960%. А среднее время отклика сервиса на поступающий запрос - менее одной десятой секунды.
- Что было сложнее всего во внедрении этой системы?
- Обучить сотрудников. Библиотека - очень консервативное учреждение. Иногда человек говорил: понимаю, что так лучше, но я привык работать в старой программе. Все прекрасно знали, что старая программа, к примеру, не поддерживала юникод (стандарт кодирования символов. - Ред.), поэтому можно было вводить данные только для книг, написанных кириллицей и/или латиницей. А для того чтобы каталогизировать книги с греческими символами, или иероглифами, или с арабской вязью - выкручивались, создавали параллельные базы данных. Единого поиска по ним не было. Когда мы переходили на нынешний софт, пришлось в единое хранилище загружать данные из 26 различных баз! Уже тогда сотрудники компании Ex Libris говорили, что по этому параметру наша инсталляция, установка, крупнейшая в мире.
- Возвращаясь к конференции: она ежегодная, проходит почти неделю, на нескольких площадках - так много нужно обсудить?
- Программное и аппаратное обеспечение развиваются семимильными шагами. Постоянно появляются новые подходы - сейчас, например, все движется в облачные структуры. Но позиция библиотек России такова: мы, скорее всего, не будем загружать наши данные во всемирное облако.
- Почему?
- Причин много. Самая простая - условно политическая: Россия не расположена загружать весь свой «книжный мир» в облако, которое контролирует не она.
Но есть и другие резоны. Государство создает специальные учреждения - библиотеки, чтобы эти самые библиотеки все хранили у себя вечно. Для этого они должны проводить исследования, разрабатывать новые методы хранения информации, тестировать новые технологии и прочее. А если станут все закачивать в облако, возникнет вопрос: зачем содержать всю эту систему библиотек?
Но за облачными технологиями будущее. Например, мы сейчас хотим внутри страны построить свое общенациональное библиотечное облако. Кстати, так поступила Австрия, и на прошедшей конференции австрийские коллеги поделились с нами своим опытом.
Мы хотим предложить библиотекам России облачный сервис каталогизации: библиотекам не нужно будет обзаводиться оборудованием, специальным софтом, держать системных администраторов - мы можем делать все это «из центра».
- Библиотеки на это пойдут?
- Я летом на конференции, которая проходила в Судаке, анонсировал создание такого сервиса. И ко мне подходили представители разных библиотек. У библиотек ведь сейчас очень непростая ситуация: оптимизация, сокращение финансирования и т. д. Думаю, в этом году мы в пилотном режиме попробуем такое сотрудничество с несколькими учреждениями.
- Нынешний читатель РНБ - это...
- Студент и научный работник. Если посмотреть на географию запросов, то это весь мир. Очень много зарубежных запросов идет из университетов, в которых есть кафедры истории России или русской литературы. У студенческих запросов колоссальный всплеск, конечно, перед сессией, причем ночами.
- «Не студенту» и «не научному работнику» делать в РНБ нечего?
- На самом деле «есть что делать». Например, я в последнее время заинтересовался экономикой. Я математик, изучал статистику, вычислительные методы и много чего другого, связанного с анализом функций. Мне сейчас интересно соотносить, как те или иные показатели различных индексов влияют друг на друга. Ну хотя бы на бытовом уровне: имеет ли смысл при текущем уровне безработицы в Европе покупать валюту для поездки в отпуск или дождаться публикации нового статистического отчета? И вообще взаимосвязаны ли эти вещи? На этот предмет есть множество исследований, однако большинство из них публикуются в журналах с платным доступом. Но РНБ подписана на множество различных ресурсов, баз данных, и для читателя, находящегося в стенах библиотеки, все эти исследования и статьи - бесплатны. Государство за них уже заплатило.
Комментарии