Журнал для профессионалов. Новые технологии. Традиции. Опыт. Подписной индекс в каталоге Роспечати 81774. В каталоге почта России 63482.
Планы мероприятий
Документы
Дайджест
Архив журналов - № 06 (96)'09 - Библиотека высшей школы
В поисках единого подхода

Наталия Викторовна Соколова, кандидат технических наук, доцент, директор Института корпоративных библиотечно-информационных систем, Санкт-Петербургский государственный политехнический университет


Сегодня информационный потенциал вуза определяется не только фондом библиотеки, но и всеми созданными в библиотеке и подразделениях электронными коллекциями образовательных и научных ресурсов.

Современная библиотека вуза не только предоставляет книги из фондов, но и разрабатывает информационные сервисы с применением компьютерных и сетевых технологий. Таким образом, читатель может получить доступ ко многим информационным ресурсам непосредственно с рабочего места или из дома. Однако библиотечные ресурсы и сервисы в новой, электронной форме требуют модернизации нормативно-правового, организационного и технологического обеспечения для их эффективного использования на легитимной основе.
Электронные ресурсы и сервисы, безусловно, предоставляют новые возможности, но в то же время и заставляют решать совершенно новые задачи. Так, в электронной среде гораздо ниже сохранность размещаемых там материалов по сравнению с традиционными библиотеками и печатными фондами, и следует с самого начала реализации проекта электронной библиотеки планировать расходы на обеспечение сохранности электронных ресурсов. Неоспоримым достоинством является более высокая оперативность, как по наполнению, так и по управлению, что принципиально важно для сферы образования и науки.
Таким образом, электронные библиотеки воспринимаются в вузах как наступающая реальность, в условиях которой надо научиться эффективно работать.
Не вдаваясь в детали определений электронной библиотеки (по этому поводу достаточно много мнений и публикаций), будем понимать под электронными ресурсами библиотеки в широком смысле все основные ресурсы, которые библиотека создаёт и/или которыми пользуется для обслуживания пользователей и управления библиотечными ресурсами. Основными среди них являются:
• сайт библиотеки;
• электронные каталоги и картотеки;
• электронные ресурсы на съёмных носителях;
• сетевые электронные ресурсы;
• базы данных.
Границы между выделенными категориями весьма размыты, поскольку практически каждая категория имеет свойства и базы данных, и интерактивного комплекса. Библиотека имеет практический опыт работы с каждой категорией ресурсов:
• практически все библиотеки поддерживают свои сайты;
• большинство ведут собственный электронный каталог, иногда участвуют в формировании корпоративных каталогов или же пользуются внешними каталогами для заимствования библиографических записей или выполнения заказа по МБА;
• библиотеки создают собственные сетевые электронные ресурсы: справочники, дайджесты, списки и пр.;
• библиотеки вузов начинают создавать электронные библиотеки, где размещают произведения сотрудников и учащихся;
• библиотеки всё активнее подписываются на базы данных внешних поставщиков.
Появляется необходимость выработать единый системномый подход к практике управления и использования электронных ресурсов, в первую очередь сетевых. В качестве исходного тезиса примем тот факт, что в условиях бурного роста объёмов электронных ресурсов библиотеке становится всё труднее комплектовать полный репертуар даже для своей целевой группы. Это становится практически нереальным. В связи с этим мировое сообщество предлагает решение, предполагающее всё более активное взаимоиспользование и обмен информационными ресурсами. Этот принцип справедлив не только для библиотек, ведь они уже не единственные информационные провайдеры в современном мире. Поисковые машины становятся повседневным средством информационного поиска как для профессионалов, так и для всех пользователей. Однако интеграция именно библиотечных ресурсов может привнести в этот процесс свою специфику, базирующуюся на библиотечных традициях. Библиотеки, за счёт применения традиций индексирования информационных ресурсов и обеспечения сохранности фонда, потенциально могут гарантировать достоверность предоставляемой информации, а также обеспечить более релевантный поиск. Соответственно, создание интегрированных информационно-библиотечных систем будет не копировать поисковые системы, но работать с собственными массивами информации по собственным правилам, обеспечивая новое качество поиска.

Интеграция — её варианты и уровни
Рассмотрим возможные варианты интеграции и объединения библиотечных ресурсов. Решение в виде создания единого централизованного хранилища информационных ресурсов, поддерживаемого в актуальном состоянии, показало существенную ограниченность своего применения на практике. Если говорить о вузовских библиотеках, то ни одна из них не может сформировать полную коллекцию. Передача ресурсов в некоторый центральный узел, принадлежащий организации или информационному провайдеру, также имеет ряд существенных недостатков, а именно:
• система становится «катастрофонеустойчивой»: при крахе центрального хранилища становятся недоступными ресурсы всех поставщиков ресурсов;
• трудно обеспечить актуальность содержимого хранилища: информационные ресурсы могут передаваться с запаздыванием, обусловленным в основном человеческим фактором.
Однако те же вузовские библиотеки в совокупности имеют колоссальный информационный потенциал — при условии, что будут решены задачи оперативного поиска информации сразу во всех вузах и эффективной доставки её потребителю «на рабочий стол». Объединение с библиотеками других министерств и ведомств придаст системе ещё большую мощность.
Отметим, что в настоящее время информационный потенциал вуза определяется не только фондом библиотеки, но и всеми созданными в библиотеке и подразделениях электронными коллекциями образовательных и научных ресурсов. Будучи изолированными, они становятся практически недоступными широкому кругу пользователей, их с трудом находят поисковые машины через сайты библиотек и вузов. Следовательно, можно выделить несколько уровней интеграции:
• на уровне вуза, когда фонд библиотеки преобразуется в сетевое интегрированное информационно-библиотечное пространство, включающее все информационные ресурсы подразделений, прошедшие соответствующую процедуру по экспертизе по своему содержанию и по правовой очистке;
• на уровне группы библиотек, объединённых по тематическому, региональному или ведомственному принципу — в результате формируется единое информационное пространство, в котором доступны ресурсы, ориентированные примерно на единую целевую группу. Важным фактором в объединениях такого рода является и использование общего лингвистического обеспечения;
• на уровне сферы образования и науки, где могут быть объединены фонды библиотек различных регионов.
Общая схема единого пространства информационного обеспечения, гарантирующая его динамическое обновление, представлена на рис. 1. Данный подход предполагает создание и накопление информационных ресурсов различными организациями (библиотеками) и многократное использование ресурсов всеми заинтересованными категориями пользователей, естественно, имеющих полномочия на доступ к конкретному ресурсу.
Общая архитектура информационного обеспечения включает:
• вариативный интерфейс, который настраивается в зависимости от круга решаемых задач и категории пользователей. В общем случае интерфейсов может быть много;
• промежуточный уровень для интеграции отобранных экспертами ресурсов;
• собственно электронные ресурсы (электронные коллекции, электронные каталоги и пр.).
Интегрирующий портал является иерархическим, причём каждый уровень иерархии обеспечивает интеграцию по отдельным категориям ресурсов и/или по различным протоколам.
Информационные ресурсы могут располагаться в различных узлах сети, в среде различных систем автоматизации библиотек, в системах управления электронными коллекциями и пр., то есть в общем случае среда является гетерогенной и распределённой. Такой подход, основанный не на перемещении ресурсов в центральное хранилище, а на обеспечении их доступности в месте создания, обеспечивает более высокую устойчивость системы. При недоступности любого из узлов происходит незначительная деградация системы (не все ресурсы становятся доступными), но не происходит её краха. Обеспечивается полная актуальность: ресурс становится доступным в библиотечной сети с момента его опубликования в одном из узлов.
Реализация портала верхнего уровня, обеспечивающего интерфейсную компоненту и, возможно, некоторый функционал по интеграции ресурсов, существенно зависит от круга решаемых задач. Портал может быть реализован в виде «информационной образовательной среды» (ИОС), в виде интерфейса OPAC (On-Line Public Access Catalogue), предоставляющий доступ к электронным каталогам библиотек, в виде простого списка ресурсов, обеспечивающего переход по гиперссылке к конкретному ресурсу, а также многими другими способами.
Собственно новое качество предлагаемому решению даёт промежуточный уровень, выполняющий функции интеграции «стандартных» источников информационных ресурсов. В общем случае можно представить путь поискового запроса (дерево поиска) к ресурсу в виде древовидной структуры, где листьями являются собственно информационные ресурсы, дугами — переходы к локальным системам навигации конкретных узлов, узлами — системы навигации, обеспечивающие доступность всех лежащих ниже узлов и подчиненных им ресурсов. Корень такого дерева — система навигации (портал) единого пространства всей системы. В дереве поиска на рис. 2 выделены три типа узлов:
• портальный, то есть имеющий веб-интерфейс с пользователем, преобразующий протокол HTTP во внутренний протокол сети. Примеры их реализации были рассмотрены выше;
• транслирующий, то есть рассылающий запрос «ниже» по дереву, выполняя, при необходимости, преобразование форм запросов и ответов для согласования протоколов обмена данными;
• узел доступа к информационным ресурсам, преобразующий запрос на внутреннем протоколе сети к обращению к механизмам поиска и хранения, используемые на данном конкретном узле.
Отметим, что некоторые узлы могут являться одновременно и портальными, и транслирующими (на рисунке они отмечены затемнённым фоном).
При таком подходе, естественно, возникает вопрос: как обеспечить возможность совместной работы узлов доступа к информационным ресурсам? Что понимается под «стандартностью» узла? Самый простой вариант — перейти к использованию одного и того же программного обеспечения, что даёт полную совместимость. Однако на современном этапе развития такой подход не представляется жизнеспособным. Каждая организация вправе иметь собственные предпочтения и аргументацию в выборе того или иного программного продукта для работы с информационными ресурсами в электронной среде. Рынок программного обеспечения предоставляет возможности такого выбора. Следовательно, интеграционное решение должно быть иным.
Если посмотреть на процесс интеграции в целом, то тенденция создания общих организованных информационных пространств, альтернативных хаотически развивающемуся пространству Интернета, наблюдается и более широко — проекты создания электронного государства, электронного правительства, проекты объединения публичных или государственных информационных ресурсов. Суть этих проектов заключается в обеспечении государством гарантированного доступа населения к социально-значимой информации, созданной на средства государственного бюджета. Библиотеки, как правило, занимают в таких проектах собственную нишу. Интересны в области создания таких пространств рекомендации международного комитета OASIS (Organization for the Advancement of Structured Information Standards), предлагающие объединение информационных ресурсов самых разных поставщиков на основе открытых непроприетарных стандартов. Другими словами, не рекомендуется ориентироваться на технические решения какого-то из производителей программного обеспечения, попадая при этом от него в зависимость на уровне сразу многих организаций или даже на уровне государства. Выбор программных продуктов, поддерживающих открытые стандарты, гарантирует сохранность сделанных инвестиций, а также возможность использования созданных данных даже в долгосрочной перспективе. Под открытыми понимаются стандарты, описание которых доступно и может быть использовано для разработки программного обеспечения на их основе. Обычно это стандарты международного, национального или корпоративного уровня – в зависимости от масштаба интеграции. Если предполагается возможность интеграции с мировыми системами, то следует учитывать международные стандарты, например, уровня ИСО. Если интеграция на уровне страны, то допустимо применение и национальных стандартов. Если предполагается более узкое, например, ведомственное объединение, то применимы и корпоративные стандарты.
Таким образом, выбирая решение для каждой библиотеки, следует принимать во внимание перспективы по интеграции создаваемых ресурсов и, исходя из этого, выбирать конкретные программные системы. Кроме того, при таком подходе облегчается прозрачный переход из одной системы к другой: стандартные данные гораздо меньше подвержены потере и искажению при их переносе в среду новой системы. Естественно, смена систем неизбежна — технологии развиваются достаточно быстро. Появляются всё новые возможности в плане качества поиска информации, удобства интерфейса и пр. Но библиотеки смогут сохранить самую важную компоненту их информационной системы — данные.
Для обеспечения интероперабельности (способности к взаимодействию) узлов, возможности объединения в едином поисковом дереве (рис. 2) должны выполняться условия, тесно связанные друг с другом:
• единый (согласованный) протокол взаимодействия, включающий протокол передачи/трансляции поискового запроса и получения результирующей информации и язык формирования сообщений, передаваемых между узлами;
• единый (согласованный) механизм осуществления поиска по метаданным и/или по содержанию информационного ресурса.
Таким образом, следование профилю стандартов становится необходимым и достаточным условием для обеспечения доступности информационных ресурсов узла, для вовлечения узла в информационные сервисы, предоставляемые распределённой информационной системой.
Предложенный подход может быть назван сервисным, когда каждый из узлов предоставляет один или несколько сервисов, реализуемых в информационно-библиотечной сети. Пользователь же, обращаясь к системе через портальный интерфейс, получает доступ к сервису, при этом ему не важно, где именно и каком образом этот сервис реализован внутри сети. Сервис может обеспечиваться одним узлом или группой узлов, работающих согласованно.
Стандарты совместимости
При увеличении номенклатуры предоставляемых сервисов возрастает количество параметров взаимодействия, которые должны быть согласованы. В самом общем случае на сегодня разработаны следующие категории стандартов, обеспечивающих совместную работу узлов библиотечной сети:
• описательные метаданные (библиографическое описание): MARC, Dublin Core, MODS, LOM, пр.;
• кодирование метаданных: METS, MPEG21 DIDL;
• протоколы поиска и извлечения: SRU/SRW, Z39.50, Opensearch;
• семантика связей: SKOS;
• протокол сбора (доступа): OAI-PMH, FTP;
• метаданные для описания коллекций: NISA, CDAP;
• описание сервисов: WSDL, модель IESR;
• разметка текста: ALTO, TEI;
• идентификация объектов: NBN, DOI, ARK, PURL.
Следует отметить, что стандарты находятся в непрерывном развитии и совершенствовании. Однако, как правило, обеспечиваются механизмы наследования и совместимости «старых» стандартов с более новыми. Именно это и обеспечивает сохранение сделанных инвестиций, о чём упоминалось выше.
Кратко рассмотрим стандарты, наиболее часто используемые на современном уровне развития распределённых информационно-библиотечных систем.
Протоколы Z39.50 и SRU/SRW были разработаны в среде библиотечных систем. Эти протоколы не предполагают сбор метаданных, а обеспечивают поиск в распределённой среде. Протокол Z39.50 был разработан ещё в 1980-е годы для целей интеграции электронных каталогов библиотек с обеспечением функций поиска, заказа и других. Этот протокол развивается до сих пор. В начале 2000-х вышла его очередная версия. С массовым внедрением веб-технологий были разработаны протоколы SRU/SRW, обеспечивающие выполнение функции распределённого поиска.
Протокол OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting) обеспечивает независимую от приложений схему взаимодействия для сбора и предоставления метаданных. Этот протокол получил широкое распространение в рамках так называемой инициативы открытых архивов для обеспечения свободного доступа к научной информации.
Формат Dublin Core (DC) является общепринятым при описании электронных ресурсов и коллекций. MARC-формат, традиционно используемый для описания библиотечного фонда в электронных каталогах, может быть преобразован в формат DC.
Поддержка всего комплекса протоколов на промежуточном уровне общей архитектуры (рис. 1) даёт свободу в выборе произвольных типов ресурсов для информационного обеспечения: электронных документов из репозиториев, печатных документов из фондов библиотек и пр. Таким образом, предлагаемая архитектура является универсальным решением, которое может быть адаптировано к конкретному виду ресурсов и потребностям конкретных организаций и пользователей.
Подводя итог вышесказанному, можно выделить ключевые принципы, которым должны соответствовать технологии построения электронных библиотек:
1. Открытая архитектура:
• функциональность формируется набором чётко определённых сервисов;
• сервисы доступны по чётко определённому протоколу.
2. Модуляризация (компоновка из модулей):
• обеспечение функциональной совместимости;
• адаптация на разные категории пользователей (научная библиотека, неформальный веб-портал).
3. Интеграция:
• формирование логически связанных коллекций.
4. Распределённость:
• контента (информационных ресурсов) и сервисов;
• администрирования и управления электронной библиотекой.

С автором можно связаться:
natalia@ruslan.ru

Продолжение в №8(98).

Тема номера

№ 4 (454)'24
Рубрики:
Рубрики:

Анонсы
Актуальные темы