Журнал для профессионалов. Новые технологии. Традиции. Опыт. Подписной индекс в каталоге Роспечати 81774. В каталоге почта России 63482.
Планы мероприятий
Документы
Дайджест
Аминокислоты для спортсменов по всей Украине. в Днепропетровске. Смотрите тут
Архив журналов - № 9 (21)'04 - КАТАЛОГИЗАЦИЯ
Унификация и интеграция
Юлия Геннадьевна Селиванова, заведующая сектором Отдела обработки и каталогов РНБ, кандидат педагогических наук

Ольга Николаевна Жлобинская, старший научный сотрудник Службы поддержки форматов РНБ

Владимир Григорьевич Войскунский, ведущий научный сотрудник Отдела обработки и каталогов РНБ, кандидат технических наук

В совершенствовании и использовании языков предметных рубрик (ПР), различных систем классификаций наблюдаются две взаимосвязанные тенденции:
• унификация — выбор определенной совокупности библиографических информационно-поисковых языков (ИПЯ), используемых для индексирования и поиска документов;
• интеграция — совмещение однотипных языков между собой (различных словарей ПР), индексов систем классификации (ИСК); совмещение различных по структуре ИПЯ (языков классификационного и предметного типов).
Эти тенденции обусловлены потребностями практики и связаны с расширением сотрудничества библиотек в области обмена информацией, внедрения корпоративной каталогизации, одновременного поиска по одному запросу в электронных каталогах (ЭК) различных библиотек.

Унификация
Современные модули каталогизации и модули OPAC позволяют встраивать большое количество ИПЯ, как контролируемых — ПР, классификационные индексы, тезаурусы в виде машиночитаемых авторитетных файлов (АФ), так и неконтролируемых — ключевые слова (КС). Но ни одна библиотека мира не может себе позволить использовать все многообразие существующих ИПЯ. На выбор ИПЯ влияет и такой новый фактор, как «включенность» библиотеки в работу какой-либо корпоративной сети. Это предусматривает использование набора определенных лингвистических средств для обеспечения эффективной работы всех библиотек, входящих в объединение.
Современная мировая тенденция — использование наиболее распространенных ИПЯ, близких по языковым, политическим, культурным, экономическим традициям библиотекам различных стран. В универсальных библиотеках США, англо-говорящих странах, как правило, используются Library of Congress Subject Headings (LSCH) и Decimal Dewey Classification (DDC), в немецко-говорящих странах (Германия, Австрия, Швейцарии) используются DDC или Universal Decimal Classification (UDC) и SWD (Schlagworthormdatei), в франко-говорящих странах — DDC и RAMEAU (Repertoire d`Autorite-Matiere Encyclopedique et Alphabetique Unifie), в специализированных библиотеках применяются отраслевые тезаурусы и классификации.
В 1995—99 гг. рабочая группа IFLA по исследованию систем ПР, применяемых в крупнейших библиотеках, проанализировала 88 национальных библиотек Европы, Африки, Азии, Америки и установила, что 24 национальных библиотеки используют LCSH в своей национальной библиографии или для представления своей национальной библиографической продукции на английском языке (Китай, Египет). 12 стран перевели или адаптируют LCSH.5 В 1995 г. Британская библиотека возобновила использование LCSH при каталогизации новых поступлений. Стремление к обмену информацией, международной стандартизации библиотечных процессов оказалось важнее желания использовать свою систему.7

Интеграция языков предметных рубрик
и классификаций
В традиционных каталогах ПР и ИСК существовали изолированно друг от друга. Новые технологии обеспечили условия совмещения этих инструментов для расширения поисковых возможностей и более эффективного индексирования. Интеграция ПР и классификационных индексов подразумевает, что одной ПР ставится в соответствие определенный индекс или индексы и, наоборот, — одному классификационному индексу может ставиться в соответствие одна или несколько ПР. Такое соотнесение ПР и классификационных индексов может быть достигнуто как интеллектуальным, так и автоматическим способом, или быть совмещенным. Например, в АФ ПР РНБ каждой ПР с разной степенью детализации приписан(ы) индекс(ы) ББК. Это позволяет при поиске в АФ ПР по определенному классификационному индексу ББК получить выборку соответствующих предметных рубрик.
В электронной версии DDC зафиксировано соответствие между классификационными индексами DDC и LCSH, полученное автоматическим способом из базы библиографических данных OCLC. Классификационному индексу DDC может быть поставлено в соответствие до пяти наиболее часто встречающихся в паре с ним ПР в библиографических записях (БЗ). Интеграция классификационных индексов и ПР позволяет просматривать уровень ПР в иерархической структуре. Как правило, в языках ПР отношения иерархии плоские, устанавливаются от одной рубрики к другой и подразумевают в целом отношение «шире» или «уже», в то время как средства классификационного языка предоставляют возможность более объемного и наглядного показа иерархических отношений между терминами.

Интеграция различных словарей языков
предметных рубрик
Интеграция словарей ПР осуществляется путем установления соответствия между терминами различных систем предметизации. Как и в случае интеграции классификаций и ПР, это соответствие может быть достигнуто как интеллектуальным, так и автоматическим способом, или быть совмещенным.
В международном проекте MACS (Multilingual Access to Subject) проводятся экспериментальные работы по установлению соответствия между заголовками ПР трех систем предметизации — RAMEAU, SWD, LCSH. В нем участвуют четыре европейских национальных библиотеки (Швейцарии, Франции, Германии и Великобритании). Цель проекта — организация связей между авторитетными файлами ПР, используемыми в мировой практике, для обеспечения многоязычного предметного доступа к каждому из них. Методика работы: рубрики одной системы предметизации не переводятся на другой язык — для каждой единицы одной системы подбирается одна (или несколько) единиц других систем, наиболее соответствующих по объему и содержанию. Для этого каждая библиотека — участница проекта индексирует документы с использованием «своего» языка ПР, а затем обеспечивает доступ, базирующийся на связях с эквивалентными заголовками из других систем предметизации. Для проведения эксперимента были выбраны две тематические области — Спорт и Театр. Выбор данных областей исследования определялся следующими причинами: Спорт — это относительно несложная тематическая область, не имеющая существенных культурных или национальных особенностей, Театр — это более широкая и более сложная тематическая область, для которой характерны культурные и национальные отличия. В результате индексирования были получены следующие данные:
Индексирование в тематической области «Спорт»:
• 86% заголовков однозначно соответствуют друг другу во всех трех списках ПР;
• 8% заголовков соответствуют друг другу в двух списках ПР;
• 6% заголовков остаются моноязычными.
Индексирование в тематической области «Театр»:
• 60% заголовков однозначно соответствуют друг другу во всех трех списках;
• 18% заголовков соответствуют друг другу в двух списках;
• 22% заголовков остаются моноязычными.
Результаты проекта показывают перспективность работ в этом направлении.
В РНБ в 1995 г. начал разрабатываться проект по установлению соответствия между ПР РНБ и LCSH.2 Для этого в БЗ РНБ на иностранные книги дополнительно включаются ПР LCSH. Сотрудники РНБ не владеют методикой предметизации LCSH, поэтому самостоятельное индексирование не осуществляется, используются только ПР, приведенные в CIP на издании. Все БЗ, проиндексированные предметными рубриками РНБ и LCSH, были отсортированы по ПР одной из систем, и был запущен алгоритм нахождения соответствующих им рубрик другой системы. В результате по каждой рубрике были получены один или несколько вариантов пар соответствующих рубрик с указанием частоты, с которой реализована та или иная связь между рубриками. Итогом работы алгоритма является таблица, объединяющая наименование издания, рубрику LCSH, рубрику ПР РНБ, количество вхождений данной рубрики в таблицу, количество вариантов соответствующих ей рубрик, по которым проводится сравнение.
Проведение подобных исследований требует значительных финансовых средств и специалистов высокой квалификации. В связи с этим работы по данному проекту приостановлены, но формирование экспериментальных массивов БЗ, имеющих ПР РНБ и LCSH, продолжается.
Современные информационные технологии оказывают влияние и на развитие самих ИПЯ. Оно, прежде всего, связано с расширением объектов индексирования: от традиционных документов до ресурсов интернета. OCLC в рамках проекта CORC ведет активные исследования возможности использования LCSH и DDC при каталогизации ресурсов интернета. При этом используется метод автоматического индексирования индексами DDC. Из каталогизируемого ресурса извлекается определенный набор терминов, который соотносится со словесными выражениями индексов DDC. Программа подбирает несколько индексов DDC, которые точно или почти точно соответствуют терминам, извлеченным из текста документа. Индексы в ранжированном порядке предварительно включаются в запись для последующей проверки каталогизатором. Результаты экспериментальных работ показывают, что DDC обладает высоким потенциалом, позволяющим использовать эту систему для каталогизации и поиска ресурсов интернета. Предпосылками успеха являются работы, проводимые редакторским советом DDC, связанные с пересмотром структуры таблиц DDC, с редакций и полным пересмотром некоторых разделов, приспособлением к работе DDC в электронной среде.
Перспективным является и использование для каталогизации и поиска ресурсов интернета рубрик LCSH:
• LCSH представляет собой уникальный словарь терминов на английском языке, охватывающий все предметные области;
• LCSH используется во многих странах мира (в переведенном или адаптированном варианте), т. е. LCSH де-факто является всемирным контролируемым словарем;
• в LCSH осуществляется контроль синонимии и омонимии;
• LCSH располагает богатым ссылочно-справочным аппаратом (перекрестные ссылки, идентифицирующие отношения между терминами).
Но есть и определенные трудности, связанные с использованием LCSH в электронной среде; прежде всего к ним относятся сложные правила формирования ПР, что требует высокой квалификации специалистов.
Среди наиболее перспективных современных направлений исследований и совершенствования в области ИПЯ можно назвать следующие:
• установление семантического соответствия понятий и данных различных ИПЯ;
• разработка средств автоматического индексирования документов.
1 Васильева Г. Н. Представление CD-ROM-ной версии авторитетного файла предметных рубрик / Г. Н. Васильева // Предметный поиск в традиционных и нетрадиционных ИПС. — СПб., 2001. — С. 97—116.
2 Жлобинская О. Н. Установление соответствия между предметными рубриками Библиотеки Конгресса и РНБ / О. Н. Жлобинская, А. С. Курков, Ю. Г. Селиванова, И. Б. Цветкова // Предметный поиск в традиционных и нетрадиционных ИПС. — СПб., 1999. — С. 146—150.
3 Chan L. M. Exploiting LCSH, LCC, and DDC to retrieve networked resources issues and challenges [Электронный ресурс] / Lois Mai Chan. — Электрон. дан. — [Б. м., б. г.]. — Режим доступа: http://www.loc.gov/catdir/bibcontrol/chan_paper.html. — Загл. с экрана.
4 Clavel-Merrin G. MACS (Multilingual access to subjects) [Электронный ресурс] / Genevieve Clavel-Merrin. — Электрон. дан. — [Б. м., б. г.]. — Режим доступа: http://eprints.rclis.org/archive/00000277/01/clavel-merrin_eng.pdf. — Загл. с экрана.
5 Heiner-Freiling M. Survey on subject headings languages used in national libraries and bibliographies / Magda Heiner-Freiling // Cataloging and classification quaterly. — 2000. — Vol. 39. — № 2. — P. 189.
6 Landry P. Subject access project comparative analysis of titles using LCSH, RAMEAU, SWD/RSWK [Электронный ресурс] / Patrice Landry. — Электрон. дан. — [Б. м., б. г.]. — Режим доступа: http://infolab.kub.nl/prj/ macs/pub/2comparative_analysis.pdf. — Загл. с экрана.
7 MacEwan A. Working with LCSH: the cost of cooperation and the achievement of access. A perspective from the British Library [Электронный ресурс] / A. MacEwan. — Электрон. дан. — [Б. м., б. г.]. — Режим доступа: http://www.ifla.org/IV/ifla64/033-99e.htm. — Загл. с экрана.
8 McGarry D. Guidelines for subject authority and reference entries / D. McGarry // International cataloguing and bibliographic control. — 1996. — Vol. 25. — № 3. — P. 67—78.
9 McGarry D. International сooperation in subjects analysis / D. McGarry // International cataloguing and bibliographic control. — 1994. — Vol. 23. — № 4. — P. 77—81.
10 Vizine-Goetz D. Dewey in CORC: classification in metadata and pathfinders / D. Vizine-Goetz // Journal of international cataloging. — 2001. — Vol. 4. — № 1/2. — P. 67—79.
Тема номера

№ 6 (456)'24
Рубрики:
Рубрики:

Анонсы
Актуальные темы