|
Грамотный ввод информации
Валентина Павловна Суворова,
старший научный сотрудник
проблемной комиссии по предметизации
и предметному каталогу РНБ
Теперь, когда прошла эйфория,
связанная с переходом
от традиционных каталогов
к электронному, наступило время отрезвления
в оценке возможностей автоматизированного поиска информации. Рассмотрим один из важнейших аспектов предметного индексирования документов.
Любая, даже самая совершенная библиотечная система способна выдавать только ту информацию, которая в нее заложена. И чем грамотнее эта информация заложена, тем более плодотворным может быть поиск читателя.
Практика показывает, что основные проблемы традиционных реальных каталогов перекочевали в электронные каталоги. Сложность заключается в том, что, во-первых, машина более строго спрашивает с индексатора ответственность на вводе информации. Во-вторых, требует более четкого соблюдения правил методики в части унификации отдельных элементов предметной рубрики (ПР) и стабилизации их сочетаемости, ибо именно от этого во многом зависит успешность поиска информации.
В данной статье речь пойдет о применении категориального метода при формировании сложной предметной рубрики. Необходимо отметить, что категориальный подход на протяжении долгого времени был предметом обсуждения теоретиков и практиков предметизации, но, как правило, пути теоретических разработок и практических потребностей индексаторов не пересекались. А поскольку метод всегда был востребован на практическом уровне, индексаторы-практики сами брались за решение проблемы, что выражалось, в частности, в разработке списков подзаголовков, необходимых для отражения литературы определенных отраслей знания.
Почему именно вопрос сочетания заголовков и подзаголовков являлся и является столь актуальным для создателей как традиционного, так и электронного каталогов? Ведь категориальный метод используется индексаторами и при разработке комплексов ПР, а соответственно и при составлении моделей ссылочно-справочного аппарата. Дело в том, что именно структура предметной рубрики обеспечивает успешный поиск читателя, ибо любая ПР — это перевод фразы естественного языка (запроса) на синтагму искусственного, в данном случае языка предметных рубрик.
Независимо от того, идет ли поиск по ключевым словам или по ПР, наилучшие результаты поиска обеспечивает набор лексических единиц, составляющих тему запроса. В случае поиска по ключевым словам грамотно составленная предметная рубрика дает наименьшее количество шума. Что же такое грамотно составленная ПР? Это рубрика, построенная в соответствии с правилами категориального анализа, который предполагает сочетание каждого подзаголовка с определенными категориями предметов.
Категории предметов могут быть более общего или частного характера, но они всегда являются объектом рассмотрения определенной отрасли знания и фиксируются в энциклопедиях, отраслевых справочных и учебных изданиях. Задача индексатора — выбрать необходимый для данной темы ряд категорий и разработать правила сочетания подзаголовков с соответствующими этим категориям заголовками.
Например, для предметизации литературы по технике в Отделе обработки и каталогов РНБ выделены следующие категории:
• Аппараты и приборы
• Детали
• Конструкции
• Материалы
• Оборудование
• Отрасли науки и техники
• Параметры, характеристики
• Предприятия, учреждения, организации
• Производства
• Промышленная продукция
• Процессы
• Системы
• Сооружения
• Средства передвижения
• Энергия
Развернутым продолжением этого перечня является дальнейшая детализация категории «Материалы»:
• Взрывчатые вещества
• Вяжущие материалы
• Горные породы. Минералы
• Древесные материалы. Целлюлоза
• Каменные материалы
• Керамические материалы
• Кожевенные материалы
• Лакокрасочные материалы. Клеи
• Металлы и сплавы
• Нефть и нефтепродукты
• Пищевые продукты
• Полимерные материалы
• Резина. Каучук
• Стекло
• Текстильные материалы
• Топливо
Такое подразделение категории «Материалы» на ряд конкретных категорий другой степени обобщения значительно расширяет количество тематических подзаголовков, необходимых для наиболее полного представления в предметизационной системе литературы о материалах. Например, в списке категорий для отражения литературы по технике зафиксирован подзаголовок «— Модификация», который в соответствии с правилами категориального анализа может быть приписан к категориям «Материалы», «Оборудование», «Промышленная продукция».
В списке категорий более частного характера для отражения литературы по категории «Материалы» зафиксировано два подзаголовка: «— Модификация» и «— Модифицирование». Соответствующая терминосистема предлагает следующее применение этих подзаголовков:
— Модификация Древесные материалы. Целлюлоза
• Полимерные материалы
• Резина. Каучук
• Текстильные материалы
— Модифицирование Металлы и сплавы
Этот пример показывает, что индексатор при формировании предметной рубрики всегда должен следовать за терминами из определенной терминосистемы, а также следить за возможностью их сочетания. Например:
• Лигнопластики — Модификация
• Ферросплавы — Модифицирование
Не менее важно при формировании предметной рубрики соблюдать основное правило методики предметизации — правило адекватного отражения содержания документа. Именно несоблюдение этого правила часто приводит к появлению рубрик, которые противоречат принципам категориального метода, и следовательно, автоматически утрачивают свои поисковые качества. Например:
Фефелов В. Н., Мозговой И. В.
Введение в АРМ химика-технолога: Учеб. Пособие. — Омск, 1999. — 164 с.
Органическая химическая технология — Автоматизированное рабочее место
Приводим статью из энциклопедического справочника «Экономика и право», М., 2000: «Рабочее место — место произведения работы и находящиеся на нем средства производства, орудия труда, приспособленные к осуществлению трудовых функций работником определенной профессии. Количество рабочих мест на предприятии должно соответствовать количеству занятых на нем работников».
В этой статье зафиксирована категория, с которой может сочетаться подзаголовок «— Рабочее место». Использование категории «Отрасль» при формулировании заголовка недопустимо.
Попова Л. Х.
Делопроизводство в управленческой деятельности таможенных органов. — Ростов н/Д, 2001. — 175 с.
Таможенное дело — Делопроизводство
Приводим статью из вышеназванного справочника: «Делопроизводство — ведение документации организации, предприятия, фирмы, прием, заполнение, оформление, отправка документов, учет и контроль за их движением и исполнением, обновление документов».
В этом примере также недопустимо применение подзаголовка «— Делопроизводство» с заголовком, соответствующим категории «Отрасль». Следует присвоить рубрику, заголовок которой соответствует категории «Предприятия»:
Таможни — Делопроизводство
Милошенко В. Е.
Криофизика: Учеб. пособие. — Воронеж, 2001. — 137 с.
Низкие температуры — Физические свойства
В данной рубрике обе лексические единицы соответствуют категории «Параметры, характеристики» и, следовательно, не могут выступать в качестве заголовка и подзаголовка предметной рубрики.
Приводим статью из «Большого энциклопедического словаря», М., 2000: «Параметр (техн.), величина, характеризующая к.-л. свойство процесса, явления или системы, машины, прибора (напр., электрич. сопротивление, теплоемкость, быстродействие, масса, коэф. трения и др.)».
В соответствии с содержанием этому документу должна быть присвоена рубрика:
Твердые тела — Физико-механические свойства при низких температурах
Все приведенные выше примеры показывают, как важно при формировании предметной рубрики опираться на категориальный метод с тем, чтобы результатом синтеза лексических единиц получить определенную конструкцию предметизационного языка, грамотно составленную как с точки зрения соответствия данной терминосистеме, так и возможности сочетания ее элементов.
Необходимо отметить, что основная масса подзаголовков может употребляться с заголовками, соответствующими разным категориям, поэтому при индексировании особенно важно присваивать документу адекватные рубрики, исходя из его конкретного содержания. Например:
Берлин А. Д.
От советского предприятия к субъекту рынка (перестройка системы управления). — М., 1998. — 208 с.
Кондитерская промышленность — Управление
Подзаголовок «— Управление» может относиться к категориям: «Оборудование», «Отрасли», «Предприятия», «Процессы», «Сооружения», «Цеха». Однако в данном документе рассматриваются вопросы управления только одной из приведенных выше категорий. Следовательно, документу должна быть присвоена рубрика: Кондитерские фабрики — Управление
Такое решение диктуется не только необходимостью соблюдения основного принципа методики предметизации, но и возможностью обеспечения более короткого пути для читателя в поиске информации. Нетрудно представить, какой объем записей будет накоплен за рубрикой, составленной по модели «Отрасль — Управление», если она будет присваиваться всем документам, содержание которых соответствует перечисленным выше категориям. Такие рубрики являются труднообозримыми для читателя, так как ему приходится просматривать большое количество записей для вычленения необходимой ему информации.
Кроме того, читатель чаще всего формулирует свой запрос адекватно необходимой ему информации и не всегда может догадаться искать ее в рубрике обобщающего характера.
С появлением электронных каталогов и необходимостью записи в формате у индексатора появляются дополнительные возможности применения категориального метода, ибо все форматы представления данных предусматривают деление заголовков предметных рубрик на отдельные категории. Так, в Российском коммуникативном формате (RUSMARC) все предметные заголовки выстраиваются в следующий ряд полей:
600 Имя лица как предметная рубрика
601 Наименование организации как предметная рубрика
602 Родовое имя как предметная рубрика
604 Имя/Заглавие как предметная рубрика
605 Заглавие как предметная рубрика
606 Наименование темы как предметная рубрика
607 Географическое название как предметная рубрика
608 Форма, жанр, физические характеристики документа как предметная рубрика
Такое деление традиционного понятия «заголовок предметной рубрики» на отдельные категории предполагает более тщательный подход к рассмотрению каждой категории заголовка, т. е. кроме выбора термина для самого заголовка требует выбора подзаголовка (подзаголовков), соответствующих данной категории.
На самом деле такая работа всегда велась индексаторами-предметизаторами, но часто на чисто интуитивном уровне или исходя из предложенных авторами названий документов.
Потребность в правилах сочетания отдельных лексических единиц при формировании сложной предметной рубрики подвигала многие библиотеки к разработке списков подзаголовков по отдельным отраслям знания как в форме рабочих картотек, так и печатных изданий. Наиболее известны «Подзаголовки к рубрикам предметного каталога ГПНТБ» (М., 1968), «Список рубрик предметного каталога ГЦНМБ» (М., 1983), в котором даны подзаголовки к 16 категориям заголовков. На протяжении большого периода времени такие работы велись и ведутся в Отделе обработки и каталогов РНБ. Результатом этих работ стали: «Список типовых подзаголовков для отражения в предметном каталоге литературы по технике» (Л., 1983), «Список подзаголовков для отражения в предметном каталоге литературы по категории “Материалы”» (Л., 1990).
С появлением электронного каталога эти работы заметно активизировались. Так, в сборнике «Предметный поиск в традиционных и нетрадиционных информационно-поисковых системах» (СПб., 2001. Вып. 15) опубликованы материалы, в которых предлагаются списки тематических подзаголовков к заголовкам ПР Имя лица (Никольцева Н. П. Имена как предметные рубрики) и Географическое наименование (Смирнова И. П., Суворова В. П., Цвицинская Л. А. Географическое наименование как предметная рубрика. Методика предметной обработки документов).
В печати находится следующий выпуск сборника, в котором публикуется список тематических подзаголовков для ПР — Наименование организации как предметная рубрика (Суворова В. П. Наименование организации как предметная рубрика. Методика предметной обработки документов). Кроме того, подготовлен электронный вариант списка подзаголовков для предметизации литературы по химической технологии. В процессе редактуры — список подзаголовков для предметизации медицинской литературы.
Поскольку такие списки составлены в строгом соответствии с категориальным методом, они могут служить индексатору не только при обработке новой литературы, но и редактировании файла предметных рубрик. Работы по созданию списков тематических подзаголовков будут продолжены и со временем войдут в национальные правила электронной предметизации.
|
|