Журнал для профессионалов. Новые технологии. Традиции. Опыт. Подписной индекс в каталоге Роспечати 81774. В каталоге почта России 63482.
Планы мероприятий
Документы
Дайджест
Архив журналов - № 8 (8)'03 - Информационный анализ
Информационное моделирование объекта
Галина Феофановна Гордукалова,
заведующая кафедрой гуманитарной информации СПбГУКИ,
доктор педагогических наук

Информационное моделирование объекта —первый, преимущественно библиографический этап «обогащенной» схемы информационно-аналитической деятельности, который авансирует успех информационной диагностики в целом. Его результаты можно использовать как конечный «сырой» продукт информационной аналитики.

Три предыдущие занятия мы посвятили достаточно частным и неординарным направлениям информационного анализа. Каждое из них было рассчитано на освоение сквозных приемов и процедур с кратким экскурсом в ближайшую историю информационно-аналитической деятельности. Внимательный читатель мог заметить, что предложенные варианты не встречались ему в специальной литературе — они создавались в процессе подготовки студентов библиотечно-информационного факультета Санкт-Петербургского университета культуры и искусств и отрабатывались нами с середины 70-х гг. по заказам предприятий. Пришло время обобщить материал в разверноутой схеме.
Попытаемся соединить разнородные процедуры в одну технологическую цепочку, утрачивая при этом особенное для каждого из занятий. Существует одна хитрость: как только человек приступает к синтезированию интеллектуальных и даже социальных ситуаций в целом, он непременно выходит на общеизвестное, в значительной мере тривиальное знание. В этом можно убедиться на двух важных для нас примерах.
Библиография как особая специализация общественной практики рождена не первыми указателями Франции и даже не настенными каталогами Египта. Думаю, что первые библиографические навыки складывались у значимых для каждого племени лиц, запоминавших последовательность сезонных и событийных ритуалов, действий, героических песнопений. Они были хранителями полезного знания, социальной памятью племен и народов. В дописьменный период складывались приемы запоминания, отбора и систематизации необходимого для жизни знания, верований и страхов древних жителей.
Создание письменности как основного способа фиксации и распространения знания позволило накапливать опыт свертывания сведений о нем. Сейчас мы можем назвать несколько узловых работ, обстоятельно описывающих процедуры библиографирования литературы. Все методически оригинальные труды фиксируют процессы выявления, отбора, характеристики, систематизации литературы с небольшими разночтениями в их описании. Почему же за 40 тысяч лет не сложилась четко прописанная и детальная методика библиографирования знания?
Информационно-аналитическая деятельность — как опыт получения выводного знания об объекте на основе уже известного знания о нем — также имеет давние корни в любой сфере познавательного, образовательного, управленческого характера. В самостоятельную хозяйственную специализацию она выделилась лишь в середине ХХ века (появление центров анализа информации, специализированных периодических изданий обзорного характера типа «Успехи науки», «Итоги науки и техники» и т. д.). Разнообразный опыт информационного анализа длительно накапливался в рамках деятельности разведывательных служб, редакций газет и журналов. Библиограф, составляя проблемно-тематический указатель или выделяя новую самостоятельную рубрику в нем, подытоживал и прогнозировал развитие знания. Почему же в характеристике информационно-аналитической работы мы имеем столь «неразработанную» методику, ограничивающуюся, как правило, общенаучными терминами «анализ» и «синтез»?
Ответ прост, он вытекает из сложности, нерасчленимости интеллектуальных процедур. Академик Н. П. Бехтерева на упрек Комиссии по борьбе с лженаукой РАН отвечает: «Пока не существует не только теории, но и правдоподобной гипотезы о том, как работает целостный мозг»1.
Можем ли мы ждать, пока тайны интеллектуальной деятельности будут открыты физиологами или психиатрами? Отсутствие собственных, достаточно формализованных методик приводит авторов профильных публикаций к заключению, что анализ должен осуществляться специалистами, работающими в конкретной отрасли знания, а вовсе не информационными аналитиками. То есть задача вновь перекладывается на плечи ученых-отраслевиков, а мы остаемся «беспристрастными», лишь констатирующими наличие публикаций об объекте, библиографами. Можно и опустить руки: оставить библиотекаря-библиографа в конкуренции с быстрым машинным поиском, сделать из него не очень опытного «посредника», обучающего читателей основам интернет-поиска, да хранителя и знатока старых книг.
Если окинуть многочисленные известные схемы, предложенные для описания информационно-аналитической деятельности, то мы увидим совершенно неспецифические этапы, характерные для любой социальной деятельности: сбор информации об объекте, ее анализ и обобщение — синтез. Попробуем обогатить эту схему, включая возможные варианты и процедуры анализа, не забывая о трех ограничительных и обязательных условиях.
1. Информационный анализ осуществляет библиограф, а не специалист конкретной области знания.
Накапливая методики информационной диагностики, мы запрещали студентам читать дополнительную литературу о самом объекте. Первые опыты запрета были приняты в библиометрических исследованиях студентов 1980—1986 гг., а затем проведены «чистые» эксперименты. Например, дипломница В. Шашера, ныне опытный сотрудник Брянской областной библиотеки, прогнозировала развитие знания о фотодиодах, не зная, что же это такое, как они выглядят и для чего предназначены. Из 11 выявленных ею тенденций развития объекта лишь 2 оказались ошибочными из-за разницы профессионального сленга в англоязычной литературе! При этом уже в 70-х гг. руководителям информационных служб в компаниях США предлагалась следующая рекомендация: ошибочный прогноз обходится в 1,5 раза дешевле, чем отсутствие прогноза!
2. Информационный анализ должен быть направлен на получение нового знания об объекте на основе уже известных сведений о нем.
Библиографическое, затем информационное моделирование объекта с обязательным выходом на информационное прогнозирование и конкретные рекомендации читателю — автору запроса, но не по отношению к источникам информации, а в реальном его поведении, взаимодействии с анализируемым объектом. Без такой установки методики синтеза знания об объекте будут неполны, недееспособны для современного уровня технологий управления знаниями.
3. «Главное меню» — методическая схема информационно-аналитической деятельности, которая может быть линейной, последовательной лишь условно, поскольку задачи разнообразны, а мы пытаемся формализовать интеллектуальные процедуры, которые аналитик нередко осуществляет параллельно.
В идеале я бы предложила четырехмерную карту, а не схему, где каждый аналитик выбирает свой путь под свою задачу. К сожалению, до такого уровня освоения информационно-аналитической деятельности пока не дотянуться, но полагаю такую задачу перспективной: быстроидущие — попробуйте сами!
Учитывая объем материала, поделим его на две части. В данном номере поместим схему начального этапа, который хорошо будет воспринят на конкретном примере. Можно выбрать реальный запрос, составить возможный запрос регионального характера или решить личную задачу (например, найти рациональный вариант обмена квартиры). При освоении схемы важно увидеть сходство шагов с обычными библиографическими процедурами.
Этап 1. Информационное моделирование объекта
Шаг 1. Анализ предметного поля объекта (ПП-объекта). Основные процедуры и правила анализа ПП-объекта были рассмотрены на занятии 3 (см. «Библиотечное Дело» № 4, с. 16—17). Можно повторить их на новом примере. В частности, при поиске варианта обмена квартиры должны быть выделены и объединены в родственные группы все ключевые слова, характеризующие потенциальное жилье (район, этаж, площадь и т. д.). Для этого можно использовать бюллетени недвижимости, газетные и электронные объявления об обмене.
Шаг. 2. Локализация объекта. Осуществляется по результатам анализа ПП-объекта, используя несколько знакомых библиографу процедур: формулируются временные, тематические, географические и некоторые качественные критерии отбора сведений об объектах-аналогах. Например, вы желаете выявить перспективные тенденции развития бытовой холодильной техники. Эти тенденции могут оказаться различными для отечественных и зарубежных аналогов, конкретных торговых марок и т. д. Следовательно, необходимо сформулировать критерии отбора сравниваемых объектов-аналогов: «ведущий отечественный — ведущий зарубежный аналог», либо конкретнее — «Бирюса» — «Норд», либо «ведущие зарубежные аналоги — перспективный образец объекта» и т. д. Формулировка критериев зависит от цели анализа (запроса) и пожеланий заказчика. Благодаря этому в процедурах шага 4 и 5 легко отсекаются избыточные информационные шлейфы по географическим, хронологическим, языковым и иным критериям отбора.
Например, при поиске варианта обмена квартиры будут сформулированы требования к жилью и на их основе отсечены потоки рекламных объявлений по каждому из требований.
Шаг 3. Селективные процедуры: Ранжирование индикаторов оценки объекта. Индикаторы — это количественные или любые качественные характеристики объекта, показывающие изменения в состоянии объекта или изменения в знании об этом объекте. Например, биржевые-оптовые-розничные цены на конкретный товар, время существования фирмы на рынке, размер экрана по диагонали, новые марки модема, потребительские свойства йогуртов и др. Изменение знания об объекте фиксируется появлением новых ключевых слов, идей, гипотез, фактов, снижением частоты использования ключевых слов ядерной зоны А, появлением патентов, рекламных объявлений о новых свойствах объекта и др.
Основные индикаторы выявляются уже на этапе анализа ПП-объекта. Дополнительный перечень индикаторов составляется на основе формализованного анализа текстов обзорных статей об объекте (аспектное или анкетное реферирование, контент-анализ). Индикаторы систематизируются — объединяются в родственные группы, а затем ранжируются с позиций цели запроса по их значимости для читателя-заказчика. Главная задача библиографа — определить полезность и достаточность избранных индикаторов, отсечь избыточные.
Могут быть выделены индикаторы идентификационные (способствующие опознанию объекта в публикациях), оценочные, прогнозные. Итоговый перечень индикаторов, выстроенный по убывающей их значимости, можно представить заказчику для утверждения, чтобы избежать информационных шумов при поиске информации об объекте.
Так, при поиске варианта обмена двухкомнатной квартиры на большую ранжированный список индикаторов может выглядеть следующим образом: общая площадь — более 50 кв. м, кухня — более 8 кв. м, дом — кирпичный, желательно без доплаты и т. д. Это позволит быстро отсекать поток нерелевантных рекламных объявлений по первому индикатору, не вводя их в массив для дальнейшего рассмотрения.
Шаг 4. Библиографические процедуры: поиск, оценка и выбор источников информации об объекте. Этот шаг — сугубо библиографический, понятный как по процедурам, так и по критериям оценки источников информации.
В качестве дополнительной процедуры, особенно в режиме информационного мониторинга, следует рекомендовать формульное ранжирование источников информации по их ценностным свойствам — полнота отражения объекта, достоверность-точность, оперативность информации об объекте. Для этого проводится пробный поиск сведений об объекте в каждом из потенциальных источников информации, а затем составляется формульная таблица с простой шкалой:
А — достоверный (или полный, или оперативный);
В — обычно достоверный (обычно полный, средняя оперативность);
С — иногда достоверный (иногда встречаются дополняющие данные, иногда дает оперативные сведения о…);
N — недостоверный (неполный, неоперативный);
X — достоверность (полнота, оперативность) неопределена.
Оцениваются только необходимые свойства для периодических или продолжающихся изданий, сайтов, поддерживаемых в актуальном состоянии. Из их числа отбираются источники, имеющие в своей формуле наилучшие сочетания по всем анализируемым свойствам — ВАА, ААС и подобные. Например, для лучшего обмена квартиры главными являются оперативность и достоверность, но не столь обязательна полнота каждого источника информации. Поэтому могут быть отобраны для анализа источники с формулами АХА, АСА, ВХА.
Шаг 5. Селективные процедуры: отбор информации об объекте. Осуществляется привычными для библиографа приемами, которыми он пользуется при выполнении фактографических запросов: по ключевым словам, предметным рубрикам, выделенным индикаторам.
Если данные об объекте единообразны и формализованы, то достаточно простой разметки источника информации или прямого ввода сведений в базу данных (таблицу). В случаях сложного отбора профильной информации, особенно из текстовых источников обзорного характера, может производиться многовариантный отбор по нескольким этапам — разметка текста, выделение значимых фрагментов текста, отбор данных по индикаторам 1—3, отбор данных по индикаторам 4-N, отбор оценочных и прогнозных характеристик объекта.
Шаг 6. Свертывание и нормализация информации — приемы аналитико-синтетической переработки информации. Они включают традиционные процедуры свертывания (индексирование, библиографическое описание, аннотирование, аспектное (анкетное) реферирование) и приведение выявленных данных об объекте к определенному виду (стандарту) через перевод единиц измерения в текстах публикаций к принятым референтом-аналитиком (доллары—рубли, килограммы—фунты, короткие тонны—тонны и др.).
Шаг 7. Классификационные процедуры — типизация, систематизация, предметизация, фасетизация, шкалирование, картографирование и другие классификационные приемы.
Отбираются те приемы, которые уместны для представления объекта: чем локальнее объект, тем дальше его рубрикатор от обобщенных библиотечно-библиографических классификаторов.
Для библиографа необычными являются классификационные процедуры оценочных характеристик объекта, а также дифференциация данных по набору признаков. Они осваиваются постепенно, по мере накопления личного опыта и усложнения объекта информационной диагностики.
Шаг 8. Оценочные процедуры: оценка качества информации об объекте. Связаны с проверкой найденных сведений на релевантность — соответствие запросу, пертинентность — соответствие конечной цели запроса. Одновременно проводится оценка их полноты (достаточности) для выполнения конкретных задач анализа. Принимаются решения:
• об отсечении избыточной информации
• удалении устаревших данных
• наличии пробелов в информационной модели объекта
• выборочном восполнении и обновлении сведений о нем.

Информационная избыточность массива не менее опасна, чем пробелы в нем. Характеризуя технологии промышленного шпионажа и контрразведки в 1984 г., Bottom N. R. и Gallati R. R. J. иронично отмечали, что поток информации проще измерять в ярдах, метрах, фунтах или килограммах, а эффект умножения информации об объекте поразителен. Они предлагают жесткий контроль за появлением несущественной информации в массиве, ее уничтожение до этапов анализа-синтеза. Мы же предлагаем выделять несущественную и устаревшую информацию в архивную часть массива, поскольку она может оказаться неожиданно полезной на заключительном этапе как фоновая, подтверждающая динамичные процессы в состоянии объекта.
Результатом этого шага должна быть общая оценка тождественности информационной модели самому объекту — достаточна, непротиворечива, неизбыточна, без существенных пробелов.
Шаг 9. Ввод и контроль ввода данных. Первичная аналитико-синтетическая обработка, формализация, систематизация и форматирование данных частично уже были осуществлены. На этапе ввода сведений в базу данных (таблицы) существует две главные проблемы: утрата значимой информации из-за неудачной формы представления данных и ошибки ввода.
Разработка формата ввода (в том числе и на бумажном носителе) — искусство аналитика, его умение представить форматы через конечную задачу информационного исследования.
Так, на практических занятиях по курсу «Информационный мониторинг» ведется непрерывная «борьба» за оптимальные форматы представления данных: даже простая замена строк на столбцы (студенты не признают рекомендуемых шаблонов!) усложняет задачу аналитика многократно, поскольку тенденции поведения объекта из явных становятся тайными. Главные правила: разработкой машиночитаемых форматов представления данных должен руководить аналитик, а не программист; форматы складываются только после многократной опытной проверки их в ручном режиме; форматы зависят от конечных задач информационного исследования.
Ввод данных может осуществлять библиограф-поисковик, референт-аналитик, аналитик-исследователь или оператор ПК, но обязателен многоступенчатый контроль ввода.
С проблемой огромных убытков я впервые столкнулась, когда в 1992 г. одно предприятие внедряло нашу систему «Информационный мониторинг» без должного контроля за вводом данных. Руководители принимали решение о закупке большой партии заокеанской пшеницы только потому, что в базу данных референт ввел цены на пшеницу в коротких тоннах, которые сравнивались с отечественными ценами на общепринятую тонну. Масштаб убытков был настолько велик, что сейчас рекомендуется многоэтапно контролировать ввод данных: два оператора вводят параллельно(!) одни и те же данные. Специальная программа их сравнивает, фиксирует разночтения; руководитель устанавливает ошибки; вносятся исправления (за рубежом по нормам допустимы 2,5 ошибки на 300 тысяч единиц ввода без административных взысканий, а меньшее число ошибок — материально поощряется).
Затем аналитик-эксперт вновь осуществляет полный (или выборочный) контроль ввода с исходных документов, либо через выявление аномальных значений индикаторов. Чувство ответственности за исходный массив можно подкрепить и нашим простым примером — выбором варианта обмены квартиры, когда любая ошибка или пробел в данных могут привести к утрате собственных денег, а качественно собранная информация — к неожиданной удаче!
Мы рассмотрели технологическую схему только первого этапа — информационного моделирования объекта. Этот этап — преимущественно — библиографический. Качество исходного массива остается за библиографом-поисковиком, но авансирует успех информационной диагностики в целом. Его результаты уже можно использовать как конечный «сырой» продукт информационной аналитики. Осуществив наиболее трудоемкую часть информационного исследования объекта, было бы странно не решиться на «сладкое» — этапы интеллектуального осмысления исходного массива!

1 (Российская научная газета. — 2003. — 25 июня. — С. 3).
Тема номера

№ 17 (467)'24
Рубрики:
Рубрики:

Анонсы
Актуальные темы