Поиск информации во всемирном сети — задача не всегда простая. Персонализированные страницы — дополнительный источник биобиблиографических данных, который вскоре может стать основным.
Мы живем в век информации: скорость ее передачи, нарастающий информационный «шум», требуют от современного человека все большей гибкости и острой восприимчивости с умением отбирать и находить нужное в стремительном информационном потоке.
«Наука начинается там, где начинают измерять», — говорил Д. И. Менделеев. Содержательные исследования сети как информационного и библиографического источника для ученых проводится с конца 90-х годов ХХ века. Походы к ее описанию связаны с поиском определяющих параметров и характеристик источников информации самой различной природы. В это же время возникает и «вебометрия», изучающая с помощью современных инфометрических (библиометрических) методов характер и свойства сети Веб. Вебометрия основана на библиометрических методах, используемых в библиографических базах данных и базах данных цитирования. При помощи вебометрии изучается содержание веб-страниц, сопоставляется их дизайн и содержание, проводится анализ файл-протоколов как источников информации для изучения посещаемости и использования баз данных и интернет-страниц. На базе вебометрии предлагаются всевозможные алгоритмы поиска и рассматриваются различные методы сбора данных в сети. Особо подчеркивается, что сбор данных в сети следует осуществлять очень тщательно из-за постоянных изменений в ней.
В данной статье анализируется лишь одна форма представления информации в сети — персонализированные страницы ученых, которые появились в современном виде в середине 90-х годов ХХ века, а сейчас становятся все более распространенным средством не только предоставления данных об ученых, но и средством их научной коммуникации и взаимодействия. Библиометрический анализ персонализированных страниц и их типизация — один из подходов к проблеме их активного использования в библиотечном обслуживании читателей. Для библиографа персонализированная страница — дополнительный источник биобиблиографической информации.
Рождение и перспектива использования персонализированных страниц ученых
Умирание эпистолярного жанра (от эпистола (устар.) — письмо, послание) — очень модная тема в современном мире. Обычное почтовое письмо могло утратить свое значение из-за ускорения темпа жизни и, как следствие, из-за повышенной психической мобильности современного человека. Если еще в ХIХ веке смена впечатлений ритмически совпадала с доставкой почты даже на лошадях, а ускорением служила фельдсвязь (специальная служба связи, заключавшаяся в пересылке важных секретных документов через фельдъегерей), то технический прогресс ХХ века, повысивший в несколько раз скорость доставки письма, все-таки перестал успевать за сменой настроений пишущего письмо человека. С появлением интернета переписка через послание писем приобрела другое качество. Изначальное свое развитие Всемирная паутина получила от электронной переписки и, судя по скорости развития сети, ее темпоритм пока совпадает с внутренним темпоритмом пользующегося новым инструментом письма-послания человека. С точки зрения традиционного письма, эпистолярный жанр делает качественный скачок. Под этим углом зрения персонализированную страницу можно рассматривать как количественное сохранение собранных в одном месте писем, дневников, мемуаров, резюме и т. п. С появившимися техническими возможностями объявить о себе всему свету стали создаваться (писаться, набираться) персонализированные страницы. Сеть как новый инструмент общения стоит на старом фундаменте — письме.
Большинство веб-серверов, лидирующих ныне в своих областях, когда-то были простыми персонализированными страницами. Персонализированная страница — это фундаментальная основа «всемирной паутины», та первая ячейка, из которой соткан интернет, вернее, самая популярная его составляющая «World Wide Web» («WWW»).
Персонализированная страница — это электронный документ, состоящий из одного и более файлов, содержащих определенный текст и ссылки и размеченных языком программирования HTML и имеющий собственный уникальный универсальный местоопределитель ресурса (URL-адрес).
Персонализированная страница — это и история науки, и ее современность, и взгляд вперед, и новые формы научного взаимодействия и общения ученых. Прообразом персонализированной страницы можно считать персонализированные базы данных, а еще глубже — биобиблиографические справочники.
Страницы ученых многогранны, предлагают самые различные текстовые, графические, звуковые, фото- и видеоматериалы о них. Они позволяют быстро уточнять биографические, библиографические сведения о человеке, специалисте. Однако, далеко не каждая персонализированная страница содержит все необходимые библиографу сведения. Для рационального их использования важна типизация страниц по содержательным и техническим признакам.
Методика исследования включала следующие ступени:
Подготовительный этап. Составление списка авторов для поиска персонализированных страниц в сети.
Для этой задачи был использован систематический каталог зарубежных авторов РНБ. Из разделов «Социология» и «Экономика» были взяты подряд без ограничения года, места и типа издания по 10 библиографических описаний из каждого раздела. Так как монографии и статьи очень часто выполнены не одним, а двумя и более авторами, то уже из 20 изданий было выписано 33 автора и/или редактора, чьи имена затем проверялись на наличие персонализированной страницы в интернете. Поиск проводился через поисковую систему Alta Vista и поисковый каталог Yahoo. Были опробованы также и такие поисковые системы как Lycos и HotBot, но поиск в них не принес никаких дополнительных результатов. На этом этапе исследования в Yahoo и Alta Vista проверялось по 100 ссылок на каждую выписанную фамилию. При поиске из 33 авторов и/или редакторов в интернет-сети было найдено лишь 3 персонализированных страницы: на чешском, сербском и немецком языках. То есть на подготовительном этапе в феврале 2000 года была получена достаточно низкая частота создания персонализированных страниц социологами и экономистами — менее 10 %. Была проведена первичная обработка найденных страниц и выделены возможные 147 признаков их библиометрического анализа.
Этап 1. Изменение условий поиска персонализированных страниц.
После первых пробных попыток поиска пришлось сократить количество испытуемых из-за сложности поиска авторов со специфическим написанием имен и фамилий при наличии букв типа: ь, д, г, ц, у, и и т. п. Например: Hilsnerova Afйka; Iluze Askuteи; Brьggemann Wolfgang. По причине незнания языков западных славян пришлось отказаться от поиска и обработки этой группы авторов. Тем не менее, была обработана англоязычная персонализированная страница словенки Татьяны Баджик (Tatiana Bajuk Sencar). После смыслового, терминологического, топографического и хронологического уточнения с конкретизацией по языку было решено ограничиться тремя ведущими языками: английским, немецким, французским — и отбором авторов, издавших собственную монографию не ранее 1990 года или выступивших в роли редактора сборника научных работ с указанного года. При осмыслении поисковой ситуации и апробировании каждого заданного элемента на роль определителя поиска критерием отбора авторов, имеющих персонализированную страницу, было заявлено опубликование монографии или редактирование научного сборника не ранее 1990 года. Хронологический охват объясняется тем, что сеть на 1990 год насчитывала десятки тысяч компьютеров, а сегодня счет компьютеров в сети идет на сотни миллионов. 1990 год был избран стартовым еще и потому, что система «Word Wide Web», где размещаются персонализированные страницы, была разработана в 1991 году. Монография, как итог интеллектуальной деятельности, свидетельствует об определенной научной известности автора и предполагает возможность появления его страницы в сети.
В разделах «Социология» и «Экономика» были просмотрены 1464 библиографических описания за десять лет: 1990—2000 гг. В окончательном варианте были отобраны имена 150 зарубежных авторов с латинской транскрипцией, по которым и осуществлялся поиск персонализированных страниц: 33 (из них 12 экономистов и 21 социолог) человека на «нулевом» цикле и 117 (из них 62 экономиста и 55 социологов) человек при выбранном итоговом определителе поиска. Необходимо отметить, что на первом этапе исследования выписка ряда имен и проверка списка авторов на наличие персонализированной страницы в интернете были совмещены по времени и проводились параллельно.
Сначала в поисковых системах, при наличии длинного списка найденных адресов с указанной фамилией автора, просматривалось до 100 первых ссылок. Но приобретенный опыт показал, что рационально ограничиться 50 ссылками. Персонализированные страницы находились на самых разных позициях при поиске: под первым, двенадцатым-пятнадцатым и даже тридцатым и более, но не далее пятидесятого номера выданного списка электронных адресов. Для ускорения поиска постепенно сложился собственный метод:
1. Вводилась фамилия автора с инициалами и указанием сферы деятельности.
2. Отыскивалась любая сетевая страница с расшифровкой инициалов автора.
3. Затем вводилась фамилия и полное имя автора.
4. Иногда (при наличии полного тезки) для перепроверки к полному имени добавлялась сфера деятельности.
При таком приеме поиска при наличии персонализированных страниц поисковая система Alta Vista и поисковый каталог Yahoo отмечали их в первой десятке ссылок. В случае распространенных фамилий такая процедура значительно сокращала список выдаваемых поисковиком электронных адресов. Оставалось только уточнить область деятельности выдаваемого поисковой системой автора для исключения полного тезки исследуемого лица: на 50 авторов пришлось 9 человек однофамильцев с теми же инициалами и 2 полных тезки, принадлежащих научному миру, но интересующихся другой областью знаний (в нашем случае это были историк и математик). Для детального анализа были выявлены 20 персонализированных страниц.
Этап 2. Использование базы данных для формирования поискового массива авторов.
Для дополнения списка ученых-гуманитариев была взята электронная версия указателя (БД) Science Citation Index.
В практике библиографирования и библиографического обслуживания чаще всего обращаются к реальному документальному потоку. Вместе с тем в сложных случаях поиска библиографы издавна практиковали выявление нужной информации через списки литературы к известным читателю публикациям, то есть через поток цитированной литературы, однако из-за чрезвычайной трудоемкости такой путь избирался крайне редко. Появление указателей (БД) Science Citation Index, Social Science Citation Index, Arts and Humanities Citation Index изменило ситуацию и сделало эту процедуру гораздо более доступной. Они дают возможность оперативно выявить ведущих специалистов мира по узкой проблеме, наиболее цитируемые журналы, конкретные публикации. Электронная версия Science Citation Index по гуманитарным наукам на CD-дисках имеет одну общую сводную базу с предложением поиска по ключевым словам.
Из электронной версии Science Citation Index по гуманитарным наукам за 2000 г., январь—ноябрь 2001 г. и январь—март 2002 г. была сделана репрезентативная выборка по ключевым словам: «philosophy» (философия), «philology» (филология), «psychology» (психология) и «linguist» (лингвистические) (на ключевое слово «linguistics» (лингвистика) не было дано ни одной ссылки).
На основе полученных в электронной версии Science Citation Index по гуманитарным наукам 845 работ было решено заняться поиском персонализированных страниц ученых-гуманитариев, применяя ключевые слова из таблицы до момента нахождения в сети 30 персонализированных страниц.
Для поиска персонализированных страниц вновь использовались поисковая система Alta Vista и поисковый каталог Yahoo. К вышеизложенной методике поиска персонализированных страниц в сети добавились еще некоторые ключевые моменты:
• Так, например, Dr. Thomas S. Price на персонализированной странице в сети представлен как Tom Price. Tom — это полное имя от уменьшительного Thomas. Но через поисковые машины из-за расхождения в написании персонализированная страница на имя Thomas S. Price не была найдена. Видимо, для поисковых систем не установлен автоматический перевод к полным и уменьшительным именам с разным правописанием, что нужно учитывать при поиске. Идея краткого написания имени возникла при нахождении персонализированной страницы данного ученого через его соавтора Eley T. C.
• Полное имя автора Johnstone-B. было найдено по ключевым словам «Johnstone B., Voice in Language» в поисковой системе Alta Vista: George (Brick) Reter Johnstone. Были перепробованы все варианты поиска этого автора со сложносоставной фамилией, которые не приносили положительного результата. И только методом проб и ошибок с исключением тех или иных компонентов на словосочетание «George Johnstone Brick» поисковый каталог Yahoo под первым номером выдал персонализированную страницу данного ученого-лингвиста;
• В электронной версии Science Citation Index по гуманитарным наукам Vanderlely-HKJ, написавшая статью «Lexical Word-Formation in Children with Grammatical Sli — A Grammar-Specific Versus an Input-Processing Deficit», была найдена только через инициалы «HKJ» и название работы. В списке работ, представленных в интернет-сети, фамилия автора этой статьи была написана раздельно: Van der Lely. По данным параметрам поиска был найден в сети выход на полное имя автора Heather K.J. Van der Lely, через которое поисковая система Alta Vista вывела на персонализированную страницу автора.
Итак, при поиске в сети авторов со сложносоставными именами и фамилиями необходимо учитывать разницу в написании полного и уменьшительного имени, разницу в заданости поисковым машинам длинных сложносоставных фамилий и разницу написания иностранных фамилий при переводе с языка на язык.
Планируемые 30 персонализированных страниц были получены уже в этой подгруппе на списке имен 106 авторов. В задачи исследования не входило подробное изучение соотношения авторов, представленных в Science Citation Index с частотой наличия их страниц в сети, для этого нужно проведение более детального исследования. Но при беглом просмотре можно сказать, что около 30% (28,3%) авторов, включенных в Science Citation Index по гуманитарным наукам за 2000 год, используют интернет для передачи своих знаний, что более чем в два раза превышает показатель соотношения представленности ученых в каталоге РНБ с наличием их страниц в интернете (13,3%). Эти данные только предварительные и приблизительные, потому что исследование первого и третьего этапа отстояло во времени с разницей в один год. Для более точной оценки необходимо дополнительное исследование по данной теме.
Этап 3. Библиометрический анализ персонализированных страниц.
Осуществлялся по всему кругу выявленных на предварительном этапе признаков, объединенных в следующие группы:
• Деятельностные, креативные характеристики (образование, область деятельности, темы исследования, публикации, международные связи и т. д.).
• Социальные характеристики (даты жизни, место рождения и жительства, общественная и политическая деятельность, спонсоры, семья, друзья, членство в обществах и организациях и т. д.).
• Характеристика духовного мира личности (интересы, хобби и увлечения, занятия спортом, членство в клубах, участие в культурной жизни и т. д.).
• Биологические характеристики (пол, возраст, здоровье и т. д.).
• Технические характеристики (имена создателя и веб-мастера страницы, дата создания страницы, посещаемость страницы, ссылки на работы автора в электронном виде и т. д.).
Для каждой страницы заполнялась карта, где отмечались фактические сведения по каждому признаку, а затем данные объединялись в сводную таблицу.
На основе исследования 50 персонализированных страниц был выявлен ряд типологических особенностей, определен ряд признаков, по которым можно анализируемые страницы разбить на подгруппы: «имиджевый», «представительский», «содержательный».
«Имиджевые» персонализированные страницы ученые ограничивают информацией о себе по схеме резюме. Этот тип может быть использован для поиска ведущих специалистов в конкретной области деятельности.
«Представительские» страницы добавляют к описанию сферы деятельности практическую реализацию идей (библиографическое описание опубликованных работ). Как правило, указана первая печатная публикация автора. Опубликованные работы часто подразделяются на следующие группы: монографии; обзоры; справочные издания; работы, редактируемые лицом; работы, рецензированные лицом и т. п. без аннотации, реферата и/или полного текста своих работ. Этот тип страниц может быть полезен в библиографической практике, как для поиска изданий автора, так и для уточнения фактов выхода публикаций в свет.
«Содержательные» персонализированные страницы добавляют к библиографическому описанию полный текст одной или нескольких работ автора, краткую аннотацию, реферат, ссылки на работы автора в электронном виде. Этот тип страниц наиболее полезен и может быть использован для подготовки всего круга библиографических задач.
Была отслежена также динамика наполнения персонализированных страниц ученых-гуманитариев и отмечена тенденция перехода от «имиджевого» к их «содержательному» типу: если в 2002 году персонализированных страниц содержательного типа выявлено всего 5%, то к 2003 году их показатель вырос до 18%.
Данная тенденция к более содержательному представлению научного творчества зарубежных ученых-гуманитариев может служить яркой демонстрацией «эффективного подхода» к использованию современных информационных технологий. Такие же тенденции, несомненно, будут присутствовать и в отечественной научной среде. Благодаря этому библиограф найдет новое дополнительное средство для получения оперативной библиографической и фактографической информации.
Персонализированная страница может также стать вскоре и основным источником биографической и библиографической информации: это возможность предоставления на всемирное обозрение сведений о себе и своих идеях в виде опубликованных и неопубликованных документов, их библиографического описания, краткой аннотации или реферата. Она может использоваться как основа создания научных биографий, а также как отправная точка библиографического поиска. Через персонализированную страницу возможно получение известности в кругу интересующих автора научных проблем, что позволяет ученому решить многие вопросы создания собственного имиджа в научном сообществе. Персонализированная страница может использоваться как плацдарм для проведения развивающихся в настоящее время историко-научных, социально-психологических и других исследований научного творчества, для поиска партнеров, авторов, сподвижников, оппонентов и единомышленников в области конкретных научных интересов.
Итак, рассматривая персонализированную страницу как средство не только предоставления данных об ученых, но и как средство коммуникации и взаимодействия на качественно новом электронном уровне, призываем творческих и компетентных библиографов делиться своими знаниями в сети, используя, изучая и создавая собственные персонализированные страницы. В их динамике, в ходе анализа и выявления отдельных закономерностей сетевой информации, со временем может и должна быть сформирована модель всемирной электронной библиотеки. На ее основе можно будет не только осмысливать историю, описывать процессы настоящего, но и прогнозировать тенденции развития конкретных процессов и явлений. Это еще раз доказывает необходимость серьезных сетеметрических исследований.
Алексей Николаевич Ежов, библиограф интернет-класса РНБ

