Измерение информации в сети. Методика библиометрического анализа персонализированных страниц ученых

Поиск информации во всемирном сети — задача не всегда простая. Персонализированные страницы — дополнительный источник биобиблиографических данных, который вскоре может стать основным.
Мы жи­вем в век ин­фор­ма­ции: ско­рость ее пе­ре­да­чи, на­рас­та­ю­щий ин­фор­ма­ци­он­ный «шум», тре­бу­ют от сов­ре­мен­но­го че­ло­ве­ка все боль­шей гиб­кос­ти и ост­рой восп­ри­им­чи­вос­ти с уме­ни­ем от­би­рать и на­хо­дить нуж­ное в стре­ми­тель­ном ин­фор­ма­ци­он­ном по­то­ке.
«На­у­ка на­чи­на­ет­ся там, где на­чи­на­ют из­ме­рять», — го­во­рил Д. И. Мен­де­ле­ев. Со­дер­жа­тель­ные ис­сле­до­ва­ния се­ти как ин­фор­ма­ци­он­но­го и биб­ли­ог­ра­фи­чес­ко­го ис­точ­ни­ка для уче­ных про­во­дит­ся с кон­ца 90-х го­дов ХХ ве­ка. По­хо­ды к ее опи­са­нию свя­за­ны с по­ис­ком оп­ре­де­ля­ю­щих па­ра­мет­ров и ха­рак­те­рис­тик ис­точ­ни­ков ин­фор­ма­ции са­мой раз­лич­ной при­ро­ды. В это же вре­мя воз­ни­ка­ет и «ве­бо­мет­рия», изу­ча­ю­щая с по­мощью сов­ре­мен­ных ин­фо­мет­ри­чес­ких (биб­ли­о­мет­ри­чес­ких) ме­то­дов ха­рак­тер и свой­ства се­ти Веб. Ве­бо­мет­рия ос­но­ва­на на биб­ли­о­мет­ри­чес­ких ме­то­дах, ис­поль­зу­е­мых в биб­ли­ог­ра­фи­чес­ких ба­зах дан­ных и ба­зах дан­ных ци­ти­ро­ва­ния. При по­мо­щи ве­бо­мет­рии изу­ча­ет­ся со­дер­жа­ние веб-стра­ниц, со­пос­тав­ля­ет­ся их ди­зайн и со­дер­жа­ние, про­во­дит­ся ана­лиз файл-про­то­ко­лов как ис­точ­ни­ков ин­фор­ма­ции для изу­че­ния по­се­ща­е­мос­ти и ис­поль­зо­ва­ния баз дан­ных и ин­тер­нет-стра­ниц. На ба­зе ве­бо­мет­рии пред­ла­га­ют­ся все­воз­мож­ные ал­го­рит­мы по­ис­ка и рас­смат­ри­ва­ют­ся раз­лич­ные ме­то­ды сбо­ра дан­ных в се­ти. Осо­бо под­чер­ки­ва­ет­ся, что сбор дан­ных в се­ти сле­ду­ет осу­ще­с­твлять очень тща­тель­но из-за пос­то­ян­ных из­ме­не­ний в ней.
В дан­ной статье ана­ли­зи­ру­ет­ся лишь од­на фор­ма предс­тав­ле­ния ин­фор­ма­ции в се­ти — пер­со­на­ли­зи­ро­ван­ные стра­ни­цы уче­ных, ко­то­рые по­я­ви­лись в сов­ре­мен­ном ви­де в се­ре­ди­не 90-х го­дов ХХ ве­ка, а сей­час ста­но­вят­ся все бо­лее расп­ро­ст­ра­нен­ным сред­ством не толь­ко пре­дос­тав­ле­ния дан­ных об уче­ных, но и сред­ством их на­уч­ной ком­му­ни­ка­ции и вза­и­мо­дей­ствия. Биб­ли­о­мет­ри­чес­кий ана­лиз пер­со­на­ли­зи­ро­ван­ных стра­ниц и их ти­пи­за­ция — один из под­хо­дов к проб­ле­ме их ак­тив­но­го ис­поль­зо­ва­ния в биб­ли­о­теч­ном обс­лу­жи­ва­нии чи­та­те­лей. Для биб­ли­ог­ра­фа пер­со­на­ли­зи­ро­ван­ная стра­ни­ца — до­пол­ни­тель­ный ис­точ­ник би­о­биб­ли­ог­ра­фи­чес­кой ин­фор­ма­ции.

Рождение и перспектива использования персонализированных страниц ученых
Уми­ра­ние эпис­то­ляр­но­го жан­ра (от эпис­то­ла (ус­тар.) — пись­мо, пос­ла­ние) — очень мод­ная те­ма в сов­ре­мен­ном ми­ре. Обыч­ное поч­то­вое пись­мо мог­ло ут­ра­тить свое зна­че­ние из-за ус­ко­ре­ния тем­па жиз­ни и, как след­ствие, из-за по­вы­шен­ной пси­хи­чес­кой мо­биль­нос­ти сов­ре­мен­но­го че­ло­ве­ка. Ес­ли еще в ХIХ ве­ке сме­на впе­чат­ле­ний рит­ми­чес­ки сов­па­да­ла с дос­тав­кой поч­ты да­же на ло­ша­дях, а ус­ко­ре­ни­ем слу­жи­ла фель­дсвязь (спе­ци­аль­ная служ­ба свя­зи, зак­лю­чав­ша­я­ся в пе­ре­сыл­ке важ­ных сек­рет­ных до­ку­мен­тов че­рез фельдъ­е­ге­рей), то тех­ни­чес­кий прог­ресс ХХ ве­ка, по­вы­сив­ший в нес­коль­ко раз ско­рость дос­тав­ки пись­ма, все-та­ки пе­рес­тал ус­пе­вать за сме­ной наст­ро­е­ний пи­шу­ще­го пись­мо че­ло­ве­ка. С по­яв­ле­ни­ем ин­тер­не­та пе­ре­пис­ка че­рез пос­ла­ние пи­сем при­об­ре­ла дру­гое ка­че­ст­во. Из­на­чаль­ное свое раз­ви­тие Все­мир­ная па­у­ти­на по­лу­чи­ла от элект­рон­ной пе­ре­пис­ки и, су­дя по ско­рос­ти раз­ви­тия се­ти, ее тем­по­ритм по­ка сов­па­да­ет с внут­рен­ним тем­по­рит­мом поль­зу­ю­ще­го­ся но­вым инстру­мен­том пись­ма-пос­ла­ния че­ло­ве­ка. С точ­ки зре­ния тра­ди­ци­он­но­го пись­ма, эпис­то­ляр­ный жанр де­ла­ет ка­че­ст­вен­ный ска­чок. Под этим уг­лом зре­ния пер­со­на­ли­зи­ро­ван­ную стра­ни­цу мож­но рас­смат­ри­вать как ко­ли­че­ст­вен­ное сох­ра­не­ние соб­ран­ных в од­ном мес­те пи­сем, днев­ни­ков, ме­му­а­ров, ре­зю­ме и т. п. С по­я­вив­ши­ми­ся тех­ни­чес­ки­ми воз­мож­нос­тя­ми объ­я­вить о се­бе все­му све­ту ста­ли соз­да­вать­ся (пи­сать­ся, на­би­рать­ся) пер­со­на­ли­зи­ро­ван­ные стра­ни­цы. Сеть как но­вый инстру­мент об­ще­ния сто­ит на ста­ром фун­да­мен­те — пись­ме.
Боль­ши­н­ство веб-сер­ве­ров, ли­ди­ру­ю­щих ны­не в сво­их об­лас­тях, ког­да-то бы­ли прос­ты­ми пер­со­на­ли­зи­ро­ван­ны­ми стра­ни­ца­ми. Пер­со­на­ли­зи­ро­ван­ная стра­ни­ца — это фун­да­мен­таль­ная ос­но­ва «все­мир­ной па­у­ти­ны», та пер­вая ячей­ка, из ко­то­рой сот­кан ин­тер­нет, вер­нее, са­мая по­пу­ляр­ная его сос­тав­ля­ю­щая «World Wide Web» («WWW»).
Пер­со­на­ли­зи­ро­ван­ная стра­ни­ца — это элект­рон­ный до­ку­мент, сос­то­я­щий из од­но­го и бо­лее фай­лов, со­дер­жа­щих оп­ре­де­лен­ный текст и ссыл­ки и раз­ме­чен­ных язы­ком прог­рам­ми­ро­ва­ния HTML и име­ю­щий собствен­ный уни­каль­ный уни­вер­саль­ный мес­то­оп­ре­де­ли­тель ре­сур­са (URL-ад­рес).
Пер­со­на­ли­зи­ро­ван­ная стра­ни­ца — это и ис­то­рия на­у­ки, и ее сов­ре­мен­ность, и взгляд впе­ред, и но­вые фор­мы на­уч­но­го вза­и­мо­дей­ствия и об­ще­ния уче­ных. Про­об­ра­зом пер­со­на­ли­зи­ро­ван­ной стра­ни­цы мож­но счи­тать пер­со­на­ли­зи­ро­ван­ные ба­зы дан­ных, а еще глуб­же — би­о­биб­ли­ог­ра­фи­чес­кие спра­воч­ни­ки.
Стра­ни­цы уче­ных мно­гог­ран­ны, пред­ла­га­ют са­мые раз­лич­ные текс­то­вые, гра­фи­чес­кие, зву­ко­вые, фо­то- и ви­де­о­ма­те­ри­а­лы о них. Они поз­во­ля­ют быст­ро уточ­нять би­ог­ра­фи­чес­кие, биб­ли­ог­ра­фи­чес­кие све­де­ния о че­ло­ве­ке, спе­ци­а­лис­те. Од­на­ко, да­ле­ко не каж­дая пер­со­на­ли­зи­ро­ван­ная стра­ни­ца со­дер­жит все не­об­хо­ди­мые биб­ли­ог­ра­фу све­де­ния. Для ра­ци­о­наль­но­го их ис­поль­зо­ва­ния важ­на ти­пи­за­ция стра­ниц по со­дер­жа­тель­ным и тех­ни­чес­ким приз­на­кам.
Ме­то­ди­ка ис­сле­до­ва­ния вклю­ча­ла сле­ду­ю­щие сту­пе­ни:
Под­го­то­ви­тель­ный этап. Сос­тав­ле­ние спис­ка ав­то­ров для по­ис­ка пер­со­на­ли­зи­ро­ван­ных стра­ниц в се­ти.
Для этой за­да­чи был ис­поль­зо­ван сис­те­ма­ти­чес­кий ка­та­лог за­ру­беж­ных ав­то­ров РНБ. Из раз­де­лов «Со­ци­о­ло­гия» и «Эко­но­ми­ка» бы­ли взя­ты под­ряд без ог­ра­ни­че­ния го­да, мес­та и ти­па из­да­ния по 10 биб­ли­ог­ра­фи­чес­ких опи­са­ний из каж­до­го раз­де­ла. Так как мо­ног­ра­фии и статьи очень час­то вы­пол­не­ны не од­ним, а дву­мя и бо­лее ав­то­ра­ми, то уже из 20 из­да­ний бы­ло вы­пи­са­но 33 ав­то­ра и/или ре­дак­то­ра, чьи име­на за­тем про­ве­ря­лись на на­ли­чие пер­со­на­ли­зи­ро­ван­ной стра­ни­цы в ин­тер­не­те. По­иск про­во­дил­ся че­рез по­ис­ко­вую сис­те­му Alta Vista и по­ис­ко­вый ка­та­лог Yahoo. Бы­ли оп­ро­бо­ва­ны так­же и та­кие по­ис­ко­вые сис­те­мы как Lycos и HotBot, но по­иск в них не при­нес ни­ка­ких до­пол­ни­тель­ных ре­зуль­та­тов. На этом эта­пе ис­сле­до­ва­ния в Yahoo и Alta Vista про­ве­ря­лось по 100 ссы­лок на каж­дую вы­пи­сан­ную фа­ми­лию. При по­ис­ке из 33 ав­то­ров и/или ре­дак­то­ров в ин­тер­нет-се­ти бы­ло най­де­но лишь 3 пер­со­на­ли­зи­ро­ван­ных стра­ни­цы: на чешс­ком, сербском и не­мец­ком язы­ках. То есть на под­го­то­ви­тель­ном эта­пе в фев­ра­ле 2000 го­да бы­ла по­лу­че­на дос­та­точ­но низ­кая час­то­та соз­да­ния пер­со­на­ли­зи­ро­ван­ных стра­ниц со­ци­о­ло­га­ми и эко­но­мис­та­ми — ме­нее 10 %. Бы­ла про­ве­де­на пер­вич­ная об­ра­бот­ка най­ден­ных стра­ниц и вы­де­ле­ны воз­мож­ные 147 приз­на­ков их биб­ли­о­мет­ри­чес­ко­го ана­ли­за.
Этап 1. Из­ме­не­ние ус­ло­вий по­ис­ка пер­со­на­ли­зи­ро­ван­ных стра­ниц.
Пос­ле пер­вых проб­ных по­пы­ток по­ис­ка приш­лось сок­ра­тить ко­ли­че­ст­во ис­пы­ту­е­мых из-за слож­нос­ти по­ис­ка ав­то­ров со спе­ци­фи­чес­ким на­пи­са­ни­ем имен и фа­ми­лий при на­ли­чии букв ти­па: ь, д, г, ц, у, и и т. п. Нап­ри­мер: Hilsnerova Afйka; Iluze Askuteи; Brьggemann Wolfgang. По при­чи­не нез­на­ния язы­ков за­пад­ных сла­вян приш­лось от­ка­зать­ся от по­ис­ка и об­ра­бот­ки этой груп­пы ав­то­ров. Тем не ме­нее, бы­ла об­ра­бо­та­на анг­ло­я­зыч­ная пер­со­на­ли­зи­ро­ван­ная стра­ни­ца сло­вен­ки Тать­я­ны Бад­жик (Tatiana Bajuk Sencar). Пос­ле смыс­ло­во­го, тер­ми­но­ло­ги­чес­ко­го, то­пог­ра­фи­чес­ко­го и хро­но­ло­ги­чес­ко­го уточ­не­ния с конк­ре­ти­за­ци­ей по язы­ку бы­ло ре­ше­но ог­ра­ни­чить­ся тре­мя ве­ду­щи­ми язы­ка­ми: анг­лийс­ким, не­мец­ким, фран­цу­зс­ким — и от­бо­ром ав­то­ров, из­дав­ших собствен­ную мо­ног­ра­фию не ра­нее 1990 го­да или выс­ту­пив­ших в ро­ли ре­дак­то­ра сбор­ни­ка на­уч­ных ра­бот с ука­зан­но­го го­да. При ос­мыс­ле­нии по­ис­ко­вой си­ту­а­ции и ап­ро­би­ро­ва­нии каж­до­го за­дан­но­го эле­мен­та на роль оп­ре­де­ли­те­ля по­ис­ка кри­те­ри­ем от­бо­ра ав­то­ров, име­ю­щих пер­со­на­ли­зи­ро­ван­ную стра­ни­цу, бы­ло за­яв­ле­но опуб­ли­ко­ва­ние мо­ног­ра­фии или ре­дак­ти­ро­ва­ние на­уч­но­го сбор­ни­ка не ра­нее 1990 го­да. Хро­но­ло­ги­чес­кий ох­ват объ­яс­ня­ет­ся тем, что сеть на 1990 год нас­чи­ты­ва­ла де­сят­ки ты­сяч компь­ю­те­ров, а се­год­ня счет компь­ю­те­ров в се­ти идет на сот­ни мил­ли­о­нов. 1990 год был изб­ран стар­то­вым еще и по­то­му, что сис­те­ма «Word Wide Web», где раз­ме­ща­ют­ся пер­со­на­ли­зи­ро­ван­ные стра­ни­цы, бы­ла раз­ра­бо­та­на в 1991 го­ду. Мо­ног­ра­фия, как итог ин­тел­лек­ту­аль­ной де­я­тель­нос­ти, сви­де­тель­ству­ет об оп­ре­де­лен­ной на­уч­ной из­ве­ст­нос­ти ав­то­ра и пред­по­ла­га­ет воз­мож­ность по­яв­ле­ния его стра­ни­цы в се­ти.
В раз­де­лах «Со­ци­о­ло­гия» и «Эко­но­ми­ка» бы­ли прос­мот­ре­ны 1464 биб­ли­ог­ра­фи­чес­ких опи­са­ния за де­сять лет: 1990—2000 гг. В окон­ча­тель­ном ва­ри­ан­те бы­ли отоб­ра­ны име­на 150 за­ру­беж­ных ав­то­ров с ла­ти­нс­кой тран­скрип­ци­ей, по ко­то­рым и осу­ще­с­твлял­ся по­иск пер­со­на­ли­зи­ро­ван­ных стра­ниц: 33 (из них 12 эко­но­мис­тов и 21 со­ци­о­лог) че­ло­ве­ка на «ну­ле­вом» цик­ле и 117 (из них 62 эко­но­мис­та и 55 со­ци­о­ло­гов) че­ло­век при выб­ран­ном ито­го­вом оп­ре­де­ли­те­ле по­ис­ка. Не­об­хо­ди­мо от­ме­тить, что на пер­вом эта­пе ис­сле­до­ва­ния вы­пис­ка ря­да имен и про­вер­ка спис­ка ав­то­ров на на­ли­чие пер­со­на­ли­зи­ро­ван­ной стра­ни­цы в ин­тер­не­те бы­ли сов­ме­ще­ны по вре­ме­ни и про­во­ди­лись па­рал­лель­но.
Сна­ча­ла в по­ис­ко­вых сис­те­мах, при на­ли­чии длин­но­го спис­ка най­ден­ных ад­ре­сов с ука­зан­ной фа­ми­ли­ей ав­то­ра, прос­мат­ри­ва­лось до 100 пер­вых ссы­лок. Но при­об­ре­тен­ный опыт по­ка­зал, что ра­ци­о­наль­но ог­ра­ни­чить­ся 50 ссыл­ка­ми. Пер­со­на­ли­зи­ро­ван­ные стра­ни­цы на­хо­ди­лись на са­мых раз­ных по­зи­ци­ях при по­ис­ке: под пер­вым, две­над­ца­тым-пят­над­ца­тым и да­же трид­ца­тым и бо­лее, но не да­лее пя­ти­де­ся­то­го но­ме­ра вы­дан­но­го спис­ка элект­рон­ных ад­ре­сов. Для ус­ко­ре­ния по­ис­ка пос­те­пен­но сло­жил­ся собствен­ный ме­тод:
1. Вво­ди­лась фа­ми­лия ав­то­ра с ини­ци­а­ла­ми и ука­за­ни­ем сфе­ры де­я­тель­нос­ти.
2. Отыс­ки­ва­лась лю­бая се­те­вая стра­ни­ца с рас­шиф­ров­кой ини­ци­а­лов ав­то­ра.
3. За­тем вво­ди­лась фа­ми­лия и пол­ное имя ав­то­ра.
4. Иног­да (при на­ли­чии пол­но­го тез­ки) для пе­реп­ро­вер­ки к пол­но­му име­ни до­бав­ля­лась сфе­ра де­я­тель­нос­ти.
При та­ком при­е­ме по­ис­ка при на­ли­чии пер­со­на­ли­зи­ро­ван­ных стра­ниц по­ис­ко­вая сис­те­ма Alta Vista и по­ис­ко­вый ка­та­лог Yahoo от­ме­ча­ли их в пер­вой де­сят­ке ссы­лок. В слу­чае расп­ро­ст­ра­нен­ных фа­ми­лий та­кая про­це­ду­ра зна­чи­тель­но сок­ра­ща­ла спи­сок вы­да­ва­е­мых по­ис­ко­ви­ком элект­рон­ных ад­ре­сов. Ос­та­ва­лось толь­ко уточ­нить об­ласть де­я­тель­нос­ти вы­да­ва­е­мо­го по­ис­ко­вой сис­те­мой ав­то­ра для иск­лю­че­ния пол­но­го тез­ки ис­сле­ду­е­мо­го ли­ца: на 50 ав­то­ров приш­лось 9 че­ло­век од­но­фа­миль­цев с те­ми же ини­ци­а­ла­ми и 2 пол­ных тез­ки, при­над­ле­жа­щих на­уч­но­му ми­ру, но ин­те­ре­су­ю­щих­ся дру­гой об­ластью зна­ний (в на­шем слу­чае это бы­ли ис­то­рик и ма­те­ма­тик). Для де­таль­но­го ана­ли­за бы­ли вы­яв­ле­ны 20 пер­со­на­ли­зи­ро­ван­ных стра­ниц.
Этап 2. Ис­поль­зо­ва­ние ба­зы дан­ных для фор­ми­ро­ва­ния по­ис­ко­во­го мас­си­ва ав­то­ров.
Для до­пол­не­ния спис­ка уче­ных-гу­ма­ни­та­ри­ев бы­ла взя­та элект­рон­ная вер­сия ука­за­те­ля (БД) Science Citation Index.
В прак­ти­ке биб­ли­ог­ра­фи­ро­ва­ния и биб­ли­ог­ра­фи­чес­ко­го обс­лу­жи­ва­ния ча­ще все­го об­ра­ща­ют­ся к ре­аль­но­му до­ку­мен­таль­но­му по­то­ку. Вмес­те с тем в слож­ных слу­ча­ях по­ис­ка биб­ли­ог­ра­фы из­дав­на прак­ти­ко­ва­ли вы­яв­ле­ние нуж­ной ин­фор­ма­ции че­рез спис­ки ли­те­ра­ту­ры к из­ве­ст­ным чи­та­те­лю пуб­ли­ка­ци­ям, то есть че­рез по­ток ци­ти­ро­ван­ной ли­те­ра­ту­ры, од­на­ко из-за чрез­вы­чай­ной тру­до­ем­кос­ти та­кой путь из­би­рал­ся край­не ред­ко. По­яв­ле­ние ука­за­те­лей (БД) Science Citation Index, Social Science Citation Index, Arts and Humanities Citation Index из­ме­ни­ло си­ту­а­цию и сде­ла­ло эту про­це­ду­ру го­раз­до бо­лее дос­туп­ной. Они да­ют воз­мож­ность опе­ра­тив­но вы­я­вить ве­ду­щих спе­ци­а­лис­тов ми­ра по уз­кой проб­ле­ме, на­и­бо­лее ци­ти­ру­е­мые жур­на­лы, конк­рет­ные пуб­ли­ка­ции. Элект­рон­ная вер­сия Science Citation Index по гу­ма­ни­тар­ным на­у­кам на CD-дис­ках име­ет од­ну об­щую свод­ную ба­зу с пред­ло­же­ни­ем по­ис­ка по клю­че­вым сло­вам.
Из элект­рон­ной вер­сии Science Citation Index по гу­ма­ни­тар­ным на­у­кам за 2000 г., ян­варь—но­ябрь 2001 г. и ян­варь—март 2002 г. бы­ла сде­ла­на реп­ре­зен­та­тив­ная вы­бор­ка по клю­че­вым сло­вам: «philosophy» (фи­ло­со­фия), «philology» (фи­ло­ло­гия), «psychology» (пси­хо­ло­гия) и «linguist» (линг­вис­ти­чес­кие) (на клю­че­вое сло­во «linguistics» (линг­вис­ти­ка) не бы­ло да­но ни од­ной ссыл­ки).
На ос­но­ве по­лу­чен­ных в элект­рон­ной вер­сии Science Citation Index по гу­ма­ни­тар­ным на­у­кам 845 ра­бот бы­ло ре­ше­но за­нять­ся по­ис­ком пер­со­на­ли­зи­ро­ван­ных стра­ниц уче­ных-гу­ма­ни­та­ри­ев, при­ме­няя клю­че­вые сло­ва из таб­ли­цы до мо­мен­та на­хож­де­ния в се­ти 30 пер­со­на­ли­зи­ро­ван­ных стра­ниц.
Для по­ис­ка пер­со­на­ли­зи­ро­ван­ных стра­ниц вновь ис­поль­зо­ва­лись по­ис­ко­вая сис­те­ма Alta Vista и по­ис­ко­вый ка­та­лог Yahoo. К вы­ше­из­ло­жен­ной ме­то­ди­ке по­ис­ка пер­со­на­ли­зи­ро­ван­ных стра­ниц в се­ти до­ба­ви­лись еще не­ко­то­рые клю­че­вые мо­мен­ты:
• Так, нап­ри­мер, Dr. Thomas S. Price на пер­со­на­ли­зи­ро­ван­ной стра­ни­це в се­ти предс­тав­лен как Tom Price. Tom — это пол­ное имя от умень­ши­тель­но­го Thomas. Но че­рез по­ис­ко­вые ма­ши­ны из-за рас­хож­де­ния в на­пи­са­нии пер­со­на­ли­зи­ро­ван­ная стра­ни­ца на имя Thomas S. Price не бы­ла най­де­на. Ви­ди­мо, для по­ис­ко­вых сис­тем не ус­та­нов­лен ав­то­ма­ти­чес­кий пе­ре­вод к пол­ным и умень­ши­тель­ным име­нам с раз­ным пра­во­пи­са­ни­ем, что нуж­но учи­ты­вать при по­ис­ке. Идея крат­ко­го на­пи­са­ния име­ни воз­ник­ла при на­хож­де­нии пер­со­на­ли­зи­ро­ван­ной стра­ни­цы дан­но­го уче­но­го че­рез его со­ав­то­ра Eley T. C.
• Пол­ное имя ав­то­ра Johnstone-B. бы­ло най­де­но по клю­че­вым сло­вам «Johnstone B., Voice in Language» в по­ис­ко­вой сис­те­ме Alta Vista: George (Brick) Reter Johnstone. Бы­ли пе­реп­ро­бо­ва­ны все ва­ри­ан­ты по­ис­ка это­го ав­то­ра со слож­но­сос­тав­ной фа­ми­ли­ей, ко­то­рые не при­но­си­ли по­ло­жи­тель­но­го ре­зуль­та­та. И толь­ко ме­то­дом проб и оши­бок с иск­лю­че­ни­ем тех или иных ком­по­нен­тов на сло­во­со­че­та­ние «George Johnstone Brick» по­ис­ко­вый ка­та­лог Yahoo под пер­вым но­ме­ром вы­дал пер­со­на­ли­зи­ро­ван­ную стра­ни­цу дан­но­го уче­но­го-линг­вис­та;
• В элект­рон­ной вер­сии Science Citation Index по гу­ма­ни­тар­ным на­у­кам Vanderlely-HKJ, на­пи­сав­шая статью «Lexical Word-Formation in Children with Grammatical Sli — A Grammar-Specific Versus an Input-Processing Deficit», бы­ла най­де­на толь­ко че­рез ини­ци­а­лы «HKJ» и наз­ва­ние ра­бо­ты. В спис­ке ра­бот, предс­тав­лен­ных в ин­тер­нет-се­ти, фа­ми­лия ав­то­ра этой статьи бы­ла на­пи­са­на раз­дель­но: Van der Lely. По дан­ным па­ра­мет­рам по­ис­ка был най­ден в се­ти вы­ход на пол­ное имя ав­то­ра Heather K.J. Van der Lely, че­рез ко­то­рое по­ис­ко­вая сис­те­ма Alta Vista вы­ве­ла на пер­со­на­ли­зи­ро­ван­ную стра­ни­цу ав­то­ра.
Итак, при по­ис­ке в се­ти ав­то­ров со слож­но­сос­тав­ны­ми име­на­ми и фа­ми­ли­я­ми не­об­хо­ди­мо учи­ты­вать раз­ни­цу в на­пи­са­нии пол­но­го и умень­ши­тель­но­го име­ни, раз­ни­цу в за­да­нос­ти по­ис­ко­вым ма­ши­нам длин­ных слож­но­сос­тав­ных фа­ми­лий и раз­ни­цу на­пи­са­ния иност­ран­ных фа­ми­лий при пе­ре­во­де с язы­ка на язык.
Пла­ни­ру­е­мые 30 пер­со­на­ли­зи­ро­ван­ных стра­ниц бы­ли по­лу­че­ны уже в этой подг­руп­пе на спис­ке имен 106 ав­то­ров. В за­да­чи ис­сле­до­ва­ния не вхо­ди­ло под­роб­ное изу­че­ние со­от­но­ше­ния ав­то­ров, предс­тав­лен­ных в Science Citation Index с час­то­той на­ли­чия их стра­ниц в се­ти, для это­го нуж­но про­ве­де­ние бо­лее де­таль­но­го ис­сле­до­ва­ния. Но при бег­лом прос­мот­ре мож­но ска­зать, что око­ло 30% (28,3%) ав­то­ров, вклю­чен­ных в Science Citation Index по гу­ма­ни­тар­ным на­у­кам за 2000 год, ис­поль­зу­ют ин­тер­нет для пе­ре­да­чи сво­их зна­ний, что бо­лее чем в два ра­за пре­вы­ша­ет по­ка­за­тель со­от­но­ше­ния предс­тав­лен­нос­ти уче­ных в ка­та­ло­ге РНБ с на­ли­чи­ем их стра­ниц в ин­тер­не­те (13,3%). Эти дан­ные толь­ко пред­ва­ри­тель­ные и приб­ли­зи­тель­ные, по­то­му что ис­сле­до­ва­ние пер­во­го и треть­е­го эта­па отс­то­я­ло во вре­ме­ни с раз­ни­цей в один год. Для бо­лее точ­ной оцен­ки не­об­хо­ди­мо до­пол­ни­тель­ное ис­сле­до­ва­ние по дан­ной те­ме.
Этап 3. Биб­ли­о­мет­ри­чес­кий ана­лиз пер­со­на­ли­зи­ро­ван­ных стра­ниц.
Осу­ще­с­твлял­ся по все­му кру­гу вы­яв­лен­ных на пред­ва­ри­тель­ном эта­пе приз­на­ков, объ­е­ди­нен­ных в сле­ду­ю­щие груп­пы:
• Де­я­тель­но­ст­ные, кре­а­тив­ные ха­рак­те­рис­ти­ки (об­ра­зо­ва­ние, об­ласть де­я­тель­нос­ти, те­мы ис­сле­до­ва­ния, пуб­ли­ка­ции, меж­ду­на­род­ные свя­зи и т. д.).
• Со­ци­аль­ные ха­рак­те­рис­ти­ки (да­ты жиз­ни, мес­то рож­де­ния и жи­тель­ства, об­ще­ст­вен­ная и по­ли­ти­чес­кая де­я­тель­ность, спон­со­ры, семья, друзья, член­ство в об­ще­ст­вах и ор­га­ни­за­ци­ях и т. д.).
• Ха­рак­те­рис­ти­ка ду­хов­но­го ми­ра лич­нос­ти (ин­те­ре­сы, хоб­би и ув­ле­че­ния, за­ня­тия спор­том, член­ство в клу­бах, учас­тие в куль­тур­ной жиз­ни и т. д.).
• Би­о­ло­ги­чес­кие ха­рак­те­рис­ти­ки (пол, воз­раст, здо­ровье и т. д.).
• Тех­ни­чес­кие ха­рак­те­рис­ти­ки (име­на соз­да­те­ля и веб-мас­те­ра стра­ни­цы, да­та соз­да­ния стра­ни­цы, по­се­ща­е­мость стра­ни­цы, ссыл­ки на ра­бо­ты ав­то­ра в элект­рон­ном ви­де и т. д.).
Для каж­дой стра­ни­цы за­пол­ня­лась кар­та, где от­ме­ча­лись фак­ти­чес­кие све­де­ния по каж­до­му приз­на­ку, а за­тем дан­ные объ­е­ди­ня­лись в свод­ную таб­ли­цу.
На ос­но­ве ис­сле­до­ва­ния 50 пер­со­на­ли­зи­ро­ван­ных стра­ниц был вы­яв­лен ряд ти­по­ло­ги­чес­ких осо­бен­нос­тей, оп­ре­де­лен ряд приз­на­ков, по ко­то­рым мож­но ана­ли­зи­ру­е­мые стра­ни­цы раз­бить на подг­руп­пы: «имид­же­вый», «предс­та­ви­тельс­кий», «со­дер­жа­тель­ный».
«Имид­же­вые» пер­со­на­ли­зи­ро­ван­ные стра­ни­цы уче­ные ог­ра­ни­чи­ва­ют ин­фор­ма­ци­ей о се­бе по схе­ме ре­зю­ме. Этот тип мо­жет быть ис­поль­зо­ван для по­ис­ка ве­ду­щих спе­ци­а­лис­тов в конк­рет­ной об­лас­ти де­я­тель­нос­ти.
«Предс­та­ви­тельс­кие» стра­ни­цы до­бав­ля­ют к опи­са­нию сфе­ры де­я­тель­нос­ти прак­ти­чес­кую ре­а­ли­за­цию идей (биб­ли­ог­ра­фи­чес­кое опи­са­ние опуб­ли­ко­ван­ных ра­бот). Как пра­ви­ло, ука­за­на пер­вая пе­чат­ная пуб­ли­ка­ция ав­то­ра. Опуб­ли­ко­ван­ные ра­бо­ты час­то под­раз­де­ля­ют­ся на сле­ду­ю­щие груп­пы: мо­ног­ра­фии; об­зо­ры; спра­воч­ные из­да­ния; ра­бо­ты, ре­дак­ти­ру­е­мые ли­цом; ра­бо­ты, ре­цен­зи­ро­ван­ные ли­цом и т. п. без ан­но­та­ции, ре­фе­ра­та и/или пол­но­го текс­та сво­их ра­бот. Этот тип стра­ниц мо­жет быть по­ле­зен в биб­ли­ог­ра­фи­чес­кой прак­ти­ке, как для по­ис­ка из­да­ний ав­то­ра, так и для уточ­не­ния фак­тов вы­хо­да пуб­ли­ка­ций в свет.
«Со­дер­жа­тель­ные» пер­со­на­ли­зи­ро­ван­ные стра­ни­цы до­бав­ля­ют к биб­ли­ог­ра­фи­чес­ко­му опи­са­нию пол­ный текст од­ной или нес­коль­ких ра­бот ав­то­ра, крат­кую ан­но­та­цию, ре­фе­рат, ссыл­ки на ра­бо­ты ав­то­ра в элект­рон­ном ви­де. Этот тип стра­ниц на­и­бо­лее по­ле­зен и мо­жет быть ис­поль­зо­ван для под­го­тов­ки все­го кру­га биб­ли­ог­ра­фи­чес­ких за­дач.
Бы­ла отс­ле­же­на так­же ди­на­ми­ка на­пол­не­ния пер­со­на­ли­зи­ро­ван­ных стра­ниц уче­ных-гу­ма­ни­та­ри­ев и от­ме­че­на тен­ден­ция пе­ре­хо­да от «имид­же­во­го» к их «со­дер­жа­тель­но­му» ти­пу: ес­ли в 2002 го­ду пер­со­на­ли­зи­ро­ван­ных стра­ниц со­дер­жа­тель­но­го ти­па вы­яв­ле­но все­го 5%, то к 2003 го­ду их по­ка­за­тель вы­рос до 18%.
Дан­ная тен­ден­ция к бо­лее со­дер­жа­тель­но­му предс­тав­ле­нию на­уч­но­го твор­че­ст­ва за­ру­беж­ных уче­ных-гу­ма­ни­та­ри­ев мо­жет слу­жить яр­кой де­мо­н­стра­ци­ей «эф­фек­тив­но­го под­хо­да» к ис­поль­зо­ва­нию сов­ре­мен­ных ин­фор­ма­ци­он­ных тех­но­ло­гий. Та­кие же тен­ден­ции, не­сом­нен­но, бу­дут при­су­т­ство­вать и в оте­че­ст­вен­ной на­уч­ной сре­де. Бла­го­да­ря это­му биб­ли­ог­раф най­дет но­вое до­пол­ни­тель­ное сред­ство для по­лу­че­ния опе­ра­тив­ной биб­ли­ог­ра­фи­чес­кой и фак­тог­ра­фи­чес­кой ин­фор­ма­ции.
Пер­со­на­ли­зи­ро­ван­ная стра­ни­ца мо­жет так­же стать вско­ре и ос­нов­ным ис­точ­ни­ком би­ог­ра­фи­чес­кой и биб­ли­ог­ра­фи­чес­кой ин­фор­ма­ции: это воз­мож­ность пре­дос­тав­ле­ния на все­мир­ное обоз­ре­ние све­де­ний о се­бе и сво­их иде­ях в ви­де опуб­ли­ко­ван­ных и не­о­пуб­ли­ко­ван­ных до­ку­мен­тов, их биб­ли­ог­ра­фи­чес­ко­го опи­са­ния, крат­кой ан­но­та­ции или ре­фе­ра­та. Она мо­жет ис­поль­зо­вать­ся как ос­но­ва соз­да­ния на­уч­ных би­ог­ра­фий, а так­же как отп­рав­ная точ­ка биб­ли­ог­ра­фи­чес­ко­го по­ис­ка. Че­рез пер­со­на­ли­зи­ро­ван­ную стра­ни­цу воз­мож­но по­лу­че­ние из­ве­ст­нос­ти в кру­гу ин­те­ре­су­ю­щих ав­то­ра на­уч­ных проб­лем, что поз­во­ля­ет уче­но­му ре­шить мно­гие воп­ро­сы соз­да­ния собствен­но­го имид­жа в на­уч­ном со­об­ще­ст­ве. Пер­со­на­ли­зи­ро­ван­ная стра­ни­ца мо­жет ис­поль­зо­вать­ся как плац­дарм для про­ве­де­ния раз­ви­ва­ю­щих­ся в нас­то­я­щее вре­мя ис­то­ри­ко-на­уч­ных, со­ци­аль­но-пси­хо­ло­ги­чес­ких и дру­гих ис­сле­до­ва­ний на­уч­но­го твор­че­ст­ва, для по­ис­ка парт­не­ров, ав­то­ров, спод­виж­ни­ков, оп­по­нен­тов и еди­но­мыш­лен­ни­ков в об­лас­ти конк­рет­ных на­уч­ных ин­те­ре­сов.
Итак, рас­смат­ри­вая пер­со­на­ли­зи­ро­ван­ную стра­ни­цу как сред­ство не толь­ко пре­дос­тав­ле­ния дан­ных об уче­ных, но и как сред­ство ком­му­ни­ка­ции и вза­и­мо­дей­ствия на ка­че­ст­вен­но но­вом элект­рон­ном уров­не, при­зы­ва­ем твор­чес­ких и ком­пе­те­нт­ных биб­ли­ог­ра­фов де­лить­ся сво­и­ми зна­ни­я­ми в се­ти, ис­поль­зуя, изу­чая и соз­да­вая собствен­ные пер­со­на­ли­зи­ро­ван­ные стра­ни­цы. В их ди­на­ми­ке, в хо­де ана­ли­за и вы­яв­ле­ния от­дель­ных за­ко­но­мер­нос­тей се­те­вой ин­фор­ма­ции, со вре­ме­нем мо­жет и долж­на быть сфор­ми­ро­ва­на мо­дель все­мир­ной элект­рон­ной биб­ли­о­те­ки. На ее ос­но­ве мож­но бу­дет не толь­ко ос­мыс­ли­вать ис­то­рию, опи­сы­вать про­цес­сы нас­то­я­ще­го, но и прог­но­зи­ро­вать тен­ден­ции раз­ви­тия конк­рет­ных про­цес­сов и яв­ле­ний. Это еще раз до­ка­зы­ва­ет не­об­хо­ди­мость серь­ез­ных се­те­мет­ри­чес­ких ис­сле­до­ва­ний.

Алексей Николаевич Ежов, библиограф интернет-класса РНБ