1. Перейти к содержанию
  2. Перейти к главному меню
  3. К другим проектам DW

Поисковые машины в Интернете

Глеб Гаврик «Немецкая волна»

28.02.2005

https://p.dw.com/p/77GY

Наш последний в этом месяце выпуск журнала «Наука и техника» по традиции будет посвящен компьютерным технологиям и современным средствам коммуникации. Сегодня мы поговорим об информатике в буквальном значении этого слова. То есть о поиске информации и доступе к ней. А ещё точнее – о поисковых машинах в Интернете, в конце прошлого века совершивших настоящую революцию в этой сфере. Но, нет предела совершенству… Почти каждую неделю крупнейшие «поисковики» предлагают всё новые формы сервиса. А наиболее популярные проекты – Google, MSN, Yahoo уже вступили в новую фазу конкурентной борьбы. Одним словом, вся эта чрезвычайно прибыльная отрасль задумала стать «слугой двух господ» – того, кто ищет и того, кто ищет того, кто ищет, то бишь рекламодателя.

Поисковые машины – единственный вид онлайн-бизнеса, который действительно оправдал возлагавшиеся на него надежды. Неписаное правило отрасли гласит – каждый третий доллар из всех денег, циркулирующих в интернете, оседает в кассах «поисковиков». Именно здесь продавцу легче всего найти своего потенциального покупателя. Ведь тот, кто пользуется услугами поисковых машин, собственными руками впечатывает в маску то, что их интересует. И как результат - цены на размещение рекламы растут как на дрожжах. Недавно одна американская фирма, представляющая интересы адвокатских контор, была готова выплачивать поисковым машинам по сто долларов каждый раз, когда в связи с заданным в поисковой машине словом «мезотелиома» высвечивалась реклама предоставляемых фирмой услуг. «Мезотелиома» - это раковое заболевание, которое может возникнуть под влиянием асбеста – строительного материала, широко использовавшегося ещё считанные десятилетия назад. Расчет адвокатов достаточно прост: ведь таким образом они смогут выйти на потенциальных клиентов, страдающих этим заболеванием. Ну а подобные процессы, связанные с возмещением ущерба жертвам асбеста, сулят немалые барыши. Так что вполне понятно, из каких соображений «поисковики» решили всерьез прислушаться к нуждам рекламодателей. Для этого им нужно знать как можно больше о тех, кто пользуется их услугами, ведь теперь их будущее во многом зависит от успеха проводимых ими изысканий. С этим согласны и аналитики наиболее известных маркетинговых фирм, специализирующихся на изучении рынка интернет-технологий. Вот мнение одного из них - Хелен Омвандо, сотрудницы компании Forrester Research:

Думаю, многие пойдут по пути персонифицированного поиска. Это означает, что клиенту надо сказать: «Мы знаем, чем ты обычно занимаешься в интернете». И, опираясь на это знание, поисковые машины смогут находить важную для клиента информацию самостоятельно.

Ещё больше можно узнать о пользователях, получив доступ непосредственно к их компьютерам. Подобное программное обеспечение уже предлагают Google и ещё одна американская фирма Blinkx. Разработанный специалистами Blinkx софт как бы «на заднем плане» самостоятельно занимается поиском всего, что может пригодиться: файлов, линков, сайтов и т.д. Причем ищет он не только в интернете, но и в компьютере клиента. Ну и, само собой, находит соответствующую рекламу.

Он распознает текст, появляющийся на экране монитора, и осуществляет поиск всех файлов в компьютере, находящихся в какой-либо смысловой связи с данным текстом. Одновременно он отправляется на поиск соответствующих сайтов в интернете. Причем для этого не надо задавать ключевые слова в специально отведенных для этого окнах. Наша философия – поисковая машина должна быть невидимой. Привычный процесс поиска становится излишним, ведь согласно нашей концепции он происходит автоматически.

Итак, «умные» виртуальные инструменты, которые сами знают, чего хочет их хозяин. Аллен Вайнер, аналитик компании Gartner Group:

Если бы можно было читать мысли клиента... Да, это была бы действительно сильная технология. Единственная возможность для предоставления точной информации – это обширные знания о пользователе. Поэтому сейчас очень нужен метод, позволяющий заглянуть в прошлое поисковых машин, а именно, что там уже искал тот или иной клиент.

В сборе информации о пользователях заинтересованы не только поисковые машины, но и все фирмы, занятые в области онлайн-бизнеса. Однако получить столь вожделенную информацию о клиентах не так-то просто. Ведь даже если и удается выйти на след того или иного компьютера, об интересах посетителя сайта собранные данные зачастую ничего не говорят. Кроме того, нередко одними и теми же компьютерами пользуется сразу несколько человек. Немецкое общество Online Forschung, сотрудничающее с более чем трехстами наиболее раскрученными интернет-порталами Германии (такими например как AOL или Web.de), разработало специальную методику процесса сбора данных (или как его ещё называют «датамайнинга» (с английского это слово можно было бы перевести как «откапывание данных»)). По сути, метод, предложенный специалистами Online Forschung далеко не новый. В его основу положен классический опрос потребителя. Рассказывает один из разработчиков проекта Петер Гентш, сотрудник Business Intelligence Group, фирмы, специализирующейся на сборе данных для рекламодателей:

Здесь используются классические методы изучения рынка. Это и онлайн-анкеты, и опросы по телефону. Каждый участник опроса дает согласие на то, что будет находиться под наблюдением в течение двух месяцев.

По окончании этого срока пользователи перестают находиться под неусыпным «оком» нашего интернет-портала, в последтствии достаточно лишь пару раз в году обновлять базы данных. Этот метод позволяет с наибольшей эфективностью персонифицировать услуги, ведь в распоряжении интернет-служб оказываются социально-демографическими данные, анкеты, дающие представление о личности пользователя, а также маршруты его передвижения по интернету. Последнее обеспечивается при помощи Cookie.

На том, что такое cookies, хотелось бы остановиться по-подробнее. Наверняка многие из наших слушателей знают о них не понаслышке. По сути, это и был первый технический и по-настоящему действенный метод сбора информации о пользователях. Технологии этой уже примерно столько же лет, сколько и интернету. Cookies – это небольшие порции текста, которые веб-серверы могут устанавливать на компьютере пользователя. Они записываются в специальные файлы и могут отсылаться обратно на сервер. Не секрет, что у многих пользователей сложилось отрицательное отношение к cookies. Общепринятым стало и мнение, что «печенье» (а именно так и переводится этот термин с английского) несет угрозу анонимности и безопасности пользователя. К сожалению, подобные обвинения в адрес cookies нельзя назвать совсем уж беспочвенными. Тем не менее, технология эта – нужная, и, в первую очередь, для обеспечения удобства пользователей. Дело в том, что одной из главных проблем интернет-протокола HTTP является непостоянство соединения между клиентом и сервером. С этим сталкиваются разработчики всех серьезных сайтов. Суть проблемы заключается в следующем. Компьютер пользователя отправляет на веб-сервер HTTP запрос на загрузку одного файла. Сервер, обработав его и выполнив нужные действия, тут же прерывает сеанс. В результате следующий запрос от того же компьютера на загрузку другого файла расценивается как соединение с новым пользователем. На первый взгляд, особой проблемы тут нет, но самом деле... На самом деле, сложности возникают со всеми веб-сайтами, требующими авторизации пользователя. Ведь в этом случае при запросе нового файла, то есть при переходе почти по каждой ссылке, пользователю пришлось бы каждый раз вводить свое имя и пароль. А это, мягко говоря, не очень удобно. Однако наиболее распространенное использование cookies - это сбор информации о пользователях в маркетинговых целях. Обычно с помощью «печенья» отслеживают перемещение пользователя по сайту. Именно благодаря данным о маршрутах движения посетителей, собранным таким образом, и совершенствуется структура веб-проекта. Кроме того, cookies используются для отчетов рекламодателям, требующим точной оценки эффективности своих расходов. Дело в том, что некоторые системы имеют возможность с помощью «печенья» отслеживать движение пользователей по разным сайтам. Любопытно, что cookies изначально были предназначены для удобства посетителей различных сайтов. Но, как и любую другую технологию, «печенье» можно использовать и с различными неблаговидными целями. Да и вообще «поисковый» бизнес и датамайнинг всё больше пересекается с правом человека на охрану своей сугубо личной сферы. Владельцы онлайн-служб не должны слишком навязчивыми и откровенно «шпионить» за своими посетителями, в противном случае они рискуют растерять клиентуру. Возникает вопрос, а не слишком ли далеко заходят поисковые машины и интернет-порталы, когда предоставляют рекламодателям подробнейшую информацию о своих клиентах? Проблему эту сознают и представители онлайн-бизнеса, и разработчики соответствующих программ. Вот что думает по этому поводу Петер Гентш:

Мы не приближаемся к клиенту вплотную, у нас нет цели ворваться в его приватную сферу. В конце концов, наш метод базируется на cookie. Достаточно отключить использование cookie в браузере и система перестает работать.

Гентш исходит из того, что новые технологии несут основной массе клиентов больше выгод, чем неудобств. По его словам, люди будут рады быстро получать интересующие их данные и не отвлекаться на ненужную информацию.

И в заключение ещё одно сообщение из сферы компьютерных технологий. Перед запуском в серийное производство новая модель автомобиля или самолета испытывается на полигонах и проходит огонь, воду и аэродинамические трубы. Как это ни странно звучит, схожий метод тестирования применяется и в компьютерной отрасли. В немецком городе Бёблингене недавно был сдан в эксплуатацию самый большой в мире компьютерный «полигон» для мощных вычислительных машин и серверов. Есть там и что-то наподобие аэродинамической трубы. Только доводятся до совершенства в ней не аэродинамические качества корпусов, а правильность и надежность логических цепей, а также интегральных схем. Помимо этого у инженеров появляется возможность проверить, насколько четко взаимодействуют различные процессоры, установленные в одном и том же компьютере. По свидетельству руководителя инженеров-испытателей Вольфганга Пихана, нередко на практике всё выглядит далеко не так гладко, как на бумаге.

Мы находим ошибки, которые делают разработчики. Кроме того, проблемы возникают и из-за огромной сложности устройств современных чипов. Ведь процессоры и чипы разных производителей взаимодействуют друг с другом, и далеко не всегда их разработчикам удается просчитать заранее всё, что может произойти.

В новых моделях компьютеров установливается в среднем около ста миллионов элктронных логических цепей. На специальных стендах инженеры симулируют экстремальные ситуации. На компьютер установливается операционная система, затем начинается инсталляция нескольких пакетов программного обеспечения. Что произойдет, если именно тогда, когда будут задействованы все мощности процессоров, пользователь решит «стартануть» ещё одну программу? Нередко дать ответ на этот вопрос могут лишь испытания. Испытатели проверяют каждую логическую связку, буквально каждый чип со скростью тысяча раз в секунду. При этом ведется пристальное наблюдение за каждым процессором, постоянно сообщается, какой именно вычислительной операцией он занят в данный момент. Объем и сложность проводимых в Бёблингене работ поражает воображение. Рассказывает инженер-испытатель Клаус-Дитер Шуберт.

Для того, чтобы сымитировать лишь одну минуту вот такого анализа установки операционной системы, обычному домашнему компютеру потребуется более тридцати лет.

Система тестирования бёблингской лаборатории справляется с этой задачей за неделю. Список выявленных неполадок позволяет конструкторам-электронщикам вовремя вносить усовершенстования в логический дизайн вычислительных машин. Испытания необходимы и разработчикам программного обеспечения:

Они помогают нам заблаговременно отработать взаимодействие компьютерного «железа»-hardware с софтом.