Живой поиск: чем люди могут помочь поисковым машинам

- Кирилл Тихонов, "Компьютерра" 14 апреля 2009 года

1 апреля 2002 года секрет поисковой системы Google был раскрыт. Оказалось, что главное - это не алгоритмы, а голуби. Дата-центры Google заполнены тысячами учёных птиц, которые с удивительной быстротой и точностью сортируют веб-страницы и обрабатывают запросы.

История про голубей, разумеется, была первоапрельской шуткой. Стремительный рост популярности Google доказал, что обойтись можно не только без голубей, но и без людей. Даже Yahoo, главным сервисом которой был каталог подбираемых вручную ссылок, со временем уступила и стала уделять основное внимание автоматическому поиску.

Однако окончательной ли была победа автоматики? Главный редактор сайта Search Engine Land Дэнни Салливан предполагает, что в будущем одними машинами не обойтись. По его мнению, поисковики следующего поколения будут сильнее зависеть от данных, подготавливаемых и вводимых людьми, причём, скорее всего, дело не ограничится всплеском интереса к веб-каталогам. Для ручного труда найдутся и более любопытные применения.

Впрочем, даже возрождённые каталоги вряд ли окажутся похожими на своих предшественников. Их создатели берут в качестве примера для подражания не почтенные Yahoo Directory или Dmoz, а “Википедию”.

Поисковики любят “Википедию”. Подходящие статьи из свободной энциклопедии почти всегда оказываются в верхних строках результатов поиска, которые выдаёт Google. Даже не самые удачные из них, как правило, полезны для пользователя, особенно если рассматривать их лишь как стартовую точку для самостоятельного изучения вопроса. Статьи “Википедии” обычно содержат список основных сайтов по теме, а приведённые факты подкреплены ссылками на источники.

“В последнее время вместо того, чтобы пролистывать результаты Google в поисках надёжного эксперта, я отправляюсь сразу на “Википедию”, - признаётся в своём блоге один из основателей журнала Wired Кевин Келли. - И не за кратким изложением фактов, а чтобы немедленно перейти к первоисточникам. Половина пользы от статей “Википедии” заключена в тщательно отобранных ссылках на другие сайты”.

Хотя “Википедию” можно использовать и так, она создавалась с другими целями. В отличие от неё, сайт Mahalo.com, открывшийся весной 2007 года, с самого начала называли “поисковой системой, использующей труд людей”. Однако по сути Mahalo.com куда ближе к энциклопедии, чем к Google.

За Mahalo.com стоит известный предприниматель Джейсон Калаканис, ранее возглавлявший крупнейшую сеть профессиональных блогов Weblogs Inc (в неё, среди прочего, входит Engadget.com, опережающий по популярности многие традиционные сетевые издания). В финансировании компании участвуют известнейшая инвестиционная фирма Sequoia Capital и News Corporation Руперта Мердока.

Страница результатов поиска в Mahalo.com похожа на статью из “Википедии”, написанную для людей, которые страдают синдромом дефицита внимания. Вместо подробных объяснений - краткие факты и семёрка важных ссылок; отдельно - подборки статей, новостей, видео или форумов по теме. Каждый факт - не длиннее строчки, у каждой ссылки - короткое и доходчивое описание. Проглядеть их все и заметить нужное гораздо проще, чем в обычном поисковике.

Проблема в том, что далеко не для всякого запроса в Mahalo.com успели подобрать ссылки. Страницы создаются не автоматически - их готовят редакторы и фрилансеры, оплачиваемые компанией. К концу 2008 года количество страниц в Mahalo.com исчислялось десятками тысяч, но это - капля в море. Когда готового ответа не найдено, пользователя отправляют к результатам поиска в Google.

Нетрудно заметить и другие недостатки такого подхода. Создатели Mahalo.com утверждают, что они полностью застрахованы от поискового спама и нерелевантных результатов. Однако люди-редакторы заведомо не могут быть беспристрастными. Если сайты наподобие Mahalo.com станут популярнее, им не избежать обвинений в тенденциозности, цензуре или коррупции.

Правда, кроме модели, которой придерживается Mahalo.com, есть и другие. Вместо оплачиваемых редакторов можно использовать добровольцев; кроме того, стоит попытаться отыскать верное сочетание автоматического поиска и данных, подготавливаемых вручную. Именно этим занялся один из основателей “Википедии” Джимми Уэйлс. Его проект Wikia Search представлял собой более или менее традиционный поисковик, скрещенный с вики и социальной сетью. Каждый посетитель мог редактировать и комментировать найденные ссылки.

Wikia Search бурно обсуждали ещё до открытия сайта, и преждевременная шумиха не пошла проекту на пользу. Открывшаяся в прошлом году альфа-версия нового поисковика не выдерживала сравнения с конкурентами, а её “социальность” не бросалась в глаза. Многочисленным критикам Уэйлс отвечал, что нельзя судить Wikia Search по тем же меркам, что и обычные поисковики. Поначалу любой сайт, полагающийся на пользовательский контент, пустует. Чтобы социальный поиск заработал, нужны добровольцы, которые вносят правки, и время.

Впрочем, проходили месяцы, а качество Wikia Search не улучшалось. Экспериментальный поисковик попал в замкнутый круг: плохой поиск отпугивал тех самых пользователей, которые могли бы улучшить его. В конце марта Уэйлс признал, что потерпел неудачу, и объявил о закрытии проекта.

Однако к тому времени идею подхватил сам Google. Каждая ссылка в результатах поиска теперь сопровождаются специальными кнопками. Хорошие ссылки можно поднять повыше, а неподходящие - удалить совсем. Насколько известно, пока это не влияет на результаты, которые видят другие пользовател, но в Google, конечно, собирают данные об использовании новой функции и со временем могут найти им применение.

К проблеме социального поиска можно подойти и с другой стороны. Пользователям Google или “Яндекс”, как правило, нужны вовсе не ссылки. Им нужны ответы на вопросы, которые перед ними стоят, а поиск в Интернете - лишь способ до них добраться.

Когда-то самым верным способом получить ответы на некоторые вопросы был поиск не в вебе, а в ньюс-конференциях Usenet. Лучше всего с этим справлялась поисковая система Deja News (после краха дот-комов в 2001 году она закрылась, но её архивы выкупил Google; теперь она действует под названием Google Groups). Сейчас Usenet вышел из моды, но в Интернете по-прежнему хватает мест для общения.

Именно в этом заключается причина, по которой модный сервис Twitter всё чаще упоминают, когда речь заходит о социальном поиске. Не так давно в западных техноблогах совершенно серьёзно обсуждали, не представляет ли Twitter угрозу для Google. Каким образом этот гибрид микроблога, социальной сети и публичного чата может угрожать Google?

По мнению автора книги “Поиск” Джона Баттелла, важность “статического веба”, который индексируют традиционные поисковики падает, а ему на смену приходит “сиюминутный веб”. “Очень скоро мы сможем получать у поисковых систем ответ на очень простой, но экстраординарно важный вопрос: что люди говорят о моём запросе прямо сейчас?” - разъясняет он в своём блоге.

Наблюдение за разговорами в Twitter и блогах неспособно заменить обычный поиск, но это не значит, что в нём нет смысла. Если ввести название только что вышедшего фильма в поиске на Twitter (в Рунете с той же целью можно использовать сервис “Яндекс.Блоги”, который индексирует русскоязычные блоги и комментарии), сайт выдаст не ссылки, а множество коротких сообщений, в которых только что были упомянуты ключевые слова из запроса. По ним куда яснее, как реагирует на фильм публика, чем по рецензиям, которые выдаст Google.

Бывает, что понятие “социальный поиск” толкуют ещё радикальнее. До наступления эпохи Интернета функции поисковых систем выполняли библиотекари и справочные бюро. Почему бы не сделать сетевое справочное бюро, в котором ответ на каждый вопрос подсказывает не машина, а живой человек?

До сих пор все попытки пойти по этому пути бесславно проваливались. Оказалось, что низкооплачиваемые консультанты редко разбираются в поиске лучше среднего пользователя Интернета. Устроенный по такому принципу сервис ChaCha переориентировался на мобильных пользователей, которым трудно использовать настоящие поисковики. Эксперименты Amazon с социальным поиском на основе Mechanical Turk тоже не увенчались успехом: социальный поисковик NowNow был закрыт через считанные месяцы после начала работы.

Сервис Aardvark, который продемонстрировали на мартовской конференции SXSW бывшие сотрудники Google Натан Столл и Макс Вентилла, устроен хитрее. При регистрации в Aardvark пользователи указывают, чем они интересуются и в чём разбираются, а из Facebook сервис узнаёт, как они связаны друг с другом. Когда один из пользователей задаёт вопрос, сервис отыскивает людей, разбирающихся в этой теме, среди его собственных друзей или знакомых его друзей, и отправляет его к ним.

Бета-тестеры Aardvark в восторге, однако способен ли такой сервис пережить рост численности аудитории? Неизвестно, поскольку ничего подобного пока не делал никто. Впрочем, почти то же самое можно сказать и про любой другой из перечисленных проектов. Каждый из них можно считать экспериментом, и их результаты пока неясны.