Я спросил у "Яндекса": "Где моя любимая?"
 "Что пристал ты к серверу?" — отвечал админ.
 Интернет-фольклор
 "Что пристал ты к серверу?" — отвечал админ.
 Интернет-фольклор
 Поиск в интернете очень напоминает работу старателя на золотом прииске: чтобы добыть несколько крупинок золота, приходится часами просеивать и промывать килограммы пустой породы.
|
 Этой статьей мы открываем цикл публикаций о поиске информации в интернете. А начнем с азов — с умения задавать правильные вопросы.
 Анатомия ищеек
 Лично убедиться в том, что огромное число новоиспеченных интернет-пользователей просто не умеет искать нужную информацию, можно очень простым способом — зайдя на страничку последних запросов на "Яндексе": www.yandex.ru/last20.html?. Среди банальной глупости вроде "как достать сетевой пароль", "где в Windows хранится пароль к папке" и "ломатель паролей" порой можно встретить настоящие "запросы-шедевры", например такие: "Енциклапедия для дябло", "ищу мошенника по-имени Андрей", "схема транваи в москве", "препарат повышающий интеллект", "как преобразовать из jpg в doc", "скачать программку какуюнибудь", "Полезна ли манструбация?", "резак видеофайлов", "Где скачать интернетмагазин", "иван-да-марья полевой цветок очень нужна картинка помогите", "как лечат стрептоккок", "бесплатно очень быстро скачать мал. размеров ужастик".
 Как говорится, и смех, и грех. Существует три причины, которые приводят к появлению таких запросов:
 1. Общая умственная отсталость.
 2. Обыкновенная лень и нежелание ознакомиться со страничкой помощи на поисковике.
 3. Непонимание механизма работы поискового сервера.
 Разумеется, "умственная отсталость" — это причина отдельная, и ее мы рассматривать не будем. А вот устранить последствия лени и незнания вполне можно.
 Для начала рассмотрим вкратце принципы, по которым работает любой поисковый сервер. Многие ошибочно полагают, что поисковик ищет информацию в интернете в реальном времени, сканируя интернет-странички сразу после получения запроса. На самом деле все обстоит строго наоборот.
|
|
 Вот простейший пример: спайдер нашел на страничке с адресом www.igromania.ru слово "Игрополис" и занес его в упорядоченную по алфавиту базу данных, связав найденное слово с адресом. Если кто-то теперь введет в строке поиска "Игрополис", произойдет следующее: специальная программа просканирует базу данных кластера поисковых серверов, найдет в базе слово "Игрополис" и покажет пользователю ссылку на соответствующую страницу. Разумеется, на самом деле ссылок будет гораздо больше одной, так как "Игрополис" упоминается далеко не на одной странице.  Если в строке поиска введено несколько слов, задача немного усложняется, но принцип остается прежним. Предположим, что в строке поиска пользователь ввел два слова. Что произойдет? Сначала поисковик найдет в своей базе данных первое слово и связанную с ним ссылку, а затем сделает выборку из базы данных, которая будет состоять из всех слов, найденных по этой ссылке. Если в выборке (списке слов) будет найдено и второе слово из строки поиска, значит, эта ссылка будет выдана пользователю в качестве результата поиска.
 Из описанного механизма работы можно сделать следующие выводы:
 1. Поисковый сервер всегда ищет данные в своей локальной базе данных, созданной при помощи спайдеров, а не в Сети.
 2. Некоторые результаты, выданные поисковиком, могут быть устаревшими (страница была удалена или изменена после ее индексирования спайдером).
 3. Новые страницы попадают в базу данных поисковика не мгновенно, а в течение нескольких суток. Это легко проверить, создав на бесплатном сервере страничку с экзотическим выражением (например, "шестьсотпятидесятитрехмерное пространство") и попробовав отыскать это выражение на любом поисковике.  
 4. Можно значительно повысить результативность поиска, если изучить специальные операторы, которые модифицируют стандартный алгоритм поиска в базе данных поискового сервера.
|
 Видовое разнообразие
 Перед тем как перейти к описанию синтаксиса запросов на популярных поисковых серверах, стоит уделить немного внимания классификации поисковиков. Все они работают по одинаковым принципам, описанным выше, но некоторые различия в скорости и способах индексирования между ними существуют. Другими словами, некоторые поисковики быстрее других дополняют и обновляют свою базу данных, а некоторые — лучше упорядочивают сохраняемую информацию, это дает положительный результат при поиске.
 Различия в способах индексирования непосредственно влияют на синтаксис запросов — то есть на те правила, по которым составляются запросы к серверу. Существует две основных группы поисковиков: сервера с фиксированным языком запроса и без него. Правила работы с первыми можно найти в таблице. А для работы со вторыми (к ним, к примеру, относятся www.hotbot.com и www.search.com) существует всего одно правило — чем больше слов в запросе, тем точнее результат.
 Помимо обычных серверов, существуют мета-поисковики (www.360.ru, www.metabot.ru, www.searchmeta.ru и другие), которые сами ничего не индексируют и не ищут, а переадресуют ваш запрос сразу нескольким популярным поисковым серверам, а затем сваливают полученные результаты в одну кучу. Мета-поисковиками лучше не пользоваться — к хорошим результатам это приводит крайне редко. Простая аналогия: гораздо эффективнее влезть на яблоню и сорвать именно то яблоко, которое вам нужно, а не трясти бедное дерево (скорее всего, вас просто завалит яблоками по самые уши).
|
 Поиск задан
 А теперь перейдем непосредственно к поиску. Первый принцип, которым стоит руководствоваться при использовании поисковиков, был сформулирован Козьмой Прутковым задолго до возникновения компьютеров — "не умножай сущностей сверх необходимого". Применительно к поиску в интернете это означает следующее: существительные желательно вводить в строку поиска в единственном числе в именительном падеже, глаголы — в неопределенной форме (инфинитиве).
 Дело в том, что поисковики по умолчанию находят не только точную словоформу, заданную в запросе, но и родственные словоформы. Например, по запросу компьютерный мышь подключать будут среди прочего найдены и страницы, содержащие слова подключение компьютерной мы ши. Также не стоит без лишней необходимости усложнять запрос дополнительными словами. К примеру, запрос winamp скачать вне всякого сомнения даст лучший набор результативных ссылок, чем winamp на русском для Windows XP хочу скачать быстро бесплатно (скорее всего, последний пример запроса вообще не даст никакого результата).
|
 Также стоит освоить простейшие операторы для расширения или ограничения результатов поиска. Большинство серверов при наличии нескольких слов в запросе по умолчанию ищут страницы не только с точной фразой, заданной в строке запроса, а хотя бы с одним из заданных слов. Возможно, лучший результат даст поиск с заданием точной фразы. Так, поиск по запросу Катя Синичкина может привести на страничку Васи Синичкина или на сайт с рассказами про синичек (страшно подумать, куда еще он может привести), а поиск по запросу "Катя Синичкина" (с кавычками) даст ссылки только на документы с точной фразой Катя Синичкина.
 Помимо задания точных фраз, очень полезно использовать два простых оператора для поиска — ИЛИ и НЕТ, а также скобки для определения очередности выполнения операторов. Оператор ИЛИ (обычно записывается как OR или |) предназначен для расширения результатов; например, запрос почта Игромании (Геймер OR Катя) выдаст ссылки на странички, содержащие слова "почта", "Игрополис", а также хотя бы одно из слов — "Геймер" или "Катя". Оператор НЕТ (записывается как NOT или !) имеет прямо противоположное назначение и служит для ограничения результатов поиска. Пример: запрос Геймер NOT киберспорт даст в качестве результатов ссылки на странички со словом "Геймер", но только в том случае, если на этих страничках отсутствует слово "киберспорт" (таким образом мы отфильтровываем ненужные нам страницы о профессиональных геймерах).
 * * *
 В одном из ближайших номеров "Игромании" мы подробно рассмотрим синтаксис запросов двух самых популярных поисковых серверов — "Яндекса" и Google, научимся искать картинки и другие файлы, а также изучим некоторые трюки, которые позволяют получить наиболее точные результаты.
Синтаксис запросов
Поисковая служба | Запрос |   | |
Тип поиска | Пример строки запроса | Результат поиска (страницы, содержащие:) | |
Апорт (www.aport.ru) |  1. Словосочетание |  Нивал Демиурги |  И слово "Нивал", и слово "Демиурги" или хотя бы одно из них |
 2. Ограничение поиска |  Демиурги NOT обзор |  Слово "Демиурги", но без слова "обзор" | |
 3. Расширение поиска |  Демиурги OR Аллоды |  Любое из слов - "Демиурги" или "Аллоды" | |
 4. Поиск всех форм неологизмов и экзотических слов |  Нивал* |  "Нивал", "Нивала", "Ниваловцы" и т.д. | |
 5. Поиск в заголовках |  title=Проклятые земли |  Словосочетание или отдельно слова "Проклятые" и "земли" в заголовках документов | |
 6. Поиск по заданному адресу |  url=www.nival.ru Демиурги |  "Демиурги" только сайте www.nival.ru | |
 7. Список всех документов по адресу |  url=www.nival.ru |  Все страницы на сайте www.nival.ru | |
 8. Поиск ссылок |  anchor=обзор |  Гиперссылку, содержащую слово "обзор" | |
Рамблер (www.rambler.ru) |  1. Словосочетание |  Нивал Демиурги |  И слово "Нивал", и слово "Демиурги" или хотя бы одно из них |
 2. Ограничение поиска |  Демиурги NOT обзор |  Слово "Демиурги", но без слова "обзор" | |
 3. Расширение поиска |  Демиурги OR Аллоды |  Любое из слов - "Демиурги" или "Аллоды" | |
 4. Различные словоформы |  #Игрополис |  "Игрополис", "Игромании", "Игроманию" и т.д. | |
 5. Точное выражение |  "Катя Синичкина" |  Точную фразу "Катя Синичкина" | |
Яндекс (www.yandex.ru) |  1. Словосочетание |  Нивал Демиурги |  И слово "Нивал", и слово "Демиурги" или хотя бы одно из них в одном и том же предложении |
 2. Ограничение поиска |  Демиурги ~ обзор |  Слово "Демиурги", но без слова "обзор" | |
 3. Расширение поиска |  Демиурги | Аллоды |  Любое из слов - "Демиурги" или "Аллоды" | |
 4. Слова в одном тексте |  Нивал && Аллоды |  И слово "Нивал", и слово "Демиурги" или хотя бы одно из них в одном тексте (не обязательно в одном предложении) | |
 5. Точное выражение |  "Катя Синичкина" |  Точную фразу "Катя Синичкина" | |
 6. Уточнение поиска |  Нивал +Аллоды -Проклятые |  Слово "Нивал", а также обязательно содержащие слово "Аллоды", но не содержащие "Проклятые" | |
 7. Поиск в заголовках |  $title "Проклятые земли" |  Точную фразу "Проклятые земли" в заголовках документов | |
 8. Поиск по заданному адресу |  Демиурги #url="www.nival.ru" |  "Демиурги" только сайте www.nival.ru | |
 9. Поиск ссылок |  $anchor обзор |  Гиперссылку, содержащую слово "обзор" | |
Лупа (www.lupa.ru) |  1. Словосочетание |  Нивал Демиурги |  И слово "Нивал", и слово "Демиурги" |
 2. Ограничение поиска |  Демиурги --обзор |  Слово "Демиурги", но без слова "обзор" | |
Черепаха (www.turtle.ru) |  1. Словосочетание |  Нивал Демиурги |  И слово "Нивал", и слово "Демиурги" или хотя бы одно из них |
 2. Ограничение поиска |  Демиурги ! Обзор |  Слово "Демиурги", но без слова "обзор" | |
 3. Расширение поиска |  Демиурги | Аллоды |  Любое из слов - "Демиурги" или "Аллоды" | |
 4. Точное выражение |  "Катя Синичкина" |  Точную фразу "Катя Синичкина" | |
 5. Поиск в заголовках |  {header} Проклятые земли |  Словосочетание или отдельно слова "Проклятые" и "земли" в заголовках документов | |
Google (www.google.com) |  1. Словосочетание |  Nival Etherlords |  И слово "Nival", и слово "Etherlords" или хотя бы одно из них |
 2. Ограничение поиска |  Etherlords -review |  Слово "Etherlords", но без слова "review" | |
 3. Расширение поиска |  Doom (Carmack OR Romero) |  Слово "Doom" и любое из слов "Carmack" или "Romero" | |
 4. Точное выражение |  "Quake III: Arena" |  Точную фразу "Quake III: Arena" | |
 5. Поиск в заголовках |  intitle:Quake |  Cлово "Quake" в заголовках документов | |
 6. Поиск по заданному адресу |  Quake site:www.idsoftware.com |  "Quake" только на сайте "www.idsoftware.com" | |
 7. Поиск похожих страниц |  related:www.gamespy.com |  Информацию, похожую на содержание заглавной страницы сайта GameSpy | |
Altavista (www.altavista.com) |  1. Словосочетание |  Nival Etherlords |  И слово "Nival", и слово "Etherlords" или хотя бы одно из них |
 2. Ограничение поиска |  Etherlords -review |  Слово "Etherlords", но без слова "review" | |
 3. Расширение поиска |  Doom (Carmack | Romero) |  Слово "Doom" и любое из слов "Carmack" или "Romero" | |
 4. Поиск всех форм неологизмов и экзотических слов |  quake* |  "quake", "quaker", "quaking", "quake-god" и т.д. | |
 5. Точное выражение |  "Quake III: Arena" |  Точную фразу "Quake III: Arena" | |
 6. Поиск в заголовках |  title:Quake |  Cлово "Quake" в заголовках документов | |
 7. Поиск по заданному адресу |  Quake host:www.idsoftware.com |  "Quake" только на сайте "www.idsoftware.com" | |
 8. Поиск похожих страниц |  like:www.gamespy.com |  Информацию, похожую на содержание заглавной страницы сайта GameSpy | |
 9. Поиск ссылок |  anchor:"Click here" |  Гиперссылку, содержащую "Click here" | |
Lycos (www.lycos.com), Yahoo (www.yahoo.com) |  1. Словосочетание |  Nival Etherlords |  И слово "Nival", и слово "Etherlords" или хотя бы одно из них |
 2. Ограничение поиска |  Etherlords -review |  Слово "Etherlords", но без слова "review" | |
 3. Расширение поиска |  Doom (Carmack OR Romero) |  Слово "Doom" и любое из слов "Carmack" или "Romero" | |
 4. Точное выражение |  "Quake III: Arena" |  Точную фразу "Quake III: Arena" |