Пауки (Crawlers) – программы, входящие в состав поисковиков. С их помощью перебирают интернет-страницы, чтобы занести информацию о них в базу поисковой системы. Они используются для анализа содержимого web-страницы, сохранения его в индекс и отправки на следующие страницы по специальным ссылкам.
В состав робота входит большое количество компьютеров, задача которых сводится к запросу и выбору страниц. Фактически, бот может одновременно запрашивать несколько тысяч web-страниц.
Во многих поисковых системах предусмотрена возможность самостоятельного добавления web-страницы для краулинга. Это позволяет ускорить процесс индексирования сайта и заявить о его существовании. С этой же целью можно использовать системы веб-аналитики поисковиков (Яндес.Метрика, Google Analytics, Рейтинг@Mail.ru).
В своей работе «паукам» приходится сталкиваться с ограничениями, которые накладывают поисковые системы. В частности, они контролируют, на какую глубину сайта он может проникнуть или какой объем текста может просканировать. Существуют сервисы, вроде robots.txt, помощью которых можно установить запрет на сканирование страницы.
Проверьте свои знания интернет-маркетинга
Раскрываем полезные темы для интернет-маркетологов!
Свяжитесь с нами, и мы расскажем о всех подробностях обучения
Полезные статьи, дайджест и анонсы курсов. Без спама.
О нас
Курсы
База знаний
Бизнесу
Ещё
Мы используем файлы cookies, чтобы вам было удобнее пользоваться сайтом. Оставаясь на сайте, вы соглашаетесь с этой технологией и политикой конфиденциальности.
Мы используем файлы cookies. Оставаясь на сайте, вы соглашаетесь с политикой конфиденциальности.