Noindex — имя тега, предназначенного для включения в него текста, который не должен быть проиндексирован поисковыми системами (Яндекс и Rambler).
Если выделить отдельный фрагмент текста и закрыть его тегом noindex, он не будет проиндексирован поисковой системой и, соответственно, не попадет в ее кэш. Впервые данный инструмент был предложен специалистами Яндекса, чтобы у веб-мастеров появился простой способ отделения части текстового контента, которая не несет смысловой нагрузки и не должна учитываться при оценке страницы.
Часто у тех, кто использует этот тег, существует убеждение, что если поместить часть какого-либо текста между открывающимся и закрывающимся тегом noindex, то робот Яндекса не станет читать и анализировать этот текст. Но это не так. Этот тег запрещает помещение содержимого в индексную базу, а его содержимое будет прочитано и проанализировано роботом в любом случае.
Существенное отличие их в том, что первый был введен ранее для Google, а второй — только для Яндекс и Rambler. В настоящее время Яндекс также научился распознавать Nofollow, который работает только для ссылок. А Noindex — для любого кода сайта.
Пример 1:
<noindex>Текст, запрещенный к индексированию</noindex>
Яндекс не индексирует текст, но читает его
Пример 2:
<noindex><a href="http:// … .ru/">Текст ссылки</a>
Яндекс не индексирует анкор, но учитывает ссылку на сайт и передает по ней вес
При работе с Noindex существует вероятность того, что снизится валидность кода, так как данный тег знает только российский поисковик. Некоторые HTML-редакторы не воспринимают его, поскольку он не является валидным. К примеру, визуальный редактор в WordPress его попросту удаляет. Поэтому рекомендуется следующий вариант написания:
<!--Noindex--> Весь текст, который надо скрыть <!--/Noindex-->.
При этом другие поисковые системы просто его пропустят, а валидность кода останется неизменной.
Не стоит путать тег Noindex с метатегом, имеющим такое же название. Последний прописывают в начале страницы. Они служат для разных целей. Если взять метатег <meta name="robots" content="noindex,nofollow">, то он запрещает индексирование всей страницы и переход по ссылкам. Этот запрет можно также прописать в файле robots.txt — и такие страницы поисковыми роботами учтены не будут.
См. также
Хлебные крошки на сайте
Зеркало сайта
XML карта