Устраняем проблему с индексацией вложенных страниц Вордпресс

Всем привет! Сегодня пост будет небольшой, но полезный для многих владельцев сайтов на Вордпрессе. Расскажу об одной ошибке, с которой столкнулся на некоторых сайтах. Все знают, что дубли страниц WordPress не являются редкостью. Вот с такой проблемой, мне и пришлось поработать. Если точнее, то речь даже не о дублях, а об индексации страниц с медиафайлами. Далее вы узнаете о причинах появления этой проблемы, о способе устранения, а также о косяке, который я допустил при устранении.

Как я уже упомянул, проблема касалась медиафайлов WordPress. Подозреваю, что с проблемой столкнулся не один владелец сайта, поэтому лучше знать заранее, как устранить ошибку.Вложенные страницы WordPress

Откуда взялись проиндексированные страницы

Сейчас рекомендуют использовать ссылки ЧПУ. Но, не все знают, что на Вордпресс с ними может возникнуть проблема. Не догадывался об этом и я. Просто в один прекрасный момент, после АПа, обнаружил на двух сайтах, которые веду значительное увеличение проиндексированных страниц. На одном вместо 62 документов, стало почти 300. На другом вместо 5, оказалось 25 документов в индексе.

При более внимательном рассмотрении оказалось, что в индекс попали картинки, как отдельные страницы. В индексе были страницы в формате сайт.ru/i1, то есть каждая картинка имела отдельную страницу, и была в выдаче. Естественно, мне это не понравилось. И я начал поиск решения. Как выяснилось, такая проблема коснулась не только меня, но и многих людей, подключивших ЧПУ.

Как их устранить

Самым простым способом будет добавлять картинки из библиотеки, а не через медиафайлы. Хотя особо простым этот способ не назовешь. Это увеличивает время работы над сайтом, да и в случае, когда проблема выявилась не сразу после создания сайта, а когда там уже около сотни страниц, вообще становится серьезным геморроем. Так что же делать?

Для начала обратим внимание, что это не совсем дубли страниц WordPress, а страницы вложения, о чем уже упоминалось. Они называются attachment, их и нужно склеить с основной страницей. Первой мыслью у меня было подредактировать файл robots.txt для WordPress. После внимательного рассмотрения ситуации от данного решения отказался. Файл получился бы безразмерным, на одном из сайтов пришлось бы дописывать туда 240 строк, причем при добавлении других страниц еще дописывать. Или менять структуру url, чтобы их всех объединял один тег или раздел. Поэтому, было принято сделать редирект 301 для склейки картинок с основной страницей. Сделать это можно несколькими способами.

Не используйте закрытие картинок в robots.txt. Это приведет к ряду неприятных последствий.

  • Файл увеличится до космических масштабов.
  • Если закрыть полностью картинки от индексации, потеряем пользователей из поиска по картинкам. Да и поисковики к такому относятся отрицательно.

Не пользуйтесь подобными костылями, есть более удобные и эффективные методы.

Htaccess

Тут все просто, достаточно прописать в данный файл вот такую строку.

RewriteRule (.+)/attachment /$1 [R=301,L]

И все, больше ничего делать не нужно.

Function.php

Данный способ нашел на одном форуме, но поручиться за его надежность не могу. Встречал всего один раз, а на практике не применял. Но, все же приведу его здесь. В файле function.php прописываем следующий код.
function wph_noindex_for_attachment() {
if(get_post_mime_type()!= false) {
echo ''.PHP_EOL;
}
}
add_action('wp_head', 'wph_noindex_for_attachment');

Проблема устранена. Остается только ждать.

Плагин

Ну, и, наверное, самый простой для новичков метод. Просто устанавливаем плагин Attachment Pages Redirect. Обратите внимание, таких плагинов несколько, я использовал созданный Samuel Aguilera. Выполняем простую работу по установке и активируем плагин. Никаких настроек не требуется.

Как ускорить склейку

Для эксперимента я выбрал сайт, на котором было 62 документа, его я активно продвигал. Второй ресурс, попавший под эту проблему, создавался для жены, и она туда пишет по желанию, этот сайт мог подождать, ибо продвигать его никто не собирался.

Но, тут я допустил одну ошибку, из-за чего склейка растянулась на пару месяцев. Не использовал переобход страниц. Со вторым сайтом произошло все по-другому, я учел ошибку. Вот алгоритм ускорения переиндексации.

  1. Скачайте из вебмастера проиндексированные страницы.
  2. После решения проблемы любым способом, просто запускайте адреса страниц с картинками в «переобход».

Скорость восстановления нормального числа страниц в поиске зависит от количества картинок. Вот что было вначале (цифрой 2 помечено число страниц в индексе).
Проиндескированные страницы
А это через пять дней.
действие плагина Вордпресс
Надеюсь, что статья будет полезна, и вы сможете без особых сложностей устранить возникшую проблему.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *