Проверка и удаление битых ссылок на сайте

Здравствуйте, друзья!

Сегодня пойдет речь об одном из важных моментов, который стоит постоянно анализировать при ведении своих сайтов.

Статья посвящена такому понятию, как "битые ссылки". Поговорим о том, как делается проверка битых ссылок на сайте, чтобы их потом удалить и сделать ресурс чище.

Откуда берутся и чем вредны

Что вообще такое битые ссылки? Это ссылки на другие страницы нашего сайта или другого ресурса, которые уже недоступны. То, есть когда-то мы внутри своей статьи сослались на какую-то страницу своего же сайта, а потом либо удалили эту страницу либо же изменили ее адрес. Таким образом страница больше недоступна, но ссылка на нее проставлена. Такая ссылка и будет битой, так как при переходе на нее мы попадаем в никуда. Выдаст ошибку 404.

Тоже самое и с ссылками на другие ресурсы. Сослались на кого-то, а сайт перестал существовать. Посетитель хочет перейти, а ссылка то битая. Все, не выйдет. Что-то пообещали в материале, а адрес страницы больше недействителен. Был рабочий, а теперь вместо таких URL у нас присутствуют битые ссылки.

Кстати, если на вашем проекте много комментариев и они постоянно добавляются, то будьте уверены в большом наличии таких ссылок. Это самый распространенный источник на персональных блогах, особенно в тематике создания тех же сайтов и блогов.

Их количество зависит от объемности ресурса и, чем их больше, тем хуже вашему сайту. Они вводят в заблуждение посетителей и поисковых роботов, когда те по ним пытаются перейти. И первые и вторые попадают в никуда. В лучшем случае, просто происходит обман, так как обещанный контент по URL адресу недоступен. Худшим же вариантом является наличие массы ошибок технического характера в следствие того, что на страницах сайта содержатся битые ссылки.

Поэтому, нужно следить за данным моментом - делать поиск битых ссылок на сайте и производить их удаление.

Проверка битых ссылок может делаться специальным платными сервисами, где вам все укажут. Можно заказать аудит сайта, где по полкам разложат все недочеты, а можно делать это все руками.

Вероятнее всего, что вы выберите вариант самостоятельной проверки и очистки своего сайта от нерабочих ссылок. К рассмотрению таких способов мы и переходим.

Больше всего, что вы используете движок WordPress. Если это так, то вам круто повезло, так как имеется очень крутой плагин, который сделает все в автоматическом режиме, кроме удаления естественно. Но это также делается просто.

к содержанию ↑

Скачать плагин можно софициальной страницы.

Далее можно перейти в настройки плагина и настроить некоторые параметры, хотя по умолчанию все и так стоит, как нужно.

На вкладке "General" я ничего не трогал. Интересный момент это отслеживание статистики в рельаном времени о процессе поиска и проверки всех ссылок на сайте.

На вкладке "Look for links in" настраиваем места, где будет производится поиск. По умолчанию стоят стандартные варианты поиска внутри статей, комментариев, страниц и только в уже опубликованных материалах. Если вам нужно еще что-то добавить, то ставите чек-бокс напротив нужных настроек.

На вкладке "Which links to chek" настраиваем типы ссылок, которые будут участвовать при поиске и проверке. По умолчанию стоят обычные типы в видео обычных ссылок и ссылок в изображениях. Также можно сделать проверку по ссылкам, которые содержатся в плеерах от Yotube, Vimeo и так далее.

Если же нужно какие-то ссылки не принимать во внимание, то тут же можно настроить и исключения. Просто введите данные URL в список исключений и они будут принимать участие во всем процессе.

На последней вкладке "Дополнительно" мы и можем начать процесс проверки сайта на битые ссылки, нажав на кнопку в самом низу страницы данного пункта.

Остальные параметры, находящие здесь, стоят на приемлемом уровне, поэтому я их пропустил в рассмотрении. После нажатия на кнопку, начнется проверка битых ссылок на сайте. Количество ссылок к проверке и статус процесса можно смотреть на первой вкладке (см. выше).

Чтобы увидеть сами результаты проверки и удалить битые ссылки, нужно перейти в пункт "Инструменты - неправильные ссылки".

Broken link checker может довольно долго проверять сайт. Все зависит от количества страниц и ссылок на них.

После перехода в неправильные ссылки нам доступны 4 вкладки, где сортируются ссылки по разным параметрам. Первая вкладка содержит все ссылки, которые подверглись проверке. Ее рассматривать не буду.

Во второй вкладке "неправильные" содержатся неправильные ссылки, которые отдают различные ошибки, например:

  • 404 Not Found;
  • Время ожидания загрузки;
  • Server Not Found;
  • 500 Internal Server Error;
  • 403 Forbidden.

Исходя из этих ошибок, не всегда можно сразу удалять битые ссылки, ведь может, что сайт, на который мы ссылаемся, просто сейчас лежит. Но в ближайшее время он заработает и ссылка также вместе с ним. Тогда можно подождать.

Если же отдаются ошибки 404, 403 - смело можно удалять такие ссылки.

На момент написания этой статьи, на моем блоге плагин нашел 2 неправильные ссылки, которые ведут на сторонние ресурсы.  Это конечно не все, их гораздо больше. Просто плагин еще не закончил работу.

В таблице указывается тип ссылки (картинка, текст) и источник, то ест страница, где она проставлена.

Битые ссылки я могу удалить, как по очередности (после наводки курсором мышки воспользоваться пунктами), так и вместе, выделив их чек-боксами и применив к ним общее действие. Смотрите ниже.

Как видим, мы можем как удалять ссылки, так и их редактировать и даже помечать их, как небитые.

Редактирование может быть полезно в случае с ссылками, оставленными в имени комментаторов на сайте, так как часто там допускают ошибки. Можно внести правку и ссылка станет рабочей.

На вкладке "Перенаправленные" нам показывает рабочие ссылки, которые перенаправляю нас на другие внутренние страницы сайта или же на другой ресурс.

По данному плагину закончил. Если я в нем чего-то и не рассмотрел, то это особой роли не играет или не нужно вовсе.

Кстати, совсем забыл сказать, что не обязательно держат плагин постоянно включенным. Можно раз в неделю активировать его, производить чистку и затем снова отключать. Незачем создавать лишнюю нагрузку на сайт.

Но, если плагин будет активирован постоянно, то отслеживание будет происходить в реальном времени и в случае появления некорректных URL на сайте, на почту будут приходить письма с оповещением, где будут необходимые данные.

Можно переходить ко второму способу, который подойдет вам, если сайт стоит не на WordPress. Если у вас там Joomla или другой движок, то может также имеются подобные плагины, но я о них не знаю. Напишите, пожалуйста, их в комментарии. Добавляю в рекомендуемый список плагинов в эту статью.

к содержанию ↑

Программа Xenu

Если честно, то данный вариант мне вообще не нравится, так как удаление ссылок приходится делать руками на каждой странице, редактированием самих страниц. Нужно зайти на каждую страницу, где есть битые ссылки и произвести редактирование страниц, удалив сами ссылки или заменив на другие URL.

Если сайт объемный, то данный способ может быть нецелесообразен.

Программа бесплатная. Качайте ее отсюда, устанавливайте и запускайте.

Сразу открываем меню "File-check url" и в следующем окне вставляем адрес сайта, который нужно проверить.

Программа сразу начнет сканировать все страницы и искать все ссылки. Это также займет время, в зависимости от масштабов ресурса.

После проверки вы увидите весь список URL'ов, которые будут выделены зелеными и красными цветами.

  • Красный - нерабочие ссылки;
  • Зеленые - рабочие.

Чтобы узнать, на какой странице находятся эти адреса, нужно обратиться к контекстному меню (правая кнопка мыши) нужной ссылки.

В следующем окне будет список адресов всех страниц, где фигурирует данная ссылка. Таким образом стоит перейти на каждую и удалить URL.

Дело муторное, но заниматься этим нужно.

Хочу сделать замечание по поводу скриншота выше. Как вы видите, адреса всех страниц одинаковые, но в конце имеются приставки вида replytocom. Это не значит, что нужно заходить по каждому такому адресу. Достаточно удалить ссылку с главного адреса, который находится в начале списка без этой приставки.

Эта приставка в данном случае показывает адрес дублированной страницы, которая создается кнопкой "Ответить" в комментариях на сайте WordPress. Можете взять данный момент на заметку. Как избавиться от таких дублей и, как закрыть эту ссылку, чтобы она не навредила сайту, поговорим в следующим материалах.

На этом, друзья, материал можно заканчивать. В комментариях хотелось бы услышать какие-то вопросы, если что-то непонятно. Может вы по-другому ищете битые ссылки? Тогда как?

Также буду очень рад услышать ваши дополнения и советы. Все учту. Если информация будет стоящая, то добавлю ее в материал, чтобы он казался более полным и полезным.

Все, ребята! До встречи!

С уважением, Константин Хмелев!

40 лет Победы51937Украина, Днепропетровская обл., г. Днепродзержинск,+38 093 338 11 41
Комментариев: 3
  • Костя, а что насчёт битых ссылок, на которые другие мои страницы не ссылаются?
    Скажем, при создании страницы ей было дано название на кириллице. Позже, я, разумеется, обнаружил сей факт и странице присвоил имя на латинице, но в перечне индексируемых страниц старые кириллические все равно висят (вижу через яндекс вебмастер).

    • Не совсем понял вопрос. Плагин обнаружит битые (нерабочие ссылки). Если такие есть, то их нужно удалять, заменять на новые. Старые страниц со временем выпадут из индекса. Это лишь дело времени.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *