Google посещает страницы по несвязанным URL-адресам и создает 404 ошибки

Некоторое время назад Джон Мюллер в одной из видеовстреч в Центре веб-мастеров ответил на вопрос, рассматривает ли Google URL - адрес это не ссылка , а просто фрагмент текста в виде URL. Другими словами, это не тег A с атрибутом HREF, и это не интерактивная ссылка.

Джон ответил, что да, Google получает такой адрес, и если они не нашли его раньше или не имели информации об этом в базе данных, они отправляют туда своего робота Google. Они делают это, например, чтобы обнаружить новые домены , у которых еще нет ссылок, и кто-то упомянул их только в контенте. Такое упоминание, цитируя адрес, не передает значение PageRank Просто сообщите Googlebot об адресе.

С одной стороны, у функции есть свои преимущества, потому что она делает так, что если кто-то упомянул адрес и на него нет ссылок, робот Google посетит его. Однако с практической точки зрения, кто в настоящее время создает контент, который никак не связан?

Текущие текущие версии известных и популярных систем CMS, таких как WordPress или Joomla, имеют ряд механизмов, благодаря которым робот Googlebot сразу же появляется на странице после публикации контента. Чаще всего они включают создание карты XML , размещение информации о вновь созданном контенте на карте сайта для пользователя или просто размещение новой статьи на странице внутренней ссылки . Владельцы веб-сайтов также публикуют сигналы о новом контенте в социальных сетях или отправляют ссылку на новый материал по электронной почте.

Однако у указанной функции также есть, по крайней мере, один недостаток, с которым я столкнулся минуту назад, и это заставило меня принять решение более подробно рассмотреть этот механизм. Просмотр информации в Инструментах для веб-мастеров на вкладке индексирование / Ошибки сканирования Я заметил новую ошибку, которой раньше не было. Обычно я проверяю это место время от времени, чтобы искать возможные способы лучше перенаправить ссылки, которые ведут на несуществующие страницы, или исправить адреса на текущих страницах, или связаться с веб-мастерами, которые разместили ссылку, но они сделали это неправильно.

Список содержит ссылку на файл XLS с данными, которые были недавно разработаны для статьи о самые популярные польские сайты и статьи о SEO. Статья содержала одну единственную ссылку на этот файл XLS, но по какой-то причине робот Google также увидел версии с одним дополнительным символом в конце пути (скриншот ниже).

Как видно из примера, в конце пути был дополнительный символ, что привело к созданию адреса, который в данный момент не обслуживается доменом
Как видно из примера, в конце пути был дополнительный символ, что привело к созданию адреса, который в данный момент не обслуживается доменом. Адрес ведет в каталог, где хранятся все мультимедиа и возвращается с уровня WordPress. Ошибка 404 потому что нет такого файла. Я проверил, что могло заставить робота Google хотеть посетить такой адрес, то есть, где была размещена ссылка на этот адрес. Оказывается, ссылка отсутствует.

Оказывается, ссылка отсутствует

В последней вкладке вы можете увидеть адрес, по которому находится ссылка. Даже вкладка называется «Ссылка с домена».

После перехода по указанному адресу выясняется, что это автоматически сгенерированный спам, который смешивает разные строки символов и создает последующие подстраницы. Кроме того, это один из тех худших спам, потому что с контентом для зрителей старше 18 лет.

Если вы посмотрите на него, вы перепутали не только адрес этого домена, но и других сайтов о   SEO   среди других   блог   от   + Эвелина Если вы посмотрите на него, вы перепутали не только адрес этого домена, но и других сайтов о SEO среди других блог от + Эвелина. Обращая внимание на детали, на странице нет ни одной ссылки. Все это разбито или модифицировано в чисто текстовой форме URL. Сделав выводы быстро, робот Googlebot взял эти адреса за хорошую монету, решил посетить, и когда он потерпел неудачу, он сообщил Ошибка 404 в Инструменты для веб-мастеров. Просто красиво! Осталось только посчитать, что Google не рассматривает эту ошибку в ущерб домену, который ее возвращает.

Джон Мюллер упомянул эту функцию в начале сентября 2013 года, и цинк о нем появился в интервью с Лукашем Железным это пристально следит за всей такой информацией, но сегодня есть доказательства этого, но с плохими результатами для Google и пользователей.

Подпишитесь на рассылку, заполнив поля ниже. Вы будете в курсе всех событий, связанных с Силезией SEM и информация об интернет-маркетинге в сети. Мы не спам.

Вам будет отправлено электронное письмо с подтверждением: прочитайте инструкции, чтобы подтвердить вашу подписку.

Следующие две вкладки изменяют содержимое ниже. Следующие две вкладки изменяют содержимое ниже

Независимый специалист SEM, который распространяет знания о маркетинге в поисковых системах. В свободное время она советует вам, как найти свой собственный путь в Google.