Канонические ссылки и дубли Эксперимент со ссылками Дэна Петровича Исследования патентов Google от Билла Славски Как повысить авторитетность сайта Канонические ссылки и дубли Некоторые нюансы продвижения сайтов в Google SEO-специалисты могут определять в ходе экспериментов или догадок на основе опыта.
Представим ситуацию: на сайте выложили документ, а потом владельцы нескольких других ресурсов разместили его на своих сайтах. Какой из ресурсов Google будет считать каноническим, а какие дублями?
Логично предположить, что оригиналом будет считаться файл на сайте, на котором он появился первым. Но это не так: если в сети появилось несколько копий одного документа, каноническим считается наиболее авторитетный URL. Остальные считаются дублями, причем входящие ссылки на них становятся входящими ссылками на канонический документ. Это называется инвертированием ссылок.
Мы не сталкивались с этим в практике, но оптимизаторы, работающие в буржунете, отметили такую особенность.
Допустим, вы выкладываете в своем блоге pdf-файл с чек-листом или шаблоном контент-плана, который сами составили. Через пару дней несколько других блогов размещают документ у себя. Если ваш ресурс самый авторитетный из них, то будет считаться каноническим, а URL копипастеров окажутся дублями, и ссылки на них будут засчитываться вам. Ссылки на дубли вместе с другими ссылками на ваши страницы будут отображаться в Search Console.
Для владельцев сайтов это хорошо: чем больше ресурсов ворует ваш контент и размещает у себя, тем больше ссылок вы получите. Но это работает, только если ваш URL самый авторитетный из них. Если Google обнаружит этот же документ на чьем-то более авторитетном сайте, то ваш окажется дублем, и все ссылки начнут продвигать тот ресурс.
Эксперимент со ссылками Дэна Петровича
Дэн Петрович, управляющий директор DEJAN и SEO-специалист, проверил инвертирование ссылок опытным путем.
В 2010 году Google ввел Percolator — систему обработки веб-страниц для включения в индекс, и Caffeine — систему индексации на ее основе. Эти системы нужны для создания индекса веб-поиска.
В 2012 году Дэн продемонстрировал, как работает система передачи каноничности авторитетным ссылкам. Он создал точную копию оригинальной страницы, поставил на нее ссылку, и Google определил ее как дубль из-за низкой авторитетности. Все ссылки на дубль перешли каноничной странице и определились в Search Console.
Уведомление в Search Console
Недавно Дэн повторил опыт несколькими быстрыми тестами и каждый раз примерно через неделю после теста каноническая страница принимала на себя ссылки дублей.
Некоторые читатели делятся таким же опытом в Twitter:
I have a client that has a PDF on their site. They are not the original business to feature it, many people are distributors for this product line. I noticed in GSC that they are credited with incoming links, b/c the PDF exists on other sites.
— John Locke (@Lockedown_) 11 октября 2018 г.
Джон пишет, что его клиенты размещают pgf на своем сайте. Многих из этих файлов дистрибьюторы используют на своих ресурсах, и их входящие ссылки засчитываются сайту клиента как более авторитетному.
Дэн Петрович считает, что инвертирование ссылок — не просто концепция, которая может сработать или не сработать при продвижении в Google, а реальный механизм определения канонической страницы, его можно отследить в Search Console. Пока мнение Дэна подтверждено несколькими тестами.
Исследования патентов Google от Билла Славски
Специалист по SEO, исследователь патентов Google Билл Славски изучил новые документы, которые могли бы подтвердить позицию Дэна Петровича.
Он нашел патент «Идентификация первичной версии документа», который описывает способы различать дубликаты страниц разных доменов на основе правил приоритетности. Система считает приоритетность для ссылки, основываясь на версии документа источника. Но из этого патента не следует, что основная версия считается канонической и все ссылки перенаправляются на нее.
В другом патенте «Репрезентативный выбор документа для дубликатов документов» речь о том, каким образом из набора дубликатов система выбирает основную версию документа.
Билл проанализировал информацию из патентов и сделал вывод, что для определения авторитета система ориентируется на множество данных:
- данные об источнике;
- права на контент;
- ключевые слова;
- внешние ссылки;
- информация о цитировании.
Версия, у к которой эти показатели лучше, чем у остальных, становится авторитетной и считается основной версией документа.
Научные труды изучают более тщательно с анализом дополнительных данных, среди них:
- название;
- издатель;
- дата и место публикации;
- информация о цитировании;
- идентификаторы PubMed, SICI, ISBN.
В 2016 году на видеоконференции в прямом эфире с сотрудниками Google оптимизаторы задали несколько вопросов о дублированном контенте.
Google имеет свою систему, по которой определяет, какой из дублей посчитать основной версией.
Нельзя с уверенностью сказать, что механизм точно такой, как описывал в своей статье Дэн Петрович. Но инвертированность ссылок подтверждаются опытом некоторых оптимизаторов: быстрыми тестами и появлением новых ссылок в Search Console. Поэтому если продвигаетесь в буржунете и хотите, чтобы Google определял страницу как каноническую, работайте над авторитетностью сайта.
Как повысить авторитетность сайта
Раньше авторитетность в Google по большей части зависела от ссылочной массы, от показателя PR — Page Rank, но параметр потерял свою значимость. Авторитетность считается на уровне страницы и определяется совокупностью многих факторов, в числе которых те, что перечислил Билл Славский:
- Источник. Возраст домена, доменная зона, срок регистрации и владения доменом. Чем старше домен, тем лучше.
- Контент. Тексты и иллюстрации должны быть полезны юзерам, система считает плотность и тошнотность ключей, уникальность и естественность текста.
- Права.
Уникальные статьи с авторским контентом не вызовут проблем с авторским правом. - Цитирование контента.
- Ссылки.
- Юзабилити.
- Скорость.
- Сниппет.
Google рассказал о важности окончаний URL-адресов
Как перейти на HTTPS
Подборка инструментов для SEO и LSI-копирайтинга: как собрать и проверить ключи
Продвижение сайта по низкочастотным запросам
4 тактики подбора ключевых слов, которыми не все пользуются
Защищаем авторские права в Яндекс, Google и соцсетях
Как найти тех, кто украл вашу статью: обзор сервисов антиплагиата
Количество цитирования контента с этой страницы добавляет ей авторитетности.
Семантическое ядро: как составить и зачем это нужно?
Как составить семантическое ядро: обзор инструментов
Анализируем топ выдачи, чтобы пробиться в лидеры
Система анализирует количество и качество внешних ссылок, их возраст. Спамные, нерелевантные ссылки не дадут авторитета.
6 способов бесплатно получить обратные ссылки
Внешние ссылки: инструкция к применению
Внешние ссылки: инструкция к применению. Часть 2
Если пользователю неудобно работать с сайтом, к примеру, верстка не кроссбраузерная, мобильная версия не работает или смещается со смартфонов, то ресурс получит много отказов, что скажется на авторитете.
Юзабилити и психология: почему ваши клиенты не замечают изменений на сайте
5 бесплатных инструментов для самостоятельного юзабилити-тестирования сайта
Google снижает ранжирование за низкую скорость, а пользователи не будут ждать долгой загрузки сайта с мобильных или десктопов, ресурс получит отказы.
Как и зачем оптимизировать изображения на сайте?
5 способов увеличить скорость загрузки сайта
9 плагинов WordPress для ускорения загрузки сайта
Попадание страницы в расширенный сниппет на нулевой позиции будет говорить о том, что страница лучше отвечает на запрос пользователя.
Как попасть в блок с ответами в Google
40 шагов к идеальному сниппету
Высока вероятность того, что страница может стать канонической и получить влияние сторонних ссылок, если она станет авторитетной для Google. Практика Дэна Петровича и мнение Билла Славски это подтверждают. Это не конечный список показателей, которые нужно улучшать, повысить авторитет сайта поможет работа с качеством ресурса.
Проверьте, что еще можно улучшить на сайте:
Чек-лист: проверьте сайт перед запуском по всем параметрам
Самостоятельный аудит сайта: часть 1. Технический аудит
Самостоятельный аудит сайта: часть 2. SEO-аудит
Самостоятельный аудит сайта: часть 2. SEO-аудит, продолжение
Самостоятельный аудит сайта: часть 3. Юзабилити-аудит
Самостоятельный аудит сайта: часть 3. Юзабилити-аудит, продолжение