Огромный интерес к рубрике «В ТОП без гирь», где публикуются SEO-аудиты, заставил нас задуматься о раскрытии основных методик проверки сайтов. Собственно, ничего секретного в них нет. Наоборот – чем больше сайтовладельцев смогут самостоятельно проверять свои ресурсы с точки зрения готовности к поисковому продвижению, тем выше будет результативность работы SeoPult.
Конечно, опытному специалисту гораздо легче найти «узкие места» и недостатки, но владелец сайта, пусть и новичок в SEO, обладает преимуществами – неограниченным запасом времени и высокой мотивацией.
Сегодня мы опишем технологию SEO-аудита, но рубрику «В ТОП без гирь» закрывать не будем. Наоборот, мы ждем более активного и осознанного участия читателей в обсуждениях. Аудит – та самая вещь, где «одна голова – хорошо, а две – лучше».
К взлету готов!
Позволим себе небольшое лирическое отступление, весьма важное для понимания цели SEO-аудита...
Перед взлетом и посадкой пилоты самолета попунктно проходят «карту контрольной проверки» – check list. Убедиться в технической исправности всех систем и штатном положении всех переключателей, указателей, рукояток и прочих органов управления жизненно необходимо. До начала девяностых годов прошлого века карты контрольной проверки были обычными распечатками, бумажками. Сами понимаете, пилоты были вольны игнорировать их – точнее, проходить по памяти. Но после чудовищной катастрофы рейса 255 авиакомпании Northwest Airlines (16 августа 1987 года в аэропорту Детройта) чеклисты по рекомендации Международной Авиационной Комиссии стали встраивать в компьютерные системы управления. Пилотам стало намного сложнее обойти их сознательно, а ошибка типа «отвлекся и забыл» теперь практически исключена. Что же произошло? Пассажирский лайнер N312RC McDonnell Douglas MD-82 (эта модель до сих пор летает, всего было произведено почти 1200 таких воздушных судов) разбился при попытке взлететь. Несмотря на исправность двигателей, самолет из-за нехватки подъемной силы не смог набрать высоту. Он задел крылом опору линии электропередач, загорелся и рухнул. Погибло 156 человек, включая двух случайных жертв на земле. Чудом выжил единственный пассажир – четырехлетняя девочка (ее родители и шестилетний брат погибли).
Причиной катастрофы стала ошибка пилотов. КВС Джон Маус и второй пилот Дэвид Доддс пропустили один из этапов взлетного чеклиста и не проверили состояние закрылков и предкрылков. Эти элементы механизации крыла предназначены для улучшения несущей способности крыла при полёте на малых скоростях и увеличения допустимого угла атаки. Из-за невнимательности пилотов, находившихся в стрессовой ситуации, крылья рейса 255 не были переведены в нужную (взлетную) конфигурацию: у него не было шанса нормально взлететь.
Разумеется, последствия попытки продвижения сайта, не прошедшего аудит, намного менее мрачны. Но, тем не менее, выполнять чеклист необходимо. SEO-аудит – средство финансовой безопасности. Найдите ошибки в оптимизации, исправьте их, и взлет в ТОП поисковых систем пройдет нормально, в штатном режиме.
Чеклист SEO-аудита
Уникальность контента. Интересно, что эту проверку нужно проводить даже в том случае, если вы знаете, что писали контент самостоятельно. Изначально оригинальные тексты могут быть «утянуты» другими сайтами. При этом, к сожалению, не факт, что поисковая система присвоит вашему сайту статус первоисточника. Методики и инструменты проверки контента на оригинальность, а также способы защиты текста от копирования были приведены в выпуске нашей рассылки №6. Нужно обратить внимание не только на заимствования на чужих сайтах, но и на повторах внутри контента сайта. Желательно, чтобы один и тот же текст не повторялся на сайте несколько раз. Также стоит понимать, что дублирование материалов сайта в блогах, на форумах и в социальных сетях – это все-таки дублирование. Для каждого такого канала стоит писать оригинальные материалы, а не размножать одну и ту же статью или новость без изменений.
Обновление контента. Крайне желательно, чтобы сайт имел хотя бы один регулярно пополняемый раздел (новости, статьи и так далее). Обновление контента – увеличение количества страниц с оригинальными текстами – дает поисковым система понять, что сайт «жив» и развивается. Важно это и с маркетинговой точки зрения: в подавляющем большинстве случаев актуальные новости помогают посетителям сделать выбор в пользу именно этого предложения.
Чистка спама. Если на сайте есть гостевая книга, форум или какие-то средства для комментирования, регулярно проводите чистку спама. Поисковые системы негативно реагируют на замусоренные форумы и гостевые книги.
Битые ссылки. При перемещении документов, удалении страниц или изменении URL через CMS (например, были адреса типа /news, а стали транслитовые /novosti) могут возникнуть «битые ссылки» – причем как внутренние (в контенте сайта), так и внешние (если исчезла или изменила адрес страница, на которую ссылаются другие сайты). Нужно следить за тем, чтобы все ссылки работали и перенаправляли пользователей и роботов поисковых систем на соответствующие страницы, а не на страницу 404. Например, если URL были изменены на SEF (search engines friendly), то при обращении к странице по старому URL должен происходить редирект с кодом 301 на ту же страницу с новым URL.
Теги Title. HTML-тег Title определяет заголовок окна браузера:
У данной страницы этот тег такой: <title>Lib.ru/Классика: Ходасевич Владислав Фелицианович. Некрополь</title>.
Если речь идет об оптимизации страниц под поисковые запросы, необходимо соблюсти следующие правила:
Максимальная, учитываемая Яндексом, длина тега Title – 62 слова.
Начинать тег лучше с основного ключевого слова.
Title виден посетителю сайта в заголовке окна, к тому же он используется поисковой системой при составлении сниппета сайта в результатах поиска (а от привлекательности сниппета зависит кликабельность и, в конечном итоге, посещаемость). Очевидно, что Title должен быть удобочитаемым, а не представлять собой мешанину ключевых слов.
Не используйте в теге Title (и в теге Description) кавычки – это может спровоцировать проблемы с индексацией.
Самое главное правило – уникальность. Теги Title на всех страницах сайта должны быть уникальными. Склейка и выпадение страниц из индекса из-за одинаковых тайтлов – весьма распространенное явление. То же самое, кстати, относится и к метатегам Keywords и Description. Не стоит клонировать их – если на сайте немного страниц, сделать их уникальными легко и вручную, а если страниц тысячи, то это обычно страницы товаров, уникализировать теги и метатеги которых можно автоматически, с помощью CMS.
Оптимизация контента. Основное правило такое: если страница продвигается по какому-либо запросу, прямое вхождение этого запроса (то есть именно в продвигаемой форме) должно быть в тексте страницы. Для низкочастотных запросов достаточно одного вхождения, а для средне- и высокочастотных лучше ориентироваться на цифру, которую показывает Система SeoPult в столбце «Рек.» (рекомендуемое количество) на вкладке «Страницы» проекта. Но его не следует превышать, можно даже сделать меньше вхождений. Вообще следует стремиться к естественности – текст «для людей» лучше воспринимается современными алгоритмами поисковых систем, чем хитрые попытки проспамить контент.
По оптимальному объему текста на продвигаемых страницах скажем так: смотрите на конкурентов, которые уже заняли ТОП.
Желательно «разбавлять» длинные куски текста – делить их заголовками (теги <H1...H6>), вставлять иллюстрации, таблицы и так далее.
Внутренняя перелинковка. Алгоритм Google PageRank и его аналоги в других поисковых системах учитывают не только внешние, но и внутренние ссылки. Подробнее о внутренней перелинковке и о том, чего с ее помощью можно добиться, читайте в рассылке №13.
На этапе перелинковки желательно обратить внимание на то, какие URL используются – относительные или абсолютные. Желательно применение первых (сокращенного вида, типа /news/2011-10-10.html), а не вторых (http://www.yoursite.ru/news/2011-10-10.html).
Проверка количества страниц в индексах «Яндекса» и Google. Соотношение фактического количества страниц сайта (эти данные предоставляются CMS) и количества страниц, попавших в активный индекс поисковой системы, является индикатором проблем с оптимизацией сайта. Если в индексе примерно столько же страниц, сколько открыто для индексации на сайте, все в порядке. Если же многие страницы исключены, стоит обязательно разобраться, почему.
Количество страниц в основном индексе «Яндекса» проверяется с помощью «Яндекс.Вебмастера»: http://webmaster.yandex.ru/check.xml. Розовым прямоугольником выделена искомая цифра.
Индекс Google устроен чуть-чуть сложнее: он делится на основной и дополнительный (Supplemental, «сопли»). Поиск осуществляется по обоим, но страницы из дополнительного индекса заметно менее «авторитетны» и будут показываться только в случае, если поисковый запрос найден только на них.
Чтобы посмотреть общий индекс (основной + дополнительный), необходимо задать запрос вида site:www.yoursite.ru/. При этом после первого результата лучше ткнуть мышкой на вторую или третью страницу, а затем вернуться на первую – тогда цифра станет более точной. Основной индекс показывается по запросу вида site:www.yoursite.ru/*:
Как видно на вышеприведенном примере, основные индексы Google и «Яндекса» для seopult.ru примерно одинаковы – порядка 200 результатов, что примерно соответствует фактическому количеству открытых для индексации страниц сайта. При этом в дополнительных индексах находятся страницы форума. Это вполне нормальная ситуация.
Еще раз перечислим «сигналы опасности»:
в индексе намного меньше страниц, чем открыто для индексации на сайте; один из индексов заметно меньше другого; в индексе больше страниц, чем фактически есть на сайте (следовательно, в нем есть дубли и мусор); в индексе присутствуют нежелательные страницы (например, результаты внутренних поисков и сортировок, страницы логина в систему управления контентом и так далее). Все, что не нужно индексировать, должно быть закрыто с помощью файла robots.txt.
Присутствие аффилиатов. До того, как поисковые системы – и в особенности «Яндекс» – начали эффективно и безжалостно бороться с аффилированными сайтами, они были хорошим подспорьем в борьбе за внимание целевой аудитории. Теперь же наличие дополнительного сайта со схожим контентом, контактными данными и так далее может привести либо к понижению в результатах поиска, либо к склейке – в этом случае по каким-то запросам будет показан только один из связанных сайтов, а второго в выдаче все равно не будет. Итак, дополнительные сайты необходимо закрыть или, по крайней мере, склеить с помощью редиректа с кодом 301 с дополнительного сайта на основной. Но иногда – пусть и достаточно редко – поисковая система помечает как аффилированные независимые сайты. Для проверки на аффилированность можно использовать запрос вида yoursite1.ru | yoursite2.ru. Если сайты не связаны, первым результатом будет страница первого сайта, вторым – второго (или наоборот, но обязательно оба). Если связаны – будут результаты только с одного из сайтов.
Русскоязычные или незначащие URL. Если CMS выдает адреса страниц на русском языке (как в «Википедии», вида http://ru.wikipedia.org/wiki/%D0%A2%D1%80%D1%83%D0%B1%D0%BA%D0%BE%D0%B7%D1%83%D0%B1) или непонятные, вроде /?=18.php, стоит перейти к ЧПУ («человекупонятные URL», SEF URL’s – search engines friendly). Оптимальный вариант для поискового продвижения – транслит с включением ключевых слов, по которым продвигается страница. Его хорошо понимают поисковики: например, страница с URL вида /pylesosy/pylesos-philips-fc-9170.html будет более релевантна запросу «пылесос Philips FC 9170».
Поисковый спам. Тег Keywords не предназначен для включения в него всего семантического ядра сайта на всех страницах. Огромные «простыни» текста с десятками вхождений ключевых слов – устаревший метод продвижения, который теперь приводит к пессимизации сайта. Нельзя размещать скрытый и уменьшенный текст с ключевиками. Эти и все прочие методики поискового спама использовать нельзя! Убедитесь, что ваш сайт не провоцирует поисковые системы на применение санкций.
Следуйте правилам оптимизационной верстки.
Заголовки разных уровней – от <H1> до <H6> – нужно использовать с умом: допускается только один <H1>. Чем логичнее структура заголовков документа, тем лучше он воспринимается поисковой системой.
Keywords – по объему не ограничен, но следует писать в него только слова, по которым продвигается страница, а не все подряд.
Description – краткое описание страницы с включением основного поискового запроса. Должно подходить на роль сниппета, быть привлекательным, информативным и кликабельным.
Ключевые слова можно выделить тегами смыслового акцентирования(<strong>, <b>, <i>).
Картинки и иллюстрации стоит снабжать описаниями с ключевыми словами в тегах Alt и Title – это поможет как увеличить релевантность страницы запросу, так и вывести эти изображения в выдачу поисковых систем (см. выпуск нашей рассылки №26).
Теги должны быть открыты и закрыты корректно.
Присутствие в «Яндекс.Каталоге» и DMOZ. Попытайтесь добавить сайт в эти основные каталоги – это очень полезно для поискового продвижения.
Скорость работы, надежность и настройки сервера. Обратите внимание на все технические параметры, описанные в выпуске нашей рассылки №11.
Отсутствие стороннего контента. Допускается интеграция видеороликов с Youtube и Rutube, но не «хотлинкинг» изображений с других сайтов. Все иллюстрации и, желательно, прочие материалы, нужно разместить на том же домене, что и сайт. Это поднимает вопрос заимствования изображений (поисковые системы в последнее время легко распознают копии) – конечно, всегда лучше использовать оригинальные материалы.
Выводы
Этот лист контрольной проверки позволит избежать самых грубых ошибок и «гирь», мешающих сайту взлететь в ТОП. Конечно, он не полон – поэтому мы приглашаем вас поделиться в комментариях самыми типичными проблемами, которые не попали в вышеприведенный «хит-парад».