Провести технический аудит сайта самостоятельно — задача не из лёгких, и требует определённой технической подготовки. В этом руководстве мы расскажем, как найти основные проблемы на сайте, не прибегая к услугам специалистам.

Что такое технический аудит?

Под техническим аудитом сайта понимают поиск любых технических проблем, таких как ошибки в исходном коде, проверка скорости работы сайта и т.п. Мы рассмотрим все основные проблемы и способы их найти.

Проблемы перечислены в порядке убывания их значимости.

Поиск страниц-дубликатов

Дубликаты — это неуникальные страницы сайта, содержимое которых одинаково либо различается незначительно. Наличие дубликатов — серьёзная проблема, которая сильно сказывается на скорости индексации страниц и, как следствие, на позициях сайта в поиске.

Причины возникновения дубликатов

Чаще всего дубликаты появляются в результате программных ошибок или недоработок в архитектуре сайта. Многие CMS (системы управления содержимым) генерирует дубликаты, если не выполнить специальную настройку или доработку системы.

Посмотрим на примерах, каким образом появляются неуникальные страницы.

Дубликаты страниц с сортировкой содержимого

  • http://myshop.ru/catalog/goods
  • http://myshop.ru/catalog/goods?sort=price&sort-dir=up
  • http://myshop.ru/catalog/goods?sort=price&sort-dir=down
  • http://myshop.ru/catalog/goods?sort=name&sort-dir=up

Так могут выглядеть адреса одной и той же страницы каталога в интернет-магазине с применением сортировки по цене или названию. Для пользователя — это одна страница с разными типами сортировки одних и тех же данных, а для поисковой системы — это 4 разные страницы. Вот они — дубликаты.

Дубликаты карточек товаров

Другой пример также типичен для магазинов, когда товарная карточка находится сразу в нескольких категориях и доступна по нескольким адресам:

  • http://myshop.ru/category/subcategory/123123
  • http://myshop.ru/category/123123
  • http://myshop.ru/catalog/item/123123

Дубликаты главной страницы

Третий широко распространенный пример дубликатов связан с главной страницей сайта, когда она доступна по нескольким адресам:

  • http://mysite.ru/
  • http://mysite.ru/index.php
  • http://mysite.ru/index.html
  • http://mysite.ru/index

Дубликаты из-за UTM-меток

UTM-метки используются для отслеживания источников переходов на сайт с точностью до баннера или рекламного объявления. Это важнейший инструмент для аналитики, но он провоцирует появление дубликатов:

  • http://mysite.ru/
  • http://mysite.ru/?utm_source=yandex&utm_medium=cpc

Дубликаты из-за зеркал сайта

Для поисковой системы каждый домен и поддомен являются отдельным самостоятельным сайтам, только если иное не задано в настройках сайта (в панели вебмастера Яндекс и Google):

  • http://www.yandex.ru
  • http://yandex.ru

Дубликаты из-за мобильной версии

Когда мобильная версия выполнена в виде отдельного мобильного сайта, появляются дубликаты:

  • http://m.vk.com
  • http://vk.com

Как найти дубликаты на сайте

Ручной поиск неуникальных страниц потребует специальной технической подготовки, т.к. нужно будет самостоятельно исследовать исходный код страниц. Поэтому вы можете специальными сервисами, например: http://saitreport.ru.

Запустите анализ сайта в СайтРепорте (учтите, для проверки всего сайта нужно выбирать платный режим). После подготовки отчёта, в разделе «Контент» вы получите информацию обо всех дубликатах.

В отчёте вы получите таблицу, в которой для каждой страницы сайта выставлена метка: «Полный дубликат», «Почти дубликат», «Уникальный» и др.

Кликните на метку «Полный дубликат», чтобы получить список страниц-дубликатов:

Анализируя адреса неуникальных страниц, можно сделать вывод, какой раздел сайта или модуль создаёт дубликаты.

Как удалить дубликаты

Для исправления проблемы, скорее всего, потребуется вмешательство программиста. Возможных решений несколько:

Проверка скорости загрузки страниц

От скорости загрузки страниц зависит многое: скорость индексации сайта поисковыми роботами, позиции сайта в поиске, на конверсию и удобство использования сайта. Если сайт работает медленно, посетители не будут ждать и уйдут к конкурентам.

Для самостоятельной оценки быстродействия сайта можно использовать несколько бесплатных сервисов: Google PageSpeed Insights и WebPageTest.

Google PageSpeed Insights

Инструмент от компании Google очень прост в применении. Он позволяет оценить скорость загрузки каждой отдельной страницы сайта.

Ссылка на сервис: https://developers.google.com/speed/pagespeed/insights/

Укажите ссылку на страницу и нажмите на кнопку «Анализировать». Вы получите два отчета с оценкой быстродействия на мобильных и дескстопных устройствах.

Как видно на скриншоте, вы получите не только отчёт о проблемах, но и рекомендации по исправлению.

Кратко рассмотрим основные рекомендации:

  • Оптимизируйте изображения — означает, что можно «сжать» картинки, т.е. сократить их размер (в килобайтах) без потери качества. Вы можете сделать это самостоятельно, либо скачать обработанные Google картинки (ниже на скриншоте).


  • Удалите код JavaScript и CSS, блокирующий отображение верхней части страницы — выполнить эту рекомендацию полностью не всегда возможно, корректно это могут только технические специалисты.

  • Сократите время ответа сервера — означает, что работает медленно либо сервер, либо система управления сайтом (CMS). Для исправления также необходимо вмешательство специалиста, возможно, потребуется смена хостинга или переход на более дорогой тариф.

  • Сократите JavaScript, Сократите HTML, Сократите CSS, Включите сжатие — все эти рекомендации сможет применить только специалист.

  • Используйте кеш браузера — сохранение служебных файлов (картинки, стили, скрипты), для настройки можно обратиться либо к собственным специалистам, либо в техподдержку хостинг-провайдера.

WebPageTest

Ссылка на сервис: http://www.webpagetest.org/

Также как и PageSpeed, этот инструмент анализирует скорость каждой страницы в отдельности. Но ключевое отличие WebPageTest — большое количество данных для профессионалов. Не специалисту интерпретировать значительную часть информации будет сложно.

Обратите внимание, что при тестировании желательно выбрать сервер тестирования, ближайший к вашему региону. Для европейской части России — это сервера в Польше. (Перед запуском теста выберите соответствующий сервер в поле Test Location).

Основной показатель, на который можно ориентироваться — это общее время загрузки. В таблице с итогами тестирования будет два значения времени загрузки: First View и Repeat View. При первом просмотре (First View) происходит загрузка всех ресурсов, а при повторных (Repeat View) — не грузятся закешированные элементы.

Нормальное значение First View — не более пяти секунд, а для Repeat View — не более двух.

WebPageTest не даёт рекомендаций, поэтому вы можете его использовать только для самостоятельного замера скорости загрузки страниц.

Проверка кодов ответа сервера

Для понимания важности корректных ответов сервера необходимо немного погрузиться в технические детали.

Каждое обращение клиента (браузера или поискового робота) к сайту называется запросом к серверу. В ответ на запрос сервер присылает необходимую информацию (исходный код веб-страницы, служебные файлы, изображения), а также специальный код ответа (или код состояния).

Код ответа сообщает клиенту, каким образом сервер отреагировал на запрос. Основные коды ответа:

  • 200 — всё в порядке, запрос обработан успешно;
  • 301 — постоянное перенаправление (редирект)
  • 404 — страница не найдена

Поисковый робот, получая коды ответа, принимает решение о том, заносить страницу в поисковую базу или нет. Если код ответа на странице 200, то он индексирует страницу, а если 404 — нет. Соответственно, на любой несуществующей странице сайта код ответа должен быть 404.

Однако в силу ошибок в программном обеспечении это не всегда так. В результате поисковый робот может индексировать несуществующие страницы. Общая скорость индексации снижается, а большое количество однотипных пустых страниц негативно сказывается на позициях сайта.

Чтобы самостоятельно проверить коды ответа, вы можете воспользоваться специальным сервисом: http://pr-cy.ru/headers/.

Сначала проверьте существующие страницы сайта, код ответа на них должен быть 200. Затем попробуйте проверить несуществующую страницу (допишите после доменного имени любой текст), код ответа должен быть 404.

Если вы не получили 404 код, то необходимо обратиться к программистам для исправления проблемы.

«Битыми» называют ссылки на несуществующие страницы. Такие ссылки появляются из-за ошибок при наполнении сайта, удаления страниц или изменения структуры. Они негативно влияют на перелинковку, позиции в поиске и конверсию.

Как найти битые ссылки

Для самостоятельного поиска битых ссылок можно использовать бесплатную программу XENU:

Установите программу, запустите, и для начала анализа нажмите в меню File -> Check URL, укажите ссылку на главную страницу сайта и нажмите кнопку ОК.

Процесс проверки сайта на наличие битых ссылок может занимать до нескольких часов, в зависимости от количества ссылок и страниц на нём. После завершения анализа XENU предложит сформировать отчёт, соглашайтесь.

В следующем окне ничего заполнять не нужно, просто нажмите кнопку «Отмена» и вы получите подробный отчет обо всех найденных битых ссылках.

Как исправить битые ссылки на сайте

Для исправления битых ссылок нужно сначала проанализировать, на какие страницы они ведут. Если это обычные ссылки в текстах страниц, то вы сможете исправить их самостоятельно в панели управления сайтом. В противном случае потребуется вмешательство программиста.

Поиск ошибок в исходном коде страниц

Ошибки в исходном коде (HTML) могут приводить к некорректному отображению страниц на некоторых устройствах, для поисковых роботов это плохой сигнал, который приводит снижению позиций.

Ошибки в HTML обычно возникают по вине разработчиков, которые на этапе разработки сайта недостаточно уделили времени на тестирование и проверку. Однако некоторые нарушения стандартов программисты допускают намеренно, например, для решения проблем совместимости между разными браузерами. Поэтому не все ошибки приводят к негативным последствиям.

Как найти ошибки в коде страницы

Для самостоятельно проверки исходного кода страницы можно воспользоваться специальным бесплатным сервисом: https://validator.w3.org/.

Сервис w3 validator проверяет одну указанную страницу, поэтому для проверки всего сайта его применять неудобно. Вместо этого можно:

  1. Проверить по одной типовой странице сайта: главная, категория каталога, карточка товара, обычная информационная страница. Большинство CMS устроены таким образом, что если проблема присутствует в одной карточке товара (или статьи, или категории и т.д.), то она присутствует и на всех остальных.

  2. Использовать сервис http://sitereport.ru, который выполняет проверку всех страниц на наличие ошибок В отчете об ошибках в коде может быть множество предупреждений, однако не все из них, как мы говорили выше, оказывают негативное влияние.

Перечислим критичные ошибки:

  • Unclosed element
  • Stray end tag
  • End tag seen, but there were open elements
  • Element not allowed as child of element

Как исправить ошибки в коде

Если в HTML-коде страницы присутствуют критичные ошибки, то необходимо обратиться к программистам за их исправлением. Остальные предупреждения валидатора можно проигнорировать.

Резюме

В этой статье мы рассмотрели основные технические проблемы, влияющие как на позиции сайта в поиске, так и на конверсию на нём. Следуя нашим инструкциям, вы сможете выполнить технический анализ сайта. А если не хотите заниматься этим сами — обращайтесь к нам, мы проведём всесторонний аудит вашего сайта.