Легко следить за качеством разметки, поисковой оптимизацией и производительностью на небольшом сайте, где вы точно уверены какой блок разметки каким кодом генерируется. Сложнее становится, когда ваш сайт разрастается и код начинает генерироваться с помощью элементов управления, мастер-страниц, шаблонов, CMS и другими автоматическими способами.
Тут-то и появляется нужда в хорошем автоматическом инструменте, который мог бы пробежаться по всем страницам сайта, обнаружить потенциальные проблемы в коде и верстке, оценить производительность страниц, их насыщенность графическими материалами, ссылками и так далее.
Рис.1. Главное окно SEO Toolkit
В этой статье попробуем провести такой анализ на примере одного из самых известных сайтов рунета artlebedev.ru с помощью бесплатного инструмента Search Engine Optimization Toolkit.
Search Engine Optimization Toolkit
Если мы запустим SEO Toolkit из панели IIS Manager, то увидим следующее окно (рисунок 1) с помощью которого мы сможем получить доступ к разным функциональным частям инструмента: анализу сайта на проблемы, работе с картами сайтов и работе с файлами типа robots.txt.
Самое интересно для нас содержится в анализе сайта на проблемы. Запустить новый анализ можно нажав соответствующую ссылку "Create a new analysis". Появится диалоговое окно, которое позволит нам тонко настроить сайта (рисунок 2). По умолчанию, мы можем задать имя сайта и его адрес и сразу же запустить анализ на выполнение, но интереснее будет настроить некоторые параметры. Для доступа к ним нужно развернуть свернутую панель Advanced Settings.
Рис.2. Настройка анализа сайта
Здесь мы можем указать такие важные параметры как:
- Максимальное число URL для анализа с сайта, так как крупные сайты могу содержать большое число URL имеет смысл это число ограничить
- Максимальный размер URL для анализа
- Игнорировать или нет атрибут nofollow и метатег noindex
- Сохранять загруженные страницы и контент на диске для быстрого к ним доступа
- Что считать внутренними ссылками
- Аутентификацию, если ресурс ее требует
Как видим эти параметры могут сильно повлиять на глубину анализа и число проанализированных страниц необходимого нам сайта. Для нашего анализа установим число URL в 1000.
Анализ сайта
После запуска анализа может пройти некоторое время, пока все необходимые данные будут получены с удаленного ресурса (рисунок 3). Время необходимое на анализ напрямую зависит от параметров, которые вы задали и больше всего от максимального числа загружаемых URL (если, конечно сайт на самом деле содержит столько страниц).
Рис.3. Анализ сайта
Я указал 1000 страниц и анализ не затянулся надолго. После его завершения SEO Toolkit предложит массу отчетов и статистической информации доступной в удобном виде. Давайте посмотрим, что можно из этих отчетов узнать (рисунок 4).
Рис.4. Отчеты по сайту
Итак, наш поверхностный анализ 1000 первых страниц сайта обнаружил около 65000 ссылок на них и чуть более 9000 нарушений правил и следовательно потенциальных проблем.
Тут нужно остановиться и пояснить, что не каждое обнаруженное нарушение может считаться настоящей проблемой, в конце концов сайтartlebedev.ru не первый год функционирует несмотря на все эти нарушения. Однако, нам будет интересно узнать в чем же они заключаются.
Для анализа у нас есть четыре вкладки: Violations (нарушения), Content, Performanceи и Links. Каждый из этих разделов содержит массу полезной информации о анализируемом ресурсе.
Анализ нарушений
Перейдем в первую вкладку Violations, где для нас сразу же будет выведен полный список типов нарушений обнаруженных на страницах сайта (рисунок 5).
Рис. 5. Типы нарушений обнаруженные на страницах
Итак, что же за нарушения мы обнаружили. Остановимся на некоторых и з них, как самых интересных, хотя вы можете вдумчиво исследовать каждое из них и позднее адресовать эти проблемы, что бы избавится от потенциальных проблем.
Страница содержит ненужные редиректы
Если перейти на детали этого нарушения (двойной щелчок), то мы увидим все найденные ресурсы, где как предполагается существует лишний(е) редиректы (рисунок 6).
Рис.6. Отчет о ненужных редиректах
Широко известно, что уменьшение редиректов положительно сказывается на скорости загрузки страницы, однако порой они необходимы. В любом случае, SEO Toolkit позволит вам держать ситуацию под контролем и наблюдать за всеми редиректами, быстро обнаруживая ненужные.
Обратите внимание на окно с отчетом о найденных ошибках. Сверху вы видите полный список всех URL, которые содержат данную проблему. Снизу расположено большое число вкладок, которые позволят вам очень подробно изучить проблему:
Details содержит базовую информацию о странице, где найдена проблема
Рис.7. Вкладка Details
Violation (Нарушение) содержит подробное описание проблемы с краткой информацией о том, почему это важно.
Рис.8. Вкладка Violation
Headers содержит информацию о полученных HTTP-заголовках
Рис.9. Вкладка Headers
Content содержит полный текст полученный в рез ультате запроса к URL. При этом, нарушение, которое мы сейчас изучаем, будет специально выделено, для быстрого поиска.
Рис.10. Вкладка Content
На Word Analisys стоит остановиться подробнее. Эта вкладка содержит информацию о тексте и повторении тех или иных слов на странице сайта. Вы сможете быстро узнать сколько у вас повторений слов, сколько повторений фраз из двух и трех слов. Ну и получить чистый текст страницы очищенный от тегов. Информации много, есть над чем подумать в плане SEO.
Рис.11. Вкладка Word Analysis
Вкладка Links содержит информацию о страницах, которые ссылаются на эту страницу и наоборот, о ссылках на другие страницы, обнаруженные на этой странице.
Рис.12. Вкладка Links
И наконец, вкладка Violations содержит полный список всех нарушений обнаруженных на этой странице. Вы можете перейти к каждой из них и начать анализировать отдельно.
Рис.13. Вкладка Violations
Итак, с помощью изучения нарушения через подробную информацию мы можем найти конкретное место, где это нарушение находится и принять решение следует или нет нам это нарушение о редиректах исправлять.
Обнаружены ошибки в разметке
Наш анализ обнаружил множество страниц с ошибками в разметке. Большей частью это ошибки связанные с тегами, например:
The page at "www.artlebedev.ru/studio/" contains invalid markup.
Tag: 'a' was not opened correctly.
The page at "www.artlebedev.ru/everything/" contains invalid markup.
The Tag 'div' was not closed correctly, the Tag 'body' was closed instead.
The page at "www.artlebedev.ru/everything/kopilkus/" contains invalid markup.
The Tag 'div' was not closed correctly, the Tag 'td' was closed instead.
И так далее. Насколько эти нарушение важны решать только вам. SEO Toolkit просто будет держать вас в курсе.
Страница содержит большой кусок встроенного CSS-кода
Хотя встраивать CSS в разметку допустимо, хорошим тоном является вынесение стилей в отдельный файл. Наш анализ обнаружил несколько страниц с большими кусками CSS-кода встроенного в страницу (рисунок 14).
Рис.14. Информация об ошибке
Перейдя на вкладку Content мы можем посмотреть, что же это за код (рисунок 15).
Рис.15. Контент связанный с ошибкой
Мы рассмотрели некоторые из найденных ошибок и то, как эти ошибки могут анализироваться. Ниже список других ошибок обнаруженных при анализе:
- Тег img не содержит атрибут alt
- Метатег description пропущен
- Страница содержит несколько тегов H1
- Тег H1 пропущен (но обнаружены теги H2-H6)
- Заголовок слишком большой
- Неверные ссылки на странице (возвращают 404 или другие ошибки)
- Заголовок слишком маленький
- На странице обнаружено несколько тегов title
- В теле гиперссылки содержится неверный URL
- Title пустой
- При запросе к URL произошла ошибка
Все эти нарушения потенциально могут так или иначе влиять на ваш проект: на поисковую выдачу, на скорость работы сайта, на доступность пользователю. Стоит или нет адресовать эти проблемы решать только вам, важно что вы про них теперь знаете.
Другими полезными вкладками при работе с нарушениями являются:
Pages with Most Violations (страницы с наибольшим числом нарушений)
Рис.16. Most Violations
Категории обнаруженных нарушений
Рис.17. Категории нарушений
Уровни обнаруженных нарушений
Рис.18. Уровни нарушений
Раздел Content
Поработав с результатами анализа сайта на нарушения мы можем получить еще больше аналитической информации в разделе Content. Здесь представлен целый набор разрезов данных для вашей информации:
Рис.19. Разрезы раздела Content
Например, все страницы с ошибочными ссылками:
Рис.20. Все страницы с ошибочными ссылками
Или страницы с одинаковыми заголовками
Рис.21. Страницы с одинаковыми заголовками
По каждому из параметров можно получить подробную информацию.
Вкладка Performance
Очень полезный функционал SEO Toolkit, который позволит вам оценить производительность страниц вашего сайта, время которое потребуется пользователю чтобы загрузить страницу (рисунок 22)
Рис.22. Список наиболее тяжелых страниц
Другая вкладка этого раздела позволит вам увидеть страницы с самым большим числом ресурсов (рисунок 23)
Рис.23. Список страниц с наибольшим числом ресурсов
На каждый элемент списка можно перейти и проанализировать его более подробно. Как мы видим некоторые страницы очень тяжелые и вы можете адресовать эту проблему тем или иным способом, чтобы улучшить впечатление пользователей от вашего ресурса.
Раздел Links
Последний из разделов SEO Toolkit позволяет проанализировать контент сайта со стороны ссылок. Например, увидеть страницы с самым большим числом ссылок (рисунок 24)
Рис.24. Контент связанный с ошибкой
Отчеты и запросы
Последний функционал SEO Toolkit, который я хотел бы рассмотреть — это построение отчетов и запросов к аналитической информации. С помощью специальных инструментов вы можете гибко выбирать именно те данные, которые вам нужны:
Рис.25. Отчеты и запросы
Результаты отчета можно экспортировать во внешний файл или сохранить запрос для повторного исполнения.
Загрузки
После написания статьи понял, что совсем забыл рассказать про то, где и как установить SEO Toolkit.
SEO Toolkit разработан Microsoft для сервера IIS, загрузить этот бесплатный компонент можно по следующей ссылке:
http://www.iis.net/download/SEOToolkit
На этой же странице можно получить больше информации о инструменте.
Заключение
В этой статье я хотел рассказать о некоторых возможностях бесплатного инструмента SEO Toolkit, который позволит вам проанализировать ваши сайты на потенциальные проблемы и получить гору аналитической информации по коду и производительности ваших страниц.
Надеюсь, этот инструмент сослужит вам хорошую службу. Пусть веб будет красивым и быстрым.
Автор: XaocCPS