Отслеживание ошибок, поисковая оптимизация и анализ сайтов на качество разметки и скорость страниц

в 9:23, , рубрики: iis, seo, Блог компании Microsoft, Веб-разработка, Клиентская оптимизация, поисковая оптимизация, производительность, метки: , , , ,

Легко следить за качеством разметки, поисковой оптимизацией и производительностью на небольшом сайте, где вы точно уверены какой блок разметки каким кодом генерируется. Сложнее становится, когда ваш сайт разрастается и код начинает генерироваться с помощью элементов управления, мастер-страниц, шаблонов, CMS и другими автоматическими способами.

Тут-то и появляется нужда в хорошем автоматическом инструменте, который мог бы пробежаться по всем страницам сайта, обнаружить потенциальные проблемы в коде и верстке, оценить производительность страниц, их насыщенность графическими материалами, ссылками и так далее.

clip_image001
Рис.1. Главное окно SEO Toolkit

В этой статье попробуем провести такой анализ на примере одного из самых известных сайтов рунета artlebedev.ru с помощью бесплатного инструмента Search Engine Optimization Toolkit.

Search Engine Optimization Toolkit

Если мы запустим SEO Toolkit из панели IIS Manager, то увидим следующее окно (рисунок 1) с помощью которого мы сможем получить доступ к разным функциональным частям инструмента: анализу сайта на проблемы, работе с картами сайтов и работе с файлами типа robots.txt.

Самое интересно для нас содержится в анализе сайта на проблемы. Запустить новый анализ можно нажав соответствующую ссылку "Create a new analysis". Появится диалоговое окно, которое позволит нам тонко настроить сайта (рисунок 2). По умолчанию, мы можем задать имя сайта и его адрес и сразу же запустить анализ на выполнение, но интереснее будет настроить некоторые параметры. Для доступа к ним нужно развернуть свернутую панель Advanced Settings.

clip_image002
Рис.2. Настройка анализа сайта

Здесь мы можем указать такие важные параметры как:

  • Максимальное число URL для анализа с сайта, так как крупные сайты могу содержать большое число URL имеет смысл это число ограничить
  • Максимальный размер URL для анализа
  • Игнорировать или нет атрибут nofollow и метатег noindex
  • Сохранять загруженные страницы и контент на диске для быстрого к ним доступа
  • Что считать внутренними ссылками
  • Аутентификацию, если ресурс ее требует

Как видим эти параметры могут сильно повлиять на глубину анализа и число проанализированных страниц необходимого нам сайта. Для нашего анализа установим число URL в 1000.

Анализ сайта

После запуска анализа может пройти некоторое время, пока все необходимые данные будут получены с удаленного ресурса (рисунок 3). Время необходимое на анализ напрямую зависит от параметров, которые вы задали и больше всего от максимального числа загружаемых URL (если, конечно сайт на самом деле содержит столько страниц).

clip_image003
Рис.3. Анализ сайта

Я указал 1000 страниц и анализ не затянулся надолго. После его завершения SEO Toolkit предложит массу отчетов и статистической информации доступной в удобном виде. Давайте посмотрим, что можно из этих отчетов узнать (рисунок 4).

clip_image004
Рис.4. Отчеты по сайту

Итак, наш поверхностный анализ 1000 первых страниц сайта обнаружил около 65000 ссылок на них и чуть более 9000 нарушений правил и следовательно потенциальных проблем.

Тут нужно остановиться и пояснить, что не каждое обнаруженное нарушение может считаться настоящей проблемой, в конце концов сайтartlebedev.ru не первый год функционирует несмотря на все эти нарушения. Однако, нам будет интересно узнать в чем же они заключаются.

Для анализа у нас есть четыре вкладки: Violations (нарушения), Content, Performanceи и Links. Каждый из этих разделов содержит массу полезной информации о анализируемом ресурсе.

Анализ нарушений

Перейдем в первую вкладку Violations, где для нас сразу же будет выведен полный список типов нарушений обнаруженных на страницах сайта (рисунок 5).

clip_image005
Рис. 5. Типы нарушений обнаруженные на страницах

Итак, что же за нарушения мы обнаружили. Остановимся на некоторых и з них, как самых интересных, хотя вы можете вдумчиво исследовать каждое из них и позднее адресовать эти проблемы, что бы избавится от потенциальных проблем.

Страница содержит ненужные редиректы

Если перейти на детали этого нарушения (двойной щелчок), то мы увидим все найденные ресурсы, где как предполагается существует лишний(е) редиректы (рисунок 6).

clip_image006
Рис.6. Отчет о ненужных редиректах

Широко известно, что уменьшение редиректов положительно сказывается на скорости загрузки страницы, однако порой они необходимы. В любом случае, SEO Toolkit позволит вам держать ситуацию под контролем и наблюдать за всеми редиректами, быстро обнаруживая ненужные.

Обратите внимание на окно с отчетом о найденных ошибках. Сверху вы видите полный список всех URL, которые содержат данную проблему. Снизу расположено большое число вкладок, которые позволят вам очень подробно изучить проблему:

Details содержит базовую информацию о странице, где найдена проблема

clip_image007
Рис.7. Вкладка Details

Violation (Нарушение) содержит подробное описание проблемы с краткой информацией о том, почему это важно.

clip_image008
Рис.8. Вкладка Violation

Headers содержит информацию о полученных HTTP-заголовках

clip_image009
Рис.9. Вкладка Headers

Content содержит полный текст полученный в рез ультате запроса к URL. При этом, нарушение, которое мы сейчас изучаем, будет специально выделено, для быстрого поиска.

clip_image010
Рис.10. Вкладка Content

На Word Analisys стоит остановиться подробнее. Эта вкладка содержит информацию о тексте и повторении тех или иных слов на странице сайта. Вы сможете быстро узнать сколько у вас повторений слов, сколько повторений фраз из двух и трех слов. Ну и получить чистый текст страницы очищенный от тегов. Информации много, есть над чем подумать в плане SEO.

clip_image011
Рис.11. Вкладка Word Analysis

Вкладка Links содержит информацию о страницах, которые ссылаются на эту страницу и наоборот, о ссылках на другие страницы, обнаруженные на этой странице.

clip_image012
Рис.12. Вкладка Links

И наконец, вкладка Violations содержит полный список всех нарушений обнаруженных на этой странице. Вы можете перейти к каждой из них и начать анализировать отдельно.

clip_image013
Рис.13. Вкладка Violations

Итак, с помощью изучения нарушения через подробную информацию мы можем найти конкретное место, где это нарушение находится и принять решение следует или нет нам это нарушение о редиректах исправлять.

Обнаружены ошибки в разметке

Наш анализ обнаружил множество страниц с ошибками в разметке. Большей частью это ошибки связанные с тегами, например:

The page at "www.artlebedev.ru/studio/" contains invalid markup.

Tag: 'a' was not opened correctly.

The page at "www.artlebedev.ru/everything/" contains invalid markup.

The Tag 'div' was not closed correctly, the Tag 'body' was closed instead.

The page at "www.artlebedev.ru/everything/kopilkus/" contains invalid markup.

The Tag 'div' was not closed correctly, the Tag 'td' was closed instead.

И так далее. Насколько эти нарушение важны решать только вам. SEO Toolkit просто будет держать вас в курсе.

Страница содержит большой кусок встроенного CSS-кода

Хотя встраивать CSS в разметку допустимо, хорошим тоном является вынесение стилей в отдельный файл. Наш анализ обнаружил несколько страниц с большими кусками CSS-кода встроенного в страницу (рисунок 14).

clip_image014
Рис.14. Информация об ошибке

Перейдя на вкладку Content мы можем посмотреть, что же это за код (рисунок 15).

clip_image015
Рис.15. Контент связанный с ошибкой

Мы рассмотрели некоторые из найденных ошибок и то, как эти ошибки могут анализироваться. Ниже список других ошибок обнаруженных при анализе:

  • Тег img не содержит атрибут alt
  • Метатег description пропущен
  • Страница содержит несколько тегов H1
  • Тег H1 пропущен (но обнаружены теги H2-H6)
  • Заголовок слишком большой
  • Неверные ссылки на странице (возвращают 404 или другие ошибки)
  • Заголовок слишком маленький
  • На странице обнаружено несколько тегов title
  • В теле гиперссылки содержится неверный URL
  • Title пустой
  • При запросе к URL произошла ошибка

Все эти нарушения потенциально могут так или иначе влиять на ваш проект: на поисковую выдачу, на скорость работы сайта, на доступность пользователю. Стоит или нет адресовать эти проблемы решать только вам, важно что вы про них теперь знаете.

Другими полезными вкладками при работе с нарушениями являются:

Pages with Most Violations (страницы с наибольшим числом нарушений)

clip_image016
Рис.16. Most Violations

Категории обнаруженных нарушений

clip_image017
Рис.17. Категории нарушений

Уровни обнаруженных нарушений

clip_image018
Рис.18. Уровни нарушений

Раздел Content

Поработав с результатами анализа сайта на нарушения мы можем получить еще больше аналитической информации в разделе Content. Здесь представлен целый набор разрезов данных для вашей информации:

clip_image019
Рис.19. Разрезы раздела Content

Например, все страницы с ошибочными ссылками:

clip_image020
Рис.20. Все страницы с ошибочными ссылками

Или страницы с одинаковыми заголовками

clip_image021
Рис.21. Страницы с одинаковыми заголовками

По каждому из параметров можно получить подробную информацию.

Вкладка Performance

Очень полезный функционал SEO Toolkit, который позволит вам оценить производительность страниц вашего сайта, время которое потребуется пользователю чтобы загрузить страницу (рисунок 22)

clip_image022
Рис.22. Список наиболее тяжелых страниц

Другая вкладка этого раздела позволит вам увидеть страницы с самым большим числом ресурсов (рисунок 23)

clip_image023
Рис.23. Список страниц с наибольшим числом ресурсов

На каждый элемент списка можно перейти и проанализировать его более подробно. Как мы видим некоторые страницы очень тяжелые и вы можете адресовать эту проблему тем или иным способом, чтобы улучшить впечатление пользователей от вашего ресурса.

Раздел Links

Последний из разделов SEO Toolkit позволяет проанализировать контент сайта со стороны ссылок. Например, увидеть страницы с самым большим числом ссылок (рисунок 24)

clip_image024
Рис.24. Контент связанный с ошибкой

Отчеты и запросы

Последний функционал SEO Toolkit, который я хотел бы рассмотреть — это построение отчетов и запросов к аналитической информации. С помощью специальных инструментов вы можете гибко выбирать именно те данные, которые вам нужны:

clip_image025
Рис.25. Отчеты и запросы

Результаты отчета можно экспортировать во внешний файл или сохранить запрос для повторного исполнения.

Загрузки

После написания статьи понял, что совсем забыл рассказать про то, где и как установить SEO Toolkit.

SEO Toolkit разработан Microsoft для сервера IIS, загрузить этот бесплатный компонент можно по следующей ссылке:

http://www.iis.net/download/SEOToolkit

На этой же странице можно получить больше информации о инструменте.

Заключение

В этой статье я хотел рассказать о некоторых возможностях бесплатного инструмента SEO Toolkit, который позволит вам проанализировать ваши сайты на потенциальные проблемы и получить гору аналитической информации по коду и производительности ваших страниц.

Надеюсь, этот инструмент сослужит вам хорошую службу. Пусть веб будет красивым и быстрым.

Автор: XaocCPS

* - обязательные к заполнению поля


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js