Техническая оптимизация сайта
Техническая оптимизация подразумевает исправление ошибок и улучшение работы сайта и сервера. Начнём по порядку.
Главное зеркало сайта
Для поисковой системы (далее ПС) адреса http://www.site.ru и http://site.ru– два разных сайта.
Для того чтобы ПС считала их одним нужно сделать склейку домена. Делается это при помощи файла .htaccess, он находиться в корневой папке вашего сайта.
По умолчанию в CMS (например, в Joomla) он имеет название htaccess.txt, его нужно переименовать в .htaccess (точка впереди) и в настройках системы управления включить mod_rewrite или «Перенаправление».
Для главного зеркала без www код будет таким:
RewriteEngine On
RewriteCond %{HTTP_HOST} ^www.site\.ru$ [NC] RewriteRule ^(.*)$ http://site.ru/$1 [R=301,L] Site.ru замените своим доменом.
Теперь если набрать в строке www.site.ru, то будет перенаправление на site.ru.
И если хотите сделать, наоборот, с site.ru на www.site.ru код будет таким:
RewriteEngine On
RewriteCond %{HTTP_HOST} ^ site\.ru$ [NC] RewriteRule ^(.*)$ http://www.site.ru/$1 [R=301,L]
Это называется 301 редирект – документ перемещён навсегда.
Очень важно, чтобы был именно 301 редирект, есть ещё 302 и 303 – они означают «временное перемещение» и «смотри другой документ» – нам это не «на руку».
Ошибки на сайте
Очень неприятная вещь, из-за этого сайт может быть «пессимизирован», то есть, понижен в результатах выдачи, до очень неприличных мест.
Самая страшная ошибка – это 500. Internal Server Error.
Ошибка на сервере, ваш сайт недоступен.
Если робот поисковой системы будет часто получать эту ошибку то, скорее всего ваш сайт (большинство его страниц) вообще вылетит из поисковой выдачи.
Из-за чего возникает эта ошибка?
В основном из-за ненадёжности хостинга. Бесплатные хостинги сразу выбрасываем на помойку и здесь не рассматриваем. Возможно, ваш сайт создаёт большую нагрузку на сервер и он просто «завис». Так же это могут быть какие-то ошибки в работе сайта, которые приводят к сбою сервера.
Поэтому советую вам выбирать надёжных хостинг провайдеров. Я лично пользуюсь хостингом от Goodnet. За всё время использования не было каких либо нареканий, конечно мелкие «неровности» бывают у всех, но в Goodnet их не много.
Иногда, при обращении к несуществующей странице, некоторые компоненты отдают ошибку 500, вместо ошибки 404 – это очень плохо. Решается по-разному – в зависимости от CMS.
Посмотреть код ответа сервера можно в сервисе http://be1.ru/stat/
Работающая страница должна отдавать код HTTP 200. Ок.
Ошибка 404. Компонент не найден.
Хороших ошибок не бывает J, и эта ошибка тоже. Но её код должен отдаваться вашим сервером, при обращении к несуществующему документу. Например, если вы удалили какую-то статью или страницу. В этом случае поисковая система просто удалит её из своего индекса.
Хуже когда на вашем сайте остаётся ссылка на эту несуществующую страницу, и при каждом проходе «паука» он видит ссылку на страницу, а саму страницу нет. Для этого нужно регулярно проводить проверку сайта на битые ссылки. В этом хорошо помогает программа Xenu.
Просто запускаете её, вводите название сайта и нажимаете Пуск. Через несколько минут проверка закончится, и вы сможете посмотреть отчёт.
Дубли страниц
Очень распространённая проблема, так как различные CMS плодят эти дубли и «днём и ночью».
Для того чтобы поисковые системы «лучше видели» ваш сайт, рекомендуется использовать SEF ссылки (ЧПУ – человеко-понятные-урл). То есть ссылка на страницу будет иметь вид НЕ:
http://site.ru/index.php?option=com_juser&view=user&layout=register&Itemid=66
а нормальную: http://site.ru/razdel/moya-stranica
В частности, Joomla имеет встроенный компонент SEF, включается в общих настройках.
Есть сторонние компоненты, типа ArtioSEF, JoomSEF и т.д. Но в большинстве случаев встроенный SEF отлично справляется со своей работой.
Но не всегда следует полностью полагаться на работу таких компонентов, нужно подстраховываться.
Частенько CMS может выдавать одну и ту же страницу с разными URL (адресами). Например, версию для печати, PDF версию и т.д. Всё это будет считаться дублями.
Большую часть дублей можно закрыть от индексации файлом robots.txt, который также находиться в корне сайта.
Он предназначен для указания инструкций роботам поисковых систем.
В конце книги я привёл пример этого файла.
Можете пользоваться на здоровье, только замените site.ru на имя своего сайта.
Неполные дубли страниц.
Поисковая система может посчитать за дубли сквозные блоки на сайте, например блок с контактной информацией. Если он показывается на всех страницах сайта, то теоретически это тоже дублирование контента.
В таком случае для Яндекса может спасти тег <noindex>…</noindex>, Google не воспринимает этот тег.
Такие блоки лучше убирать и выводить на одной единственной странице. Также не полными дублями могут быть результаты поиска, сортировка материалов и другие системные страницы. Их также желательно закрыть от индексации в robots.txt, хотя бы, потому что эти страницы не нужны для продвижения, а значит, не нужно тратить время роботов на ненужную индексацию. Ведь робот за один раз индексирует ваш сайт не полностью, а только некоторую его часть. Остальное он проиндексирует позднее, возможно через несколько дней или недель. Закрывая ненужную информация от индексации, мы позволяем роботу быстрее индексировать сайт.
Пересечение тегов ссылки с другими тегами.
Это когда тег <a> пересекается с тегами h1, h2, h3, strong, em.
Часто это можно заметить в заголовках статьи. Когда заголовок выводиться в теге h1 или h2 и плюс к этому является ссылкой.
Этот фактор также влияет на поисковую оптимизацию. За это страница может быть пессимизирована.
Решается проблема в настройках вывода статьи или в настройках меню. Параметр «Заголовок как ссылка» ставиться в значение Нет.
Карта сайта
Всегда делайте карту сайта, она помогает поисковым системам быстрее индексировать ваш сайт.
Для создания карты сайта есть множество компонентов и сервисов. Можно создать её как в ручную, для сайтов на HTML, так и автоматически для CMS.
Хороший компонент для CMS Joomla – Xmap.
После создания карты сайта, добавьте ссылку на неё в Яндекс.Вебмастер и Google.Webmaster.
Желательно, чтобы карта сайта была в формате xml – в настройках это есть.
CSS стили и JavaScript отдельно.
CSS стили и яваскрипты нужно выносить в отдельные файлы. В большинстве случаев в современных шаблонах так и сделано, но бывают исключения – проверяйте.
Комментариев пока нет, будьте первым!