Сегодня продолжаю цикл статей по теории SEO. В первой статье — «Релевантность: как она рассчитывается поисковыми системами в Интернете» — я рассказал об общих принципах алгоритмов ранжирования в поисковых системах в сети Интернет. Во второй статье — «Что такое "Ссылочное ранжирование"?» — я детально остановился на таком факторе, как ссылочное ранжирование. В третьей статье цикла — «Что такое "Авторитетность страницы"?» — я описал ещё один из факторов, прямо пропорционально влияющих на выдачу, авторитетности страницы. Сегодня я хотел бы поговорить о внутренней оптимизации или о внутренних факторах ранжирования, влияющих на релевантность выдачи.
О внутренних факторах (или внутренней оптимизации) написано немало постов, статей. Много сообщений написано на форумах. Есть пособия по составлению семантического ядра ресурса. Но сегодня я хотел бы остановится на теоретической части, чтобы вы смогли уловить математическую зависимость организации документа и его релевантности определённому запросу.
Алгоритмы поисковых систем — достаточно сложные. Основаны, в первую очередь, на математике. Именно поэтому в данном цикле я публикую математические статьи (чтобы попытаться лучше понять принципы работы поисковых систем в Интернете).
Условная формула расчёта релевантности, описанная в первой статье цикла, имеет вид:
Значение величины — релевантности внутренних факторов ранжирования — определяется как релевантность исходного a кода документа запросу x. Исходный код страницы — это набор команд браузеру, используемых для отображения содержимого страницы, а также текст и метаданные.
Условная формула для расчёта данного показателя может быть записана следующим образом:
где — релевантность j-го фактора внутреннего ранжирования;
— количество словоформ, совпавших с словоформами запроса x в j-м факторе внутреннего ранжирования;
— общее количество словоформ в j-м факторе внутреннего ранжирования;
— весовой коэффициент j-го фактора внутреннего ранжирования;
— множество словоформ, используемых в j-м факторе внутреннего ранжирования;
— количество словоформ, используемых в j-м факторе внутреннего ранжирования;
— общее количество словоформ, используемых в n факторах внутреннего ранжирования;
n — общее количество внутренних факторов ранжирования в коде страницы a.
На значение влияет расположение искомого текста на странице и частота встречаемости слов запроса в рассматриваемом документе. Т. е. доля слов из текста запроса в общем количестве слов документа.
Больший «вес» имеют слова, расположенные ближе к началу документа. Особо ценится точное вхождение текста запроса в текст документа.
Следует отметить, что поиск по стоп-словам (союзы, междометия, предлоги, частицы) не производится, но они учитываются при ранжировании документов, что может серьёзно влиять на результат выдачи.
То же самое можно сказать и о морфологии запроса. ПС отдают предпочтение одинаковой форме слов в тексте запроса и тексте документа. Для «Google» это имело принципиальное значение до тех пор, пока эта ПС не начала поддерживать русскую морфологию.
Другим внутренним фактором ранжирования является частота употребления слов в документе. Не существует определения «идеальной» плотности слов в документе (хотя бы потому, что в каждой ПС она будет своя). Существуют лишь рекомендации о плотности ключевых слов на странице в пределах 3-7%. В теории поисковых систем, это называют семантическим ядром.
К элементам форматирования текста относятся следующие html-теги:
<h1>,…,<h6> — заголовки страниц;
<strong> — акцентирование текста;
<b> — выделение текста жирным;
<i> — курсив.
Служебные теги «keywords» и «description» активно использовались многими поисковыми системами. Но в связи с тем, что их содержимое не видно пользователю на экране браузера, они стали действенным инструментом для обмана поисковых систем, что привело к тому, что, в настоящее время, влияние этих мета-тегов незначительно или отсутствует.
Например, «Google», при ранжировании документов, их игнорируют вообще, но использует содержимое мета-тега «description» при построении сниппетов — фрагментов текста, содержащих слова из запроса, выдаваемых рядом с ссылкой на документ в результатах поиска. На сайте «Яндекса» указано, что он учитывает первые 50 слов из тега «keywords» (при условии, что это слово присутствует в тексте страницы).
Наибольший эффект из страничных факторов даёт применение тега «Title» — заголовка страницы. Причём использовать в нём можно даже слова, которые не содержатся в тексте страницы: это тоже даёт эффект, хотя и меньший, но, в некоторых случаях, это оправдано. К тексту внутри этого тега применимы те же понятия, что и для текста документа вообще: больший «вес» имеют слова, расположенные ближе к началу, очень эффективно точное вхождение искомой фразы.
Судя по информации, представленной на сайтах «Яндекса», эта ПС не учитывает частоту вхождения слов из запроса в этом теге, а только факт их присутствия. Нецелесообразно делать очень длинные словосочетания в теге «Title», так как ПС могут накладывать ограничение на длину индексируемой части этого тега.
Атрибут «Alt» тега «Img» — текстовый комментарий к изображениям. Для «Яндекса» этот атрибут имеет значение только при поиске по картинкам, а при ранжировании документов в основном поиске не используется. «Google» учитывает содержимое этого атрибута только для изображений, являющихся ссылками.
В большинстве случаев, при анализе позиций сайта в выдаче, трудно выделить влияние как внутренних, так и других факторов. Но эффект каждого из факторов нетрудно проследить в крайних ситуациях, когда влияние других факторов крайне мало или отсутствует. Для начала, можно поэкспериментировать с внутренними факторами ранжирования и проследить позиции, чтобы понять, как они влияют на позиции.
Автор: Алексей Терехов.
Ещё с сайта:
- Что такое «Авторитетность страницы»?
- Что такое «Ссылочное ранжирование»?
- Что значит «релевантность» (запроса, страницы, документа)?
- Секрет ссылочного обмена, или Почему обмен ссылками для продвижения держит сайты в ТОПе
- Конференция «Optimization». Будущее SEO: застой или эволюция?
Комментарии:
07.04.2009, 10:15 — kotik
Как всегда интересно. Всё забываю спросить — формулы на основе собственных исследований?
07.04.2009, 10:25 — Terehoff
kotik — часть формул взято из источников, часть собственные наработки. Спасибо за комментарий
07.04.2009, 10:49 — kotik
Да всегда пожалуйста! интересные цифры, многое объясняют
07.04.2009, 11:59 — Bink
Статья конечно интересная, только вот не пойму, что за картинка такая к посту, и что означает?
07.04.2009, 13:16 — BB
В целом понятно — значение Ta(x) это средневзвешенное значение отдельных факторов релевантности.А как быть с остальными слагаемыми и весовыми коэффициентами при них. И еще множитель F(PRa)? А то пока по этой методике ничего не посчитается((
07.04.2009, 14:06 — Terehoff
Bink — при поиске картинки к посту хотелось найти что-то «внутреннее». Как мне показалось, картинка это отражает.
BB — в каждой статье цикла теории SEO я подробно раскрываю каждый элемент. Остались еще собственные факторы поисковых систем. Статья будет опубликована на следующей неделе. F(PRa) — описано в https://www.seoded.ru/webmaster/terehoff/relevance-as-defined-by-searchengines.html
По поводу весовых коэффициентов — у меня есть пару мыслей как их рассчитывать, опубликую позже. Я ответил на ваш вопрос?
07.04.2009, 14:41 — BB
Да, спасибо! Как человек, в вое время не очень далекий от научной деятельности, хотел бы порекомендовать довести этот теоретически материал до некоего алгоритма, с указанием структуры и состава необходимых исходных данных. Тогда все это дело можно будет запрогать — и получить инструмент, применяемый, например:
а) для оценки качества оптимизации сайта
б) для оценки требуемых ресурсов на продвижение сайта
в) для сбора исходных данных и построения адекватной модели ПС
07.04.2009, 14:59 — Terehoff
BB — спасибо, собственно этим сейчас и занимаюсь. Комплексная статья скоро будет в Москве опубликована и выводы в ней приведены такие же, что и вы написали. Спасибо за комментарий
07.04.2009, 15:58 — Kareg
Картинка напугала -)
В целом статья — достойное продолжение твоего цикла, интересно читать такое «Научное Seo»
07.04.2009, 16:53 — Terehoff
Kareg — картинка отображает именно внутренности, внутренние факторы — они внутри
07.04.2009, 19:49 — Светлана
Офигенно пугающие внутренности.Сами фотомонтаж делали? Первая мысль была — что это внутренности акулы с несколькими слоями зубов.
07.04.2009, 20:16 — Terehoff
Светлана — у русских блоггеров-мужчин первое впечатление было немного другое! Но ход ваших мыслей мне нравится
07.04.2009, 22:52 — AlexVolkov
>>Служебные теги keywords и description активно использовались многими поисковыми системами.
Когда то давно был еще один мета-тег, говорил боту через сколько дней зайти ) Revisit-after чтоли звался.
Лех, картинка нифига не ассоциируется с внутренними факторами ранжирования, это какой-то женский репродуктивный орган в раскрытом состоянии ))
08.04.2009, 06:56 — Terehoff
AlexVolkov — да пусть и женский, главное что виден путь внутрь, к внутренним факторам
09.04.2009, 22:28 — Креатив
С формулами конечно интересно и весомо рассуждать о релевантности страницы, но не понятно для кого статья? Если для новичка оптимизатора, то ему нужны примеры на пальцах или это желание отпугнуть? Если для разработчиков поисковых систем, то им и без этой инфы хорошо. Ни один оптимизатор не будет по подобным формулам рассчитывать ни текст ни ссылочное своей страницы. Если к примеру они лягут в основу автоматической проверке и генерации нужных текстов, то получиться очередной дорогенератор. Может конечно я и не прав.
18.08.2009, 20:56 — roma
про внутрессылочное ранжирование на сайте и не упоминали, хотя оно очень важно.
19.08.2009, 09:42 — Terehoff
roma, это есть грамотная перелинковка. Спасибо за идею, как-нибудь созрею и напишу пост
15.11.2009, 21:53 — съёмка свадебного клипа
Спасибо! Очень интересная статья, только некоторые моменты непонятны =) :
— «Больший вес имеют слова, расположенные ближе к началу документа» — То есть, ключевые слова надо располагать в начале предложения. абзаца? с чем это связано?
-«Существуют лишь рекомендации о плотности ключевых слов на странице в пределах 3-7%» — интересно, откуда такие цифры? Что будет если плотность ключевых слов будет 10-15%? или 1%? «Судя по информации представленной на сайтах Яндекса, эта ПС не учитывает частоту вхождения слов из запроса в этом теге, а только факт их присутствия» — ???
15.11.2009, 22:41 — съемка свадьбы
Спасибо! Очень интересная статья, только некоторые моменты непонятны =) :
— «Больший вес имеют слова, расположенные ближе к началу документа» — То есть, ключевые слова надо располагать в начале предложения. абзаца? с чем это связано?
-«Существуют лишь рекомендации о плотности ключевых слов на странице в пределах 3-7%» — интересно, откуда такие цифры? Что будет если плотность ключевых слов будет 10-15%? или 1%?
30.11.2009, 13:33 — lucki Шаблоны для всех
Статья мне понравилась, убили только формулы. Давно с ними не встречался. Интересно можно их как нибудь в программу вбить, чтоб не париться. Картинка супер, ушел курить. )))
27.12.2009, 10:56 — Папараць-кветка
=На сайте Яндекса указано, что он учитывает первые 50 слов из тега keywords при условии, что это слово присутствует в тексте страницы.= Что-то не видел такого.
20.01.2010, 11:16 — Роман
Спасибо за статью. Внутренняя оптимизация это основа. С нее нужно начинать.
19.03.2010, 23:11 — fashion junkie
Спасибо за инфу. В выходные займусь оптимизацией блога.
18.05.2010, 13:36 — Agata
Я тот самый «чайник». Прочитываю Ваш блог и учусь уму разуму. У мня вопрос. Вот яндекс индексирует мои картинки, а гугл только на первой страничке…мой же блог в картинками на том же хочте и с тем же доменным именем. Никак не пойму как добиться индексации картинок у гугла. Не подскажите?
21.05.2010, 11:55 — Бесплатные методы продвижения блогов в примерах от Терехова « Нотатки стартующего блогера
[…] внешними ссылками, и много других факторов. Подробнее про внутреннюю оптимизацию, про подпитку внешними ссылками, про релевантность и […]
15.06.2010, 14:45 — Начало продвижения с rookee | Блог Терехова
[…] Одно большое но, прежде чем продвигать страницы с постами, проверьте наличие внутренней оптимизации. Наличие тего h1 и h2, релевантных keywords, description, наличие текстового контента – всего того, что должно быть приятно видеть поисковым системам. Подробнее про внутреннюю оптимизацию почитайте в моей статье – внутренние факторы ранжирования. […]
02.08.2010, 10:03 — Пишем пост под запрос для продвижения в ROOKEE | Блог Терехова
[…] сайт, расчет релевантности поисковыми системами, внутренние факторы ранжирования. Я думаю, эти посты вам пригодятся в целом для […]
23.08.2010, 18:13 — Дима Швец
Это что внутри какой-то акулы? наверно рыбина какая от
06.09.2010, 21:45 — yorkie_LuxMea
Спасибо за статью. Подскажите как можно разместить постовой на вашем блоге,
08.09.2010, 12:49 — Что делать, есть сайт не выходит в топ | Блог Терехова
[…] частые ошибки, совершаемые вебмастерами при оптимизации страниц – это переоптимизация/недооптимизация контента или […]
07.12.2010, 16:01 — Роман
Так на картинке то что, влагалище да?
12.05.2012, 20:19 — Effect
Больше похоже на пасть акулы
13.01.2013, 13:35 — Максим
В Google теперь еще одним важным фактором при ранжирование будет авторство статьи и AuthorRank — авторитет автора. Так что авторство при помощи Google+ стоит закреплять