Сегодня продолжаю цикл теоретических статей об алгоритмах ранжирования поисковых систем в сети Интернет. Можете прочитать первую статью «Что значит "релевантность" (запроса, страницы, документа)?», а также вторую статью про cсылочное ранжирование. Сегодня хотел бы остановиться на таком факторе, как авторитетность страницы. Он влияет на расчёт итогового значение релевантности документа в выдаче поисковых систем.
(2) — формула из статьи про релевантность и как она рассчитывается поисковыми системами в сети Интернет.
Из этой формулы видно, что показатель является не аддитивным (накапливающимся посредством суммирования), а мультипликативным (корректирует итоговое значение посредством умножения, что означает значительное влияние на итоговую релевантность).
Показатель авторитетности страницы относится к статическим факторам ранжирования, которые не зависят от текста запроса. Он отражает влияние авторитетности страниц с внешними ссылками на документ а. Условная формула расчёта показателя авторитетности может быть записана следующим образом [2]:
, (5)
где — авторитетность страницы (так называемый PageRank рассматриваемой страницы);
d — коэффициент затухания (вероятность того, что пришедший на страницу пользователь перейдёт по одной из ссылок на данной странице, а не прекратит путешествие по Сети), обычно устанавливается равным 0,85;
— авторитетность (PageRank) i-й страницы, ссылающейся на страницу а;
— общее количество ссылок на i-й странице;
n — количество страниц, ссылающихся на документ а (пример расчёта).
Из формулы видно, что минимальный страницы составляет 0,15. Таким образом поисковые системы предоставляют возможность всем проиндексированным страницам участвовать в выдаче.
В конкретных поисковых системах, формулы для расчёта могут существенно отличаться от (5).
В «Яндексе» аналогичная PageRank величина, обозначающая количественное представление «авторитетности» страницы и называемая «взвешенный индекс цитирования» — ВИЦ. ВИЦ высчитывается на основе классического алгоритма PageRank «с точностью до деталей реализации».
До осени 2002 года, ВИЦ можно было посмотреть с помощью «Яндекс.Бара» — специальной панели инструментов. В ней отражался ВИЦ главной страницы с точностью до сотых. Теперь в этом индикаторе отображается значение другого показателя, использующегося для ранжирования ресурсов в каталоге «Яндекса», и узнать значение ВИЦ не представляется возможным.
И ещё: PR «Гугла» и ВИЦ «Яндекса» — статические факторы ранжирования, не зависящие от текста запроса.
Автор: Алексей Терехов.
Ещё по теме:
- Что такое «Ссылочное ранжирование»?
- Что значит «релевантность» (запроса, страницы, документа)?
- Секрет ссылочного обмена, или Почему обмен ссылками для продвижения держит сайты в ТОПе
- Конференция «Optimization». Будущее SEO: застой или эволюция?
- «Яндекс» и покупные ссылки
Комментарии:
01.04.2009, 14:42 — bistrosite
Тут проделана сложная работа. Не статья, а целая дипломная. А можно для чайников по проще?
01.04.2009, 15:08 — Terehoff
bistrosite — хорошо, в одной из следующих публикаций обязательно напишу более простым языком, для «чайников». Спасибо за полезный комментарий.
01.04.2009, 16:21 — Raxxell
Да, да, я тоже ничего не понял. А сообщите да, когда появится тоже самое, но для «чайников»?
01.04.2009, 18:33 — Kareg
Продолжаешь радовать умными статьями -)
01.04.2009, 20:13 — Terehoff
Raxxell — подписывайся на мой блог через RSS и не пропустишь. Ориентировочно на следующей неделе начну републикацию статей по теории SEO для «чайников». Рад что вам это интересно
01.04.2009, 22:06 — Бомж Без Колес
Фотка не с нашествия случайно, а?….
Когда сделаешь каменты черным по белому, а?
01.04.2009, 22:56 — Terehoff
Бомж Без Колес — фотка скорее всего с нашествия, нашел ее в интернете. Дядька очень похож на Кипелова. А каменты мне и такие нравятся
01.04.2009, 23:22 — Бомж Без Колес
Нее.. это не Кипелов
01.04.2009, 23:25 — Terehoff
Бомж Без Колес — пока мы с тобой тут флудим, пошел АП ПР. Еще скачет, к утру устаканится. У меня авторитетность поперла вверх!!! С АП ПР тя собственно так же поздравляю
02.04.2009, 00:58 — Kareg
Это не Кипелов! Это насколько я вижу Кинчев -)
Поздравляю с апом PR тебе похоже троечку выдадут, а мне вроде двоечку -) Правда пока трясет
02.04.2009, 12:32 — Terehoff
Kareg — спасибо.
03.04.2009, 22:45 — aekros
Тема более чем раскрыта. =)
04.04.2009, 12:19 — Пузат
Спасибо за формулы
29.04.2009, 13:55 — Arhey
Прямо таки высшая математика, без бутылки не разобраться. А фотка солиста гр.Алиса — Кинчев
27.06.2009, 15:38 — Roman
Формулы красивые, но возникает такой вопрос. Если минимальный PR = 0.15 ,а перевод в тулбарный PR (0,00000001 — 5) -> 1 . Откуда берутся страницы с PR=0 ???
27.06.2009, 21:39 — Roman
И все же откуда берутся страницы с PR = 0 ? Мне действительно интересно
28.06.2009, 00:12 — Terehoff
Роман, тулбарный ПР равный нулю — есть округленное значение, близкое к нулю. Как показывает формула, каждая новая страницы имеет право «голосовать» за других и передавая им свою авторитетность, но «тулбарный» пр и пр «нетулбарный» у них соответственно различаются, «нетулбарный» не равен нулю, «тулбарный» округлен до нуля
30.06.2009, 15:53 — Roman
Меня смутил интервал (0,00000001 — 5) -> 1
Выходит более правильно
(0,00000001 — 0,5) -> 0
(0,5 — 5) -> 1
и если это правильно, то 4 одиночных ссылки со станиц с PR=0 дают PR = 4*0.15 = 0.6 который округляется до тулбарного PR=1 . Интересно насколько я прав ?
30.06.2009, 16:21 — Terehoff
Roman — тулбарный ПР рассчитывается как десятичный логарифм от значения, рассчитанного по приведенной формуле. Подробности https://devaka.info/articles/pagerank-without-backlinks
30.06.2009, 16:58 — Roman
Я наверное надоел. С учетом логарифма арифметика получается такая 22 ссылки по 0,15 получаем 3,3 . Берем log(3.3)=0.518 должно округлятся до TBPR = 1 . Интересно, кто нибудь проверял ?
30.06.2009, 17:04 — Roman
Вдогонку log(211*0.15)=log(31.65)=1.50037 округляется до TBPR=2
30.06.2009, 22:32 — Terehoff
Roman это теория, есть еще и практика, в которой наглядно демонстрируется, что Google может не учитывать те или иные ссылки с тех или иных страниц, а так же различные фильтры. В теории ты совершенно прав (это идеальный случай), на практике идеал недостижим, можно у нему только приблизиться! Спасибо за настойчивость
03.08.2009, 15:44 — vg
> Условная формула расчета показателя авторитетности может быть записана следующим образом [2]:
а где список литературы? что за 2???
04.08.2009, 07:49 — Terehoff
vg, там же написано, формула два из статьи https://www.seoded.ru/webmaster/terehoff/relevance-as-defined-by-searchengines.html
24.08.2009, 20:22 — магарыч
Roman,
>>… арифметика получается такая 22 ссылки по 0,15 получаем 3,3
Авторитетность страницы НЕ УМНОЖАЕТСЯ на количество ссылок с нее, а ДЕЛИТСЯ между всеми ссылками.
Т.е. общий вес, который может передать страница с PR=0,15 и будет равен 0,15.
Вес переданный одной ссылки, если их 22 штуки, 0,15/22=0,00682
18.09.2009, 20:53 — Roman
Да, а формулки серьезные гугл придумал. Немного не дотягивает до теории струн.
15.11.2009, 22:25 — съемка свадьбы
скока всего на одной формуле замешано))))
Коэффициент «d»- отражает вероятность того, что человек, попадая на страницу, с неё по ссылкам продолжает путешествовать по сети? чем больше «д», тем выше вероятность продолжения путешествия. Значит авторитетные страницы — с траницы с минимальной вероятностью » продолжения путешествия»?
В формуле авторитетности странно получается: с одной стороны, нам надо, чтобы «д» было маленьким ( в случае (1-д)), но в тоже время «д» стоит как множитель перед суммой — так каким «д» должно быть оптимальным? 0,5? 0,4?
А у таких сайтов как «вконтакте» какое «д»?
04.04.2010, 21:29 — indigirka
Очень непростая система подсчетов, думала все намного легче считается. Хотя теория это хорошо, а практика не менее важна. На практике же одному из моих блогов не исполнилось и месяца с момента индексации поисковиками, а уже присвоено PR-3
05.03.2011, 14:14 — sora
Прочитал статью для чайников-все понял, а тут уже ничего) Автору спасибо за проделанную работу!