1 / 22

Текстовые факторы ранжирования: от анализа до разработки сайта

Текстовые факторы ранжирования: от анализа до разработки сайта. Трофименко Евгений Александрович trofimenko . evgeny @ rbscorp . ru (495) 232-05-91 Корпорация РБС/ BDBD . ru http://www.bdbd.ru начальник отдела продвижения. Длина запросов. Много информации в рунете

aziza
Download Presentation

Текстовые факторы ранжирования: от анализа до разработки сайта

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Текстовые факторы ранжирования: от анализа до разработки сайта Трофименко Евгений Александрович trofimenko.evgeny@rbscorp.ru (495) 232-05-91 Корпорация РБС/ BDBD.ru http://www.bdbd.ru начальник отдела продвижения

  2. Длина запросов • Много информации в рунете • Средняя длина запроса – 2.5—3 слова • Масса длинных запросов велика • Контекстные ограничения при поиске • Чувствительность длинных запросов к текстовой (контентной) оптимизации • …текстовые факторы рулят! (в своей области…)

  3. Неиндексируемые зоны документа <head> (кроме <meta>) <script> <frames> <noindex> (Яндекс и Рамблер) Поля форм (кроме <textarea>) Ограничение индексации документов: robots.txt 4ХХ и 5ХХ HTTP-заголовки 304 Not Modified Банальщина и не только

  4. Бан сайта по текстовым факторам – обычные критерии • Невидимый или слабовидимый для посетителя текст на странице • Клоакинг (cloaking) – выдача разного контента для поисковика и посетителя • Мгновенные перенаправления посетителя на другую страницу (редирект) • Наличие на сайте входных страниц (дорвеев), не несущих пользователю искомой информации • Сгенерированный текст на страницах

  5. Бан сайта – нововведения и частые ошибки модераторов • Размещение текстов в невидимых слоях документа • Излишнее использование тегов выделения (Hx) • Сайт состоит из «плохого, нетематического, немодерируемого» каталога ссылок • Подмена страницы поисковика после захода на нее посетителя с помощью javascript • Контент сайта, состоящий на большую долю из рекламы (Бегун, фиды PPC) или партнерских программ (Мамба, интернет-магазины) • «отсутствие добавленной ценности или сервиса»

  6. Факторы влияния на ранжирование • Нахождение слов запроса в особо важных зонах документа: title, h1-h4, b, strong, I, em….. • Естественность текста (… варианты) • Общая релевантность сайта и его структуры • … и соответствие контекстным ограничениям

  7. Особенности Яндекса • Небольшие документы • Быстроробот для обновления информации • Большее влияние ссылочных факторов • …ограничения контекста

  8. Особенности Рамблера • Большие документы • Большее влияние числа найденных слов • Общая релевантность сайта (найденные страницы+внутренние ссылки) • …ограничения контекста

  9. Ограничения контекста при поиске Переформулирование поискового запроса: • Яндекс: «колдунщик» • Рамблер: «клей» Реально отрабатывается запрос, отличный от введенного, с добавлением расстояний и весов

  10. Примеры контекстных ограничений (Яндекс) Был запрос: пластиковые окна в москве Стало: (пластиковые::21485& окна::5689& в::0&/(-1 3) москве::895)//6 (веса, расстояния, мягкость, изменения)

  11. Примеры контекстных ограничений (Яндекс)

  12. Разделители предложений для Яндекса Если слова запроса «ищутся» в пределах предложения или ближе: Разделителями являются: • Теги TABLE, TD, BR, P, H1-H6, DIV… • Точка, знаки (!?...) и двоеточие перед Текстом Как это выяснить? Найти модельный документ и использовать «подсветку»

  13. Особенности обработки поискового запроса (Яндекс) • Переформулирование запроса • Выбор пассажей по огр. контекста • Выбор «найденных» пассажей по сумме весов слов (вес^0.38) • Расчет контрастности слов по позициям в найденных пассажах с перенормировкой по (размеру документа, частотным словам и др.) • Позиции взвешиваются по сходству окружения слова с запросом • Веса найденных словопозиций суммируются • Дополнительный учет форматирования

  14. Частоты, слова или все вместе? • Исходно – частоты (tf=n/N) • Перенормировка по размеру документа (/N), например • Суммирование по позициям (*n) =>есть зависимость и от tfи от n Большие документы – ближе к частоте Маленькие – ближе к числу слов

  15. Частоты в Яндексе-1 • Поиск по цитате из романа «Война и Мир» - одно вхождение: размер документа в выдаче …есть ли нормировка по размеру документа (в словах)?

  16. Частоты в Яндексе-2 • Запрос $anchor(сайт) – поиск похож на чисто текстовый (отличается от поиска по запросу сайт) – большие документы и т.п.

  17. Частоты Яндекса-2 • Число найденных слов vs. число слов в документе …есть ли зависимость (т.е., «частота»)?

  18. Частоты в Яндексе-2 • Частоты vs. позиция в выдаче $anchor(сайт)

  19. Частоты в Яндексе-2 • Первые 300 результатов из 17.000 • Частота vs. число найденных слов

  20. Практическое применение • На этапе создания семант-ядра • На этапе распределения слов по страницам • Не попасть впросак с точными формулировками …учет контекстных ограничений при оптимизации и продвижении сайта

  21. Учет контекстных ограничений при оптимизации и продвижении сайта

  22. Вот, собственно, и всё.Текстовые факторы ранжирования: от анализа до разработки сайта Трофименко Евгений Александрович trofimenko.evgeny@rbscorp.ru (495) 232-05-91 Корпорация РБС/ BDBD.ru http://www.bdbd.ru начальник отдела продвижения

More Related