220 likes | 434 Views
Текстовые факторы ранжирования: от анализа до разработки сайта. Трофименко Евгений Александрович trofimenko . evgeny @ rbscorp . ru (495) 232-05-91 Корпорация РБС/ BDBD . ru http://www.bdbd.ru начальник отдела продвижения. Длина запросов. Много информации в рунете
E N D
Текстовые факторы ранжирования: от анализа до разработки сайта Трофименко Евгений Александрович trofimenko.evgeny@rbscorp.ru (495) 232-05-91 Корпорация РБС/ BDBD.ru http://www.bdbd.ru начальник отдела продвижения
Длина запросов • Много информации в рунете • Средняя длина запроса – 2.5—3 слова • Масса длинных запросов велика • Контекстные ограничения при поиске • Чувствительность длинных запросов к текстовой (контентной) оптимизации • …текстовые факторы рулят! (в своей области…)
Неиндексируемые зоны документа <head> (кроме <meta>) <script> <frames> <noindex> (Яндекс и Рамблер) Поля форм (кроме <textarea>) Ограничение индексации документов: robots.txt 4ХХ и 5ХХ HTTP-заголовки 304 Not Modified Банальщина и не только
Бан сайта по текстовым факторам – обычные критерии • Невидимый или слабовидимый для посетителя текст на странице • Клоакинг (cloaking) – выдача разного контента для поисковика и посетителя • Мгновенные перенаправления посетителя на другую страницу (редирект) • Наличие на сайте входных страниц (дорвеев), не несущих пользователю искомой информации • Сгенерированный текст на страницах
Бан сайта – нововведения и частые ошибки модераторов • Размещение текстов в невидимых слоях документа • Излишнее использование тегов выделения (Hx) • Сайт состоит из «плохого, нетематического, немодерируемого» каталога ссылок • Подмена страницы поисковика после захода на нее посетителя с помощью javascript • Контент сайта, состоящий на большую долю из рекламы (Бегун, фиды PPC) или партнерских программ (Мамба, интернет-магазины) • «отсутствие добавленной ценности или сервиса»
Факторы влияния на ранжирование • Нахождение слов запроса в особо важных зонах документа: title, h1-h4, b, strong, I, em….. • Естественность текста (… варианты) • Общая релевантность сайта и его структуры • … и соответствие контекстным ограничениям
Особенности Яндекса • Небольшие документы • Быстроробот для обновления информации • Большее влияние ссылочных факторов • …ограничения контекста
Особенности Рамблера • Большие документы • Большее влияние числа найденных слов • Общая релевантность сайта (найденные страницы+внутренние ссылки) • …ограничения контекста
Ограничения контекста при поиске Переформулирование поискового запроса: • Яндекс: «колдунщик» • Рамблер: «клей» Реально отрабатывается запрос, отличный от введенного, с добавлением расстояний и весов
Примеры контекстных ограничений (Яндекс) Был запрос: пластиковые окна в москве Стало: (пластиковые::21485& окна::5689& в::0&/(-1 3) москве::895)//6 (веса, расстояния, мягкость, изменения)
Примеры контекстных ограничений (Яндекс)
Разделители предложений для Яндекса Если слова запроса «ищутся» в пределах предложения или ближе: Разделителями являются: • Теги TABLE, TD, BR, P, H1-H6, DIV… • Точка, знаки (!?...) и двоеточие перед Текстом Как это выяснить? Найти модельный документ и использовать «подсветку»
Особенности обработки поискового запроса (Яндекс) • Переформулирование запроса • Выбор пассажей по огр. контекста • Выбор «найденных» пассажей по сумме весов слов (вес^0.38) • Расчет контрастности слов по позициям в найденных пассажах с перенормировкой по (размеру документа, частотным словам и др.) • Позиции взвешиваются по сходству окружения слова с запросом • Веса найденных словопозиций суммируются • Дополнительный учет форматирования
Частоты, слова или все вместе? • Исходно – частоты (tf=n/N) • Перенормировка по размеру документа (/N), например • Суммирование по позициям (*n) =>есть зависимость и от tfи от n Большие документы – ближе к частоте Маленькие – ближе к числу слов
Частоты в Яндексе-1 • Поиск по цитате из романа «Война и Мир» - одно вхождение: размер документа в выдаче …есть ли нормировка по размеру документа (в словах)?
Частоты в Яндексе-2 • Запрос $anchor(сайт) – поиск похож на чисто текстовый (отличается от поиска по запросу сайт) – большие документы и т.п.
Частоты Яндекса-2 • Число найденных слов vs. число слов в документе …есть ли зависимость (т.е., «частота»)?
Частоты в Яндексе-2 • Частоты vs. позиция в выдаче $anchor(сайт)
Частоты в Яндексе-2 • Первые 300 результатов из 17.000 • Частота vs. число найденных слов
Практическое применение • На этапе создания семант-ядра • На этапе распределения слов по страницам • Не попасть впросак с точными формулировками …учет контекстных ограничений при оптимизации и продвижении сайта
Учет контекстных ограничений при оптимизации и продвижении сайта
Вот, собственно, и всё.Текстовые факторы ранжирования: от анализа до разработки сайта Трофименко Евгений Александрович trofimenko.evgeny@rbscorp.ru (495) 232-05-91 Корпорация РБС/ BDBD.ru http://www.bdbd.ru начальник отдела продвижения