1 / 78

Математика в Интернет-рекламе

Математика в Интернет-рекламе. Виктор Лобачев. Математика в Интернет-рекламе. Особенности рекламы в Интернет Наш взгляд на аудиторию Как показывать рекламу? Моделирование. Альберт Эйнштейн. Вы думаете, всё так просто? Да , всё просто. Но совсем не так. Реклама в Интернет.

willem
Download Presentation

Математика в Интернет-рекламе

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Математика в Интернет-рекламе Виктор Лобачев

  2. Математика в Интернет-рекламе Особенности рекламы в Интернет Наш взгляд на аудиторию Как показывать рекламу? Моделирование

  3. Альберт Эйнштейн Вы думаете, всё так просто? Да, всё просто. Но совсем не так. Реклама в Интернет

  4. Особенности рекламы в Интернет Offline и Online реклама Медийная и контекстная реклама Участники игры

  5. Offline реклама Журналы, щиты на дорогах, телевидение, … • Заранее известны: тираж журналов, время показа по телевидению и т.д. • Заранее оценивается: объем и характеристики аудитории • Обратная связь только очень долгосрочная

  6. Offline реклама Рекламные кампании Газеты, журналы Кампания 1 Рекламное агентство Кампания 2 Телевидение Кампания 3 Кампания 4 Кампания N Наружная реклама Планирование, размещение

  7. Online реклама. Базовая схема. Рекламные кампании Аудитория Кампания 1 Рекламный сервер Кампания 2 Кампания 3 Кампания 4 Кампания N Планирование, показы Сайты Интернета

  8. Online реклама Интернет • Известны: рекламодатели, их кампании, сайты. • Заранее оценивается: трафик по сайтам • Каждый посетитель интернета может получать свою рекламу, и это можно контролировать.

  9. Online реклама Основные отличия от Offline • Фиксируется каждый показ. • На каждый запрос можно реагировать «на лету» • Система показов может обладать обратной связью • Система планирования должна учитывать алгоритмы системы показов.

  10. Медийная и контекстная реклама Медийная реклама:обычные старые добрые баннеры • Показываются независимо от текущего содержания страницы Контекстная реклама: баннер или текстовое объявление • Показываются в зависимости от содержания страницы • Яркий пример: показ объявления зависит от поискового запроса

  11. Online реклама. Участники игры. Рекламодатели: рекламные кампании • Объем, время, целевая аудитория, ограничения Ресурсы Интернета: сайты, страницы • Тематика, аудитория, трафик Посетители • Пол, возраст, доход, интересы, поведение

  12. Роберт Зенд Общего у людей только одно: все они разные. Наш взгляд на аудиторию

  13. Как смотрели на аудиторию несколько лет назад Принадлежащих императору Набальзамированных Дрессированных Молочных поросят Сирен Сказочных Бродячих собак Включенных в данную классификацию Неисчислимых Нарисованных самой лучшей верблюжьей кисточкой Тех, которые только что разбили цветочную вазу Древняя китайская классификация животных. Животные подразделяются на:

  14. Как смотрели на аудиторию несколько лет назад Аудитория Посетитель был «приписан» к некоторым сегментам Было очень неудобно Сегменты были неупорядочены

  15. Наш взгляд на аудиторию Пространство сегментов аудитории Таргетирование рекламных кампаний Вероятностное представление посетителей Вероятность попадания посетителя в таргет

  16. Пространство сегментов аудитории. Категории. Категория определяет множество взаимоисключающих значений какой-либо характеристики. • Пример: возраст. Человеку не может быть одновременно 25 и 40 лет. Значения в общем случае неупорядочены. • Пример: пол, мужчины и женщины. Категории независимы. • Пример: пол и возраст.

  17. Пространство сегментов аудитории. Сегменты. Простой сегмент: значение по одной из категорий. Атомарный сегмент: совокупность значений по всем категориям Атомарный сегмент Пол Категория сегментов Жен Муж Возраст -18 19-35 36+ Простые сегменты

  18. Пространство сегментов аудитории. Сегментный куб. Сегментный куб - пересечение множеств простых сегментов по разным категориям. • Примеры: • Пример множества, не являющегося сегментным кубом: Пол Жен Пол Пол Жен Жен Муж Муж Муж -18 19-35 36+ Возраст -18 -18 19-35 19-35 36+ 36+ Возраст Возраст

  19. Пол Таргет кампании 2 Пол Таргет кампании 1 Пол Жен Жен Жен Муж Муж Муж Возраст Возраст -18 19-35 36+ -18 19-35 36+ -18 19-35 36+ Возраст Таргет (целевая аудитория) – область в пространстве сегментов, является сегментный кубом по определению. Кампании с более сложной целевой аудиторией разбиваются на несколько: Таргетирование рекламных кампаний

  20. Вероятностный взгляд на посетителей Посетитель – реальный человек. Пол Жен 0% 0% 0% Муж 100% 0% 0% -18 19-35 36+ Возраст

  21. Вероятностный взгляд на посетителей Посетитель – реальный человек. Модель посетителя – «суперпозиция реальных людей», т.е. распределение вероятностей. Пол Жен 0% 0% 0% Муж 100% 0% 0% -18 19-35 36+ Возраст Пол Жен 15% 15% 5% Муж 50% 15% 0% -18 19-35 36+ Возраст

  22. Вероятностный взгляд на посетителей. Как хранить профиль? Хранить многомерное распределение вероятностей слишком дорого. Кроме того, его очень трудно получить. Решение – хранить проекции. Пол Жен 20% 15% 5% Муж 50% 10% 0% -18 19-35 36+ Возраст Вероятность 60% 60% 40% 40% 20% Пол Муж Жен

  23. Вероятностный взгляд на посетителей. Как построить профили? Поведение посетителей из обучающей выборки Поведение всех посетителей Классификация при помощи машинного обучения Обучение Классификация Параметры классификации Вероятностные профили посетителей Другие приложения Крутилка

  24. Вероятностный взгляд на посетителей. Опасность хранения проекций. В одном доме живут 2 человека.

  25. Вероятностный взгляд на посетителей. Опасность хранения проекций. В реальности – 2 человека. Получаются проекции: Пол Жен 0% 0% 50% Муж 50% 0% 0% -18 19-35 36+ Возраст 0% Вероятность Вероятность 50% 50% 50% 50% 36+ 19-35 60% 60% -18 40% 40% • Как восстановить реальность? 20% 20% Возраст Пол Муж Жен

  26. Вероятностный взгляд на посетителей. Опасность хранения проекций. Если просто перемножить вероятности, то получатся 4 человека. Пол Жен 25% 0% 25% Муж 25% 0% 25% -18 19-35 36+ Возраст А этих двоих тут не было

  27. Вероятностный взгляд на посетителей. Восстановление профиля по проекциям. Распределение всех посетителей сайта: • Возраст 36+ 10% 7% 8% 19-35 4% 12% 10% Простые вероятности пользователя: -18 40% 7% 2% A B C Доход % 70% 60% 40% 20% 10% Возраст 20% 3% 1% 36+ 2% 36+ Возраст -18 19-35 19-35 7% 6% 2% % -18 80% 14% 4% 40% 33.3% 33.3% 33.3% A B C 20% Доход Атомарные вероятности пользователя Доход A B C Томография

  28. Восстановление профиля по проекциям. Обозначения k – индекс категории сегментов jили – индекс простого сегмента категории k N – количество категорий – количество простых сегментов в категории k – атомарный сегмент – вероятность для посетителя принадлежать простому сегменту jв категории k – вероятность для посетителя принадлежать атомарному сегменту J X – вектор всех вероятностей принадлежностей к атомарным сегментам – распределение посетителей по атомарным сегментам – параметр влияния вероятностей простых сегментов без учета распределения посетителей сайта по сегментам - коэффициент влияния распределения посетителей сайта по сегментам Постановка задачи: Минимизировать функционал Ограничения:

  29. Восстановление профиля по проекциям Задача – минимизация квадратичного функционала. Размерность задачи равна количеству атомарных сегментов. Случай «Пол-Возраст-Доход» дает размерность 30. Решение нужно искать при каждом запросе.

  30. Восстановление профиля по проекциям Задача – минимизация квадратичного функционала. Размерность задачи равна количеству атомарных сегментов. Случай «Пол-Возраст-Доход» дает размерность 30. Решение нужно искать при каждом запросе. Ура! Эту задачу можно не решать. 

  31. Попадание посетителя в таргет Задача: найти одно число – вероятность принадлежности посетителя к таргету. Таргет: Доход С В А 36+ Возраст -18 19-25 26-35

  32. Попадание посетителя в таргет Таргет – сегментный куб. Следовательно, можно по каждой категории перейти к двум значениям: «Принадлежит – Не принадлежит» Таргет: Доход С В Простые вероятности посетителя: А 36+ Возраст -18 19-25 26-35 % 60% 60% 40% 20% Вероятности попадания в таргет: 20% 10% 10% % % -18 36+ 60% Возраст 19-25 26-35 60% 70% 40% % 40% 60% 40% 40% 40% 20% 20% 30% 40% 20% 20% Да Да Нет Нет По возрасту По доходу С Доход А В

  33. Попадание посетителя в таргет Размерность задачи оптимизации Вероятности попадания посетителя в таргет: Распределение по сайту: Подходит По доходу? % % 60% 60% Нет 30% 20% 70% 40% 40% 60% 40% Да 20% 20% 30% 10% 40% Да Да Нет Да Нет Нет Подходит по возрасту? По возрасту По доходу Окончательные вероятности для посетителя по сайту: Подходит По доходу? Интересующая нас вероятность попадания в таргет Нет 35% 25% Да 5% 35% Да Нет Подходит по возрасту?

  34. Попадание посетителя в таргет Практическое решение задачи размерности • Замечено, что почти всегда решение лежит внутри области. • Задача оптимизации без ограничений решается аналитически. • Если решение лежит за пределами области, ищется ближайшая к решению точка области.

  35. Общие данные • - количество базовых категорий • - атомарный сегмент, пересечение простых сегментов с индексами i, j, l. • Данные о размещениях • – множество простых сегментов по базовой категории k, входящих в таргет. • – множество простых сегментов по базовой категории k, не входящих в таргет. • – множество простых сегментов по дополнительной категории n, входящих в таргет. • R – текущий порог вероятности вхождения в таргет. • Данные о ресурсе (сайте или секции) • – доля количества посетителей, принадлежащих атомарному сегменту . • – доля количества посетителей, принадлежащих таргету по категориям, где значение индекса равно 1 и не принадлежащих по категориям, где значение индекса равно 0. • Аналогично, и – доли в случае двух категорий • Данные о посетителе • – вероятность принадлежности посетителя к простому сегменту j базовой категории k. • – простой сегмент посетителя в дополнительной категории n. • Данные о паре посетитель-таргет • – вероятность принадлежности посетителя к таргету по базовой категории k. • S – оценка вероятности вхождения посетителя в таргет безотносительно к ресурсу. • Для комбинации посетитель-таргет-ресурс • x – вероятность вхождения в таргет размещения на данном ресурсе. Попадание посетителя в таргет. Решение задачи без ограничений. – доля количества посетителей, принадлежащих таргету по категориям, где значение индекса равно 1 и не принадлежащих, где значение индекса равно 0. – вероятность принадлежности посетителя к таргету по категории k. – параметр влияния вероятностей простых сегментов без учета распределения посетителей сайта по сегментам. - коэффициент влияния распределения посетителей сайта по сегментам. – вероятность вхождения в таргет размещения на данном ресурсе.

  36. Общие данные • - количество базовых категорий • - атомарный сегмент, пересечение простых сегментов с индексами i, j, l. • Данные о размещениях • – множество простых сегментов по базовой категории k, входящих в таргет. • – множество простых сегментов по базовой категории k, не входящих в таргет. • – множество простых сегментов по дополнительной категории n, входящих в таргет. • R – текущий порог вероятности вхождения в таргет. • Данные о ресурсе (сайте или секции) • – доля количества посетителей, принадлежащих атомарному сегменту . • – доля количества посетителей, принадлежащих таргету по категориям, где значение индекса равно 1 и не принадлежащих по категориям, где значение индекса равно 0. • Аналогично, и – доли в случае двух категорий • Данные о посетителе • – вероятность принадлежности посетителя к простому сегменту j базовой категории k. • – простой сегмент посетителя в дополнительной категории n. • Данные о паре посетитель-таргет • – вероятность принадлежности посетителя к таргету по базовой категории k. • S – оценка вероятности вхождения посетителя в таргет безотносительно к ресурсу. • Для комбинации посетитель-таргет-ресурс • x – вероятность вхождения в таргет размещения на данном ресурсе. Попадание посетителя в таргет. Решение задачи без ограничений. • 1-мерный случай:

  37. Общие данные • - количество базовых категорий • - атомарный сегмент, пересечение простых сегментов с индексами i, j, l. • Данные о размещениях • – множество простых сегментов по базовой категории k, входящих в таргет. • – множество простых сегментов по базовой категории k, не входящих в таргет. • – множество простых сегментов по дополнительной категории n, входящих в таргет. • R – текущий порог вероятности вхождения в таргет. • Данные о ресурсе (сайте или секции) • – доля количества посетителей, принадлежащих атомарному сегменту . • – доля количества посетителей, принадлежащих таргету по категориям, где значение индекса равно 1 и не принадлежащих по категориям, где значение индекса равно 0. • Аналогично, и – доли в случае двух категорий • Данные о посетителе • – вероятность принадлежности посетителя к простому сегменту j базовой категории k. • – простой сегмент посетителя в дополнительной категории n. • Данные о паре посетитель-таргет • – вероятность принадлежности посетителя к таргету по базовой категории k. • S – оценка вероятности вхождения посетителя в таргет безотносительно к ресурсу. • Для комбинации посетитель-таргет-ресурс • x – вероятность вхождения в таргет размещения на данном ресурсе. Попадание посетителя в таргет. Решение задачи без ограничений. • 1-мерный случай: • 2-мерный случай:

  38. Общие данные • - количество базовых категорий • - атомарный сегмент, пересечение простых сегментов с индексами i, j, l. • Данные о размещениях • – множество простых сегментов по базовой категории k, входящих в таргет. • – множество простых сегментов по базовой категории k, не входящих в таргет. • – множество простых сегментов по дополнительной категории n, входящих в таргет. • R – текущий порог вероятности вхождения в таргет. • Данные о ресурсе (сайте или секции) • – доля количества посетителей, принадлежащих атомарному сегменту . • – доля количества посетителей, принадлежащих таргету по категориям, где значение индекса равно 1 и не принадлежащих по категориям, где значение индекса равно 0. • Аналогично, и – доли в случае двух категорий • Данные о посетителе • – вероятность принадлежности посетителя к простому сегменту j базовой категории k. • – простой сегмент посетителя в дополнительной категории n. • Данные о паре посетитель-таргет • – вероятность принадлежности посетителя к таргету по базовой категории k. • S – оценка вероятности вхождения посетителя в таргет безотносительно к ресурсу. • Для комбинации посетитель-таргет-ресурс • x – вероятность вхождения в таргет размещения на данном ресурсе. Попадание посетителя в таргет. Решение задачи без ограничений. • 1-мерный случай: • 2-мерный случай: • 3-мерный случай:

  39. Общие данные • - количество базовых категорий • - атомарный сегмент, пересечение простых сегментов с индексами i, j, l. • Данные о размещениях • – множество простых сегментов по базовой категории k, входящих в таргет. • – множество простых сегментов по базовой категории k, не входящих в таргет. • – множество простых сегментов по дополнительной категории n, входящих в таргет. • R – текущий порог вероятности вхождения в таргет. • Данные о ресурсе (сайте или секции) • – доля количества посетителей, принадлежащих атомарному сегменту . • – доля количества посетителей, принадлежащих таргету по категориям, где значение индекса равно 1 и не принадлежащих по категориям, где значение индекса равно 0. • Аналогично, и – доли в случае двух категорий • Данные о посетителе • – вероятность принадлежности посетителя к простому сегменту j базовой категории k. • – простой сегмент посетителя в дополнительной категории n. • Данные о паре посетитель-таргет • – вероятность принадлежности посетителя к таргету по базовой категории k. • S – оценка вероятности вхождения посетителя в таргет безотносительно к ресурсу. • Для комбинации посетитель-таргет-ресурс • x – вероятность вхождения в таргет размещения на данном ресурсе. Попадание посетителя в таргет. Решение задачи без ограничений. • 1-мерный случай: • 2-мерный случай: • 3-мерный случай: • n-мерный случай: - множество наборов двоичных индексов, содержащих ровно m единиц, - элемент такого множества, - значение с таким набором индексов.

  40. Альберт Эйнштейн Сделай настолько просто, насколько это возможно, но не проще. Как показывать рекламу

  41. Как показывать рекламу Рекламные кампании Крутилка «Классическая» модель Real-Time Bidding (RTB)

  42. Как показывать рекламу. Кампании. Идеальная цель рекламной кампании • Повысить прибыльность бизнеса Реальные цели: • Просмотр пользователем баннеров • Клики пользователя по баннерам Медийная реклама Контекстная реклама

  43. Как показывать рекламу. Кампании. Условия медийных кампаний: • Временные рамки • Количество показов • Растянутость показов во времени • Множество ресурсов (сайтов) • Целевая аудитория (таргет) • Ограничения на количество показов одному пользователю

  44. Как показывать рекламу. План показов рекламной кампании. План показов, растягивающий показы во времени Общее количество показов Показы Время Т 0 Временные рамки

  45. Как показывать рекламу. Таргет кампании. • Профили определены нечетко • Таргет рекламной кампании задан точно • Алгоритмы должны максимизировать процент целевых показов при любом трафике

  46. Как показывать рекламу. Крутилка. Рекламные кампании Запрос Ответ Кампания 1 Рекламный сервер Кампания 2 «Крутилка» Кампания 3 Кампания 4 При каждом запросе крутилка принимает решение, объявление какой рекламной кампании надо показать Кампания N Планирование, показы

  47. Как показывать рекламу. Крутилка. Выделяются две подзадачи: • Определение множества кампаний, объявления которых можно показать • Конкурс – выбор одной кампании из этого множества Вторая подзадача (выбор кампании из известного множества) решается эвристически, случайным выбором с заданным весом. Сосредоточимся на первой подзадаче: Какие кампании включать в это множество?

  48. Как показывать рекламу. Крутилка. План показов, растягивающий показы во времени Общее количество показов Показы Реальные показы Время Т 0 Временные рамки

  49. Как показывать рекламу. Крутилка. План показов, растягивающий показы во времени Общее количество показов Показы Реальные показы Время Т 0 Надо выполнить план, при этом оптимизировав другие показатели Временные рамки

More Related