1 / 19

КЛАСТЕРНЫЙ АНАЛИЗ

КЛАСТЕРНЫЙ АНАЛИЗ. В СИСТЕМАХ ИСКУСТВЕННОГО ИНТЕЛЛЕКСТА. Определение. Кластерный анализ – многомерная статистическая процедура, выполняющая сбор данных, содержащих информацию о выборке объектов, и затем упорядочивающая объекты в сравнительно однородные группы.

rafe
Download Presentation

КЛАСТЕРНЫЙ АНАЛИЗ

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. КЛАСТЕРНЫЙ АНАЛИЗ В СИСТЕМАХ ИСКУСТВЕННОГО ИНТЕЛЛЕКСТА

  2. Определение Кластерный анализ – многомерная статистическая процедура, выполняющая сбор данных, содержащих информацию о выборке объектов, и затем упорядочивающая объекты в сравнительно однородные группы. Задача кластеризации относится к статистической обработке, а также к широкому классу задач обучения без учителя.

  3. Исходные данные

  4. Кластерный анализ

  5. Кластеры

  6. Цели кластеризации • Понимание данных. • Сжатие данных. • Обнаружение новизны

  7. Применение • Биоинформатика – анализ взаимодействия сетей генов • Социология – анализ исследований, опросов • Информатика: • Кластеризация результатов поиска • Сегментация изображений • Обнаружение опухолей и других патологий • Выделение объектов на спутниковых снимках • Распознавание лиц • Распознавание автомобильных номеров • Распознавание отпечатков пальцев • Интеллектуальный анализ данных

  8. Методы кластеризации • Вероятностный подход. • K-средних (K-means) • K-medians • EM-алгоритм • Алгоритмы семейства FOREL • Дискриминантный анализ • Подходы на основе систем ИИ • Метод нечеткой кластеризации C-средних (C-means) • Нейронная сеть Кохонена • Генетический алгоритм

  9. k-means (метод k-средних) стремится минимизировать суммарное квадратичное отклонение точек кластеров от центров этих кластеров k – число кластеров Si – полученные кластеры

  10. K-means - Interactive demo http://home.deib.polimi.it/matteucc/Clustering/tutorial_html/AppletKM.html

  11. Пример сходимости метода k-means

  12. Недостатки метода k-means • Не гарантируется достижение глобального минимума суммарного квадратичного отклонения V, а только одного из локальных минимумов. • Результат зависит от выбора исходных центров кластеров, их оптимальный выбор неизвестен. • Число кластеров надо знать заранее. k-means++

  13. Характеристики близости объектов

  14. Стоп-кадр

  15. Стоп-кадр

  16. Wolfram Mathematica

  17. Wolfram Mathematica

  18. STATISTICA (StatSoft)

  19. Спасибо за внимание

More Related