370 likes | 537 Views
Сетевой интерактивный ресурс данных по физике космоса. Space Physics Interactive Data Resource (SPIDR) Михаил Жижин, ИФЗ РАН jjn@wdcb.ru. Основная концепция. Интерактивный поиск данных ( data mining) Параллельность – сразу в нескольких базах данных
E N D
Сетевой интерактивный ресурс данных по физике космоса Space Physics Interactive Data Resource (SPIDR) Михаил Жижин, ИФЗ РАН jjn@wdcb.ru
Основная концепция • Интерактивный поиск данных (data mining) • Параллельность – сразу в нескольких базах данных • Метаданные – общий список параметров, спутников и наземных станций • Многодисциплинарная визуализация • События – удовлетворить нечеткие критерии отбора • Функции • Гибкая доставка данных по Сети (content delivery) • Синхронные региональные серверы • Персональная «покупательская» корзина • Адаптивный формат экспорта данных • Приложения • Сбор и контроль качества данных • Синтез данных • B2B источник для моделей космической погоды
Основные разделы данных • SSN – статистика солнечных пятен, с 1700 • Геомагнитные вариации (минутные и часовые) тестируется, c 1901 • Геомагнитные и солнечные индексы, с 1932 • Параметры ионосферы, c 1954 • IMF – межпланетное магнитное поле и параметры солнечного ветра, с 1973 • GOES – геостационарные спутники NOAA, с 1986 • DMSP – метеорологические спутники, с 1991 • Изображения Солнцав различных диапазонахимагнитограммы, с 1992
Кластер баз данных в Москве 15 Linux nodes 1 Tbyte of disk space 1 Gbit Ethernet backbone 1 Gbit optical link to Internet
Подключаемые (pluggable) базы данных Для подключения новой базы данных необходимо: • Написать метод доступа к базе, создающий объект модели данных SPIDR (день наблюдений параметра на станции) по JDBC запросу (MySQL, Oracle); • Создать HTML (JSP) форму запроса данных; • Проинформировать сервлеты выборки и визуализации о новом типе данных (метаданные о физических единицах, масштабах и типах шкал на графиках, и т.п.)
http://clust1.wdcb.ru/spidr Ссылки на узлы Прошлые сессии Доступные данные на текущий момент Новости
Интерактивная картография HTML Карта станций для интервала дат Java Список и описания отобранных станций HTML
Web-анимация рядов изображений со спутников Снимки Земли: DMSP, Terra Изображения Солнца: обсерватории и спутники
Поддержка множества узлов • Региональные узлы в России, США, Африке, Австралии, Япониии Китае • Сравнение метаданных на разных узлах (web-сервисы) • Независимая загрузка данных в любой из узлов (браузер или web-сервис) • Автоматическая синхронизация узлов (e-mail) • Автоматический анализ логов загрузки и предупреждение об ошибках (e-mail)
Сравнение метаданных на разных узлах SPIDR
Детальная инвентаризация за период-элемент-станцию
Сравнение узлов и синхронизация по запросу
Нечеткий поиск событий Data basket Fuzzy search Visualization
Критерий поиска в терминах нечеткой логики «Спокойный день»: • Малые значения индекса Kp • Индекс Dst около нуля «Магнитная буря»: • Большие значения индекса Kp • Большие отрицательные значения Dst
Форма «нечеткого» запроса Временной интервал для поиска Параметры Тип нечеткой функции принадлежности Пороги и значимость
Результат поиска – список событий
«Синтез» данных в SPIDR Минутные данные о солнечном ветре (скорость, плотность, магнитное поле): • ACE – с августа 1997 • WIND – с ноября 1994 • IMP8 – с июля 1992 по ноябрь 2000
Слияние минутных данных с трех спутников • Средняя скорость солнечного ветра и задержка до границы магнитосферы для каждого спутника • На данную минуту если нет данных ACE, то использовать WIND, в крайнем случае IMP8 (с учетом положения вне
Сравнение с часовыми данными OMNI, 1-7 августа 1999 Магнитное поле Плотность 1 мин OMNI
SWR временные ряды Графики временных рядов Java апплет или GIF изображения Запрос на выборку временного ряда в интервале времени для нескольких узлов на сетке и по множеству параметров
SWR значения поля на сетке Статические карты 9 – 12 на страницу Динамический Java для анимации изменения поля во времени
Распределение пользователейна узле в Болдере, США 6400 users from USA
Статистика в реальном времени Число пользователей Запросы на визуализацию и экспорт данных Доступна на каждом узле из меню: - SPIDR tools - Statistics
Bugrat – база данных ошибоки исправлений
Основная концепция • Интерактивный поиск данных (data mining) • Параллельность – сразу в нескольких базах данных • Метаданные – общий список параметров, спутников и наземных станций • Многодисциплинарная визуализация • События – удовлетворить нечеткие критерии отбора • Функции • Гибкая доставка данных по Сети (content delivery) • Синхронные региональные серверы • Персональная «покупательская» корзина • Адаптивный формат экспорта данных • Приложения • Сбор и контроль качества данных • Синтез данных • B2B источник для моделей космической погоды
Coming releaseSPIDR 3.0 • MVC and workflow state machine using Jakarta Struts • Enhanced usability with wizards: data collection trails “by time” and “by dataset” • Ionosphere data loading and synchronization re-worked • Web services for all B2B transactions • SWR data products included • Experimental SPDML-compliant metadata • Experimental GRID Globus toolkit ver. 3+