170 likes | 364 Views
データ分析統合環境 PADOC/stat 分析手法の比較. PIONIX 中井眞人. 分析プラットホームの開発方針. 1行分のデータ加工を全行に適用( SAS 仕様 ) 但し加工コマンドは C 言語ベースで記述。 ビジュアルなデータ分析 データフロー図による可視化 グラフィカルモデルの分析 結果のグラフ表示 コマンドベースとデータフローモードを併用 分析機能に拠らない I/F を提供. コマンドベース. ①. ②. ③. ① データの生成 ( 読込) ② 1 行毎の加工定義 ③グラフ表示. データフローモード.
E N D
データ分析統合環境PADOC/stat分析手法の比較 PIONIX 中井眞人 2014 Confidential @ PIONIX
分析プラットホームの開発方針 • 1行分のデータ加工を全行に適用(SAS仕様) • 但し加工コマンドはC言語ベースで記述。 • ビジュアルなデータ分析 • データフロー図による可視化 • グラフィカルモデルの分析 • 結果のグラフ表示 • コマンドベースとデータフローモードを併用 • 分析機能に拠らないI/Fを提供 2014 Confidential @ PIONIX
コマンドベース ① ② ③ ①データの生成(読込) ②1行毎の加工定義 ③グラフ表示 2014 Confidential @ PIONIX
データフローモード データフロー図 データ流れと分析内容を表示 2014 Confidential @ PIONIX
グラフィカル・モデル 共分散構造分析(SEM) 2014 Confidential @ PIONIX
グラフィカル・モデル 東京地下鉄網 最短経路問題 2014 Confidential @ PIONIX
グラフィカル・モデル ベイジアンネット因果分析 最大流入量問題 2014 Confidential @ PIONIX
非教師データによる分類 分析データフロー図 oldFaithful間欠泉 待時間/継続時間 2014 Confidential @ PIONIX
識別モデル 生成モデル ガウス過程 ディレクレ過程 教師データが必要 確率的降下 EM MCMC 教師データが必須でない 生成モデル 隠れたルール発見 2014 Confidential @ PIONIX
非教師データ分類 結果比較 樹系図による分類 樹系図の第4層での分類 K-Means法による分類 2014 Confidential @ PIONIX
非教師データ分類 結果比較(2) EMアルゴリズム 変分ベイズ 不要セグメントは縮退 2014 Confidential @ PIONIX
非教師データ分類 結果比較 2014 Confidential @ PIONIX
教師付データ SVMによる分類例 ガウシアン・カーネルは高次元にデータを写像するので閉曲面の分離可能 プラットのSMOアルゴリズムではカーネルの設定が容易 2014 Confidential @ PIONIX
今後の課題 • ユーザのモデルを組込むI/Fを提供 • 多数のユーザ使用による品質の向上 • 64ビットモードへの移行 2014 Confidential @ PIONIX
マニュアルと実行例の表示 コマンドバーでの表示 Webでの表示 2014 Confidential @ PIONIX
マニュアルと実行例の表示 2014 Confidential @ PIONIX
分析モデル一覧 2014 Confidential @ PIONIX