90 likes | 154 Views
第 1 回データWG資料. 資料 9. 経済産業省におけるオープンデータに関する 技術の検討状況について. 平成 24 年 1 2月 商務情報政策局 情報プロジェクト室. DATA METI構想 ( Open by Default 社会の実現に向けて). 電子行政 オープンデータ 実務者会議. 得られたノウハウのフィードバックによるデータ供給システムの改善. 提供可能なデータ から順次提供. 技術・制度上の課題を抽出. 政府全体の課題を提示. 公共データの利用に関するニーズや課題をフィードバック.
E N D
第1回データWG資料 資料9 経済産業省におけるオープンデータに関する技術の検討状況について 平成24年12月 商務情報政策局 情報プロジェクト室
DATA METI構想(Open by Default社会の実現に向けて) 電子行政 オープンデータ 実務者会議 得られたノウハウのフィードバックによるデータ供給システムの改善 提供可能なデータ から順次提供 技術・制度上の課題を抽出 政府全体の課題を提示 公共データの利用に関するニーズや課題をフィードバック 利活用を促す技術(機械可読、API、LOD化)や制度の提供 ニーズ調査の実施や コミュニティの活用 実施事業等で得られた知見やノウハウをフィードバック 利活用しやすいデータ公開環境の提供 ユースケースや活用支援の紹介 モデルケースの提示 経済産業省自身(所管の独立行政法人等を含む)の保有データを対象にデータ公開の環境整備を図り、実際に公開を進めるとともに、公開データを利活用したビジネスが展開する社会基盤を整えていくことで、オープンデータによる経済活性化の促進を図る。
電子政府の取組における技術的な検討について電子政府の取組における技術的な検討について (イメージ) 利活用促進に向けた技術的な取組 利活用レベル • 文字基盤の統一 • IPAフォントの開発・公開(平成23年度実施) • 共通地理コードの検討 • マイナンバーの活用 • 公共情報交換標準スキーム(日本版NIEM※(仮称))の検討 • 組織間での意思疎通を行うために必要となる用語レベルの意味を統一するスキームを • 実証・検討 • LOD(Linked Open Data)の実施・普及 • 異なるデータ源のデータを相互に結び付け • フォーマットの標準化 • 持続的な識別子の確保 • 公開データの機械可読化 • 機械可読なフォーマット(Excel、Wordなど)やオープンに利用できるフォーマット(CSVなど)の活用 • 利用者向けAPIの提供 • 総務省と協力して検討を実施 • 人材の育成 • 適切なデータ公開のための加工技術とそのデータの内容が分かるデータキュレータの養成 各種アプリケーション API アプリ アプリ (外部) ⑨ API (内部) アプリ ⑧ 利活用基盤レベル (例「生産+消費+在庫」) ⑥ ⑦ データの蓄積・共有・交換 ⑤ 用語レベル ④ 地理コード 国民ID 企業ID (例「生産」) コードレベル 文字基盤 (例「生」「産」) ② ③ ① • ※NIEM(National Information Exchange Model):米国政府が公共情報の交換に活用しているデータ交換体系 これまでの電子政府の取組は、アプリケーションの構築が中心であったが、情報システムを効率的かつ広範に活用するためには利活用の基盤レベルの整備が必要。
DATA METI構想における技術の検討について • ①オープンデータ化に必要な技術の検討 • 機械可読な形式の導入 • データ形式の改善 • 異なるシステム間での利用を可能に • LOD化 • フォーマットの標準化 • 公共情報交換標準スキーム(日本版NIEM(仮称)) • M to Mの取得方法の導入 • APIの導入 • ②ニーズやシステム、ライセンス等状況を踏まえた加工レベルの設定 • ③効果検証に対する技術的支援の検討 オープンデータに向けて段階的に検討 欧米との連携も視野に入れた本格的な取組を実施中 総務省の取組を踏まえた導入を検討 経済産業省保有データを開放するに当たっては、次の技術的措置を検討。
オープンデータへの5つのステップ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ • どんなフォーマットでよいからオープンライセンスでデータ公開 • 例:PDF, jpg ライセンス コンピュータが処理可能なフォーマットで公開 例:xls, doc オープンに利用できるフォーマットで公開 例:csv RDF(とSPARQL)でデータ公開 例:RDFa, RDFストア 他へのリンクを入れたデータを公開 LODCloudへの参加 Linked Data/ Linked Open Data (LOD) データカタログ・サイト
公共情報交換標準スキームの検討 • 組織間情報のマッシュアップを容易にするため、用語の意味の統一スキームを検討。具体的には、欧米で導入が進んでいるNIEMやJoinupといった取組に着目し、日本版NIEM(仮称)の試行を実施。 • 本年度内に、分野共通のコア用語と活用ニーズの高い分野(防災・社会保障など)の用語について整備・実証を行い、政府全体の戦略に反映していく。 NIEMのイメージ 効果① 電子行政の推進 個々の情報が定義された上で構造化され、リンクしている 組織間での意思疎通の齟齬が防止できる(救援物資の例) 提供を考えている NIEM該当項目 NIEMの辞書 A省 飲料水 水 暖房具 毛布 飲料水 毛布 水、暖房具 水、暖房具 治療用水 カイロ 実は欲しい物の NIEM該当項目 洗濯用水 ストーブ B自治体 それぞれの用語の意味が定義されているので齟齬が起きない 水 カイロ 人 一般的な「人」 氏名 効果② オープンデータの推進 効果③ 情報産業の競争力強化 性別 マッシュアップするときに同じ項目のデータを集計できる 情報交換の設計作業を簡素化するとともに、相互運用性を向上できる 生年月日 違うデータが出てきたので、両方のシステムから住民票ベースの人口を出してもらおう システムX コア A市人口 (住民票ベース) API 被災者 被害 集計しやすいように、情報収集項目を確認可能 API 避難地 B市人口 (実人口) システムY 辞書から情報項目やメッセージセットを持ってこられる 防災分野
具体的なアウトプット①(データカタログの設置)具体的なアウトプット①(データカタログの設置) • 2次利用可能な経済産業省保有データを集めた特設サイトとして「Open Data METI」サイトを開設。現在、公開に向けた調整を実施。 • サイトではCKAN※を使ったデータカタログを設置。 (開発中の「Open Data METI」サイト) ※ Open Knowledge Foundationが中心となって開発しているオープンソースのデータ管理システム。データやデータカタログの登録・検索・閲覧等をWebインターフェースやAPI経由で行うことが可能。他のCKANからデータを取り込む仕組みもあり。
具体的なアウトプット②(LOD化) • LOD化をすることで色々なデータとの接続が可能。 • 今後、実装を検討。 ○工業統計のデータ LOD化 ○インターネット上の 他のRDFデータ label http://www.meti.go.jp/statistics/region/01101 札幌市中央区 中央区(札幌市) 事業所数 102 abstract 札幌市中央区は、・・・ sameAS Meisyo 観光名所A http://dbpedia.org/resource/Chuo-ku,_Sapporo 札幌市中央区は、・・・ abstract Meisyo 観光名所A
(参考)公共データWGによる検討 公共データWG委員等一覧 ◆顧問 國領 二郎 慶應義塾大学総合政策学部 学部長 ◆座長 川島 宏一 佐賀県特別顧問 ◆委員 岩崎 浩平 日本商工会議所 情報化推進部長 大向 一輝 国立情報学研究所 コンテンツ科学研究系 准教授 越塚 登 東京大学大学院 学際情報学府 教授 坂下 哲也 JIPDEC 電子情報利活用推進部 次長 神﨑 洋 トヨタ自動車 IT・ITS企画部 調査渉外室 担当部長 菅野 幹人 三菱電機株式会社 情報技術総合研究所 情報システム構築技術部 グループマネージャー 庄司 昌彦 国際大学グローバル・コミュニケーションセンター 主任研究員 高木 聡一郎 NTTデータ 企画調整室 IT政策推進グループ 課長代理 武田 英明 国立情報学研究所情報学プリンシプル研究系 教授 田代 秀一 独立行政法人情報処理推進機構 技術本部国際標準推進センター長 野口 祐子 森・濱田松本法律事務所 弁護士 (クリエイティブ・コモンズ・ジャパン常務理事) 萩野 達也 慶應義塾大学環境情報学部 教授 (W3C※アジア担当技術統括副責任者) 村上 文洋 MRI地域経営研究本部 副本部長 DATA METI構想の推進に必要な検討を行うとともに、政府全体の検討(電子行政オープンデータ実務者会議)への積極的貢献につなげていくため、経済産業省IT融合フォーラムの下に公共データWGを本年8月に設置。 経済産業省保有データを対象に実践的な観点からオープンデータの検討を実施。 ※W3C:World Wide Web Consortium