SlideShare a Scribd company logo
オープンデータをつかう図書館
オープンデータをつくる図書館
国立情報学研究所
大向 一輝
http://www.slideshare.net/ikki.ohmukai/2015817
自己紹介
A(2006)
B(2011)
D(2015)
自己紹介
2007 20122010 2013
• 研究対象
• ソーシャルメディア:ブログ・SNS・Twitter…
• 学術情報流通・オープンサイエンス
• 技術
• セマンティックウェブ・Linked Open Data(LOD)
• ネットワーク分析・データマイニング
• クラウドソーシング
自己紹介
• オープンデータ関連の活動
• 内閣官房 電子行政オープンデータ実務者会議 公開支援WG
• 経済産業省 IT融合フォーラム 公共データWG
• (一社)オープン&ビッグデータ・地方創生推進機構 利活用普及委員会
• NPOリンクト・オープン・データ・イニシアティブ
• 横浜オープンデータソリューション発展委員会
• データエクスチェンジコンソーシアム
きょうの内容
• オープンデータ(超)入門
• 図書館がオープンデータをつかうには
• 図書館がオープンデータをつくるには
http://current.ndl.go.jp/ca1825
オープンデータ
↓
公開されたデータ
データを公開する活動
3.11とオープンデータ
http://www.tepco.co.jp/forecast/index-j.html
3.11とオープンデータ
http://www.tepco.co.jp/forecast/html/images/juyo-j.csv
3.11とオープンデータ
http://octoba.net/archives/東京電力 より抜粋
オープンデータとは
• ウェブ上で公開された開放性(再利用性)の高いデータ
• 制度面の開放性
• 技術面の開放性
• データ社会の礎のひとつ
• ビッグデータ
• パーソナルデータ
• おもに公共セクターで注目
• オープンガバメントの手段
• 透明性
• 市民参加
• イノベーション http://ted.com
政府オープンデータの系譜
• 2003 公共セクター情報(PSI)利活用に関するEU指令
• 2006 英国Office of PSI
• 2008 OECDソウル宣言・勧告
• 2009 米国Open Government Initiative
• 2009 米国・英国オープンデータカタログサイト
• 2010-2011 フランス・ドイツでの取り組み
• 2012 電子行政オープンデータ戦略・実務者会議
• 2013 G8オープンデータ憲章
• 2013 政府オープンデータカタログサイト
● 我が国は「電子行政オープンデータ戦略」、「世界最先端IT国家創造宣言」等に基づきオープンデータを推進
● これまでの間、
・ 公共データの二次利用を可能とするルールの策定(2014年6月)
・ データカタログサイトの整備(試行版:2013年12月、本格版:2014年10月)
・ 「地方公共団体オープンデータ推進ガイドライン」の公表(2015年2月) 等
⇒ データ公開面では一定の成果を挙げつつあるものの、今後は利活用面にも焦点を当てる必要あり
<重点的に取り組む事項>
<データの利活用の推進>今後のオープンデータの展開に
向けた基本的考え方
これまでの取組を継承しつつ、利活用
を見据えた効果的・効率的な展開を
図る必要
「課題解決型のオープンデータの推進」
に発想を転換
府省庁の重要施策等の検討に当たっ
ては、課題の発見(見える化)・解決
の一手段としてオープンデータの活用可
否を検討(政策決定過程にオープン
データをビルトイン化)
このような発想の転換とともに、「重点
的に取り組む事項」を整理し、政府一
体となって取り組む
<データ公開の推進>
政府のみならず、独立行政法人、公益企業等
におけるオープンデータも推進
公開データ(データカタログサイト等)の質・量両
面での拡充
①従来のWeb中心からWeb非掲載データへの拡充
②機械判読可能な形式のファイルや外国語データの
比率向上
③国際ランキング(19位)の向上に向けた取組強化
(政府標準利用規約の見直し、評価項目の見直し
の提案)
④制度上の制約(要承認、有料等)が存在するデータ
の整理
⑤KPIの見直しや各府省庁の目標設定
国内の取組
①オープンデータの利活用の普及・啓発
・活用事例の収集・情報提供
(オープンデータ100の選定、開発者
フォーラムの設置等)
・横展開のためのオープンデータ伝道師
の任命・支援
②利活用に係る評価指標のあり方、KPI
の項目や目標値の設定
国際展開の推進
①アプリやシステム、ノウハウ等をパッケージ
化し、アジア等へ発信
②国際的評価指標(グローバルインデッ
クス)づくりに参画、海外展開
地方公共団体の取組への支援
①民間有識者等の人材の派遣、横展開の支援
(※地方創生IT利活用推進プランにも盛り込み)
②自治体特有のデータ形式(タグ、分類等)の標準化
③法令に基づき自治体が作成するデータの公開の可
否が不明確なものの整理
< >
(平成27年6月30日 高度情報通信ネットワーク社会推進戦略本部決定)
http://www.kantei.go.jp/jp/singi/it2/densi/
都市オープンデータ
• 世界の動向
• 米国:オープンデータカタログに12都市が参加
• 英国:105/434自治体がオープンデータ協議会を設置
• 国内の動向
• 2012.1 福井県 江市の取り組みが開始
• 2015.8 158/1765自治体がオープンデータ公開中
• International Open Data Day
• 2013 102都市(国内8都市)
• 2014 158都市(国内32都市)
• 2015 222都市(国内57都市・機関)
http://fukuno.jig.jp/2013/opendatamap
コミュニティと企業
• 公共オープンデータを支えるコミュニティ
• 市民と開発者
• ハッカソン・アイデアソンを通じたコミュニケーショ
ンとコラボレーション
• 「税金はどこへ行った?」「5374.jp」
• Code for X
• ブリゲード:地域単位の開発者コミュニティ
• フェローシップ:企業から行政への人材派遣
• 企業データのオープン化
• オープンイノベーションの実現手段として
• ハッカソン・アイデアソン・コンテストの実施
IODD2015(2015.2.21)
オープンの定義
• 商用・非商用を問わない2次利用・再配布が可能であること
• クレジットの明示を求めてもよい
• 再利用の際に同じ条件を課してもよい
• 著作権との整理が必要
• オープンライセンス
• 上記事項を満たすための明示的な事前許諾(契約)
• クリエイティブ・コモンズCC BYまたはCC BY-SAとそ
の互換ライセンスが該当
• パブリックドメイン(PD)
• 著作権が存在しない状態
• 著作権を放棄するCC0
OL:オープンライセンス
RE:再利用可
OF:オープンフォーマット
URI:識別子
LD:
Linked Data
http://5stardata.info
オープンデータをつかう
• データを探す・見つける
• データの利用条件を確認する
• データを組み合わせる・活用する
• 活用例を探す・見つける
• 活用例の利用条件を確認する
• 活用例を組み合わせる・さらに活用する
• ・・・
データを探す・見つける
• データ公開サイトへの直接アクセス
• どこに何があるかわからない
• 検索エンジン
• 絞り込みが困難
• データカタログサイト
• メタデータによる分類・整理
• CMSの一種を利用
• 政府データカタログ
• 米国:data.gov
• 英国:data.gov.uk
• 日本:data.go.jp
http://www.data.go.jp
オープンデータをつかう図書館、オープンデータをつくる図書館@京都図書館大会(2015.8.17)
http://todo-ran.com
人口総数
ケーススタディ
• 動く人口ピラミッドをつくる
• 過去のデータ
• 平成22年国勢調査 時系列データ(総務省統計局)
• 未来のデータ
• 日本の将来推計人口(国立社会保障・人口問題研究
所)
• 可視化
• Googleドライブ モーショングラフ
• 全国版(1920∼2055)・京都府版(1980∼2040)を
作成
• http://bit.ly/japan-population
オープンデータをつかう図書館、オープンデータをつくる図書館@京都図書館大会(2015.8.17)
ケーススタディ
• データ間の差異を吸収する
• 国勢調査・将来推計ともに5歳刻み
• 国勢調査は85歳以上、将来推計は90歳以上がまとめられ
ている
• モーショングラフの仕様に合わせて追加情報を付与する
• 調査年度
• 世代ID:特定の世代を色で表現し、時系列的変化に追従さ
せる
• データの由来を明記する
• 調査方法や推計の種別(上位・中位・下位)を明確にする
利用条件の確認
• 政府データカタログ掲載のデータは原則としてCC BY
• 政府標準利用規約
• 政府ウェブサイトの情報の利用条件を明確化
• 商用・非商用を問わない2次利用とクレジットの明記
• →CC BY相当、ただし「公序良俗条項」「国家国民安
全条項」あり
• 米国公共セクター情報は原則パブリックドメイン
• 情報通信白書(総務省)
• 原則CC BY
• 数値データおよび簡単な表・グラフは自由利用可能
• オープンデータでない第三者著作物は図表リストに明記
活用事例を探す・見つける
• データ提供元による把握
• 事前許諾モデルのため網羅的に集めることは困難
• カタログサイトの統計情報公開の事例
• 各種コンテストの応募リスト
• Linked Open Dataチャレンジ
• http://lod.sfc.keio.ac.jp/
• アーバンデータチャレンジ
• http://aigid.jp/
• Mashup Awardsシビックテック部門
• http://mashupaward.jp/
図書館のオープンデータ
• 図書館の情報資産を開放する
• 書誌・所蔵・典拠
• 何のために?
• 図書館のサービス向上のため
• 横断的な検索・アプリ…
• 社会に対する知識の提供
書誌データのオープン化
• 構造化されたデータがすでに存在している
• MARCの整備(規格面・運用面)
• ネットワークを通じた情報流通も実現済み
• 書誌ユーティリティと業務システム・OPACの連携
• →図書館コミュニティの継続的な努力の成果
• 各国の取り組み
• ドイツ国立図書館・英国図書・フランス国立図書館
• 国立国会図書館
• WorldCat
• NACSIS-CAT/CiNii Books
CiNii Booksのデータ
<rdf:Description
rdf:about="http://ci.nii.ac.jp/ncid/BB02488158#entity">
<foaf:isPrimaryTopicOf rdf:resource="http://ci.nii.ac.jp/ncid/
BB02488158.rdf"/>
<dc:title>セマンティックWebプログラミング</dc:title>
<dc:title xml:lang="ja-hrkt">セマンティック Web プログラミング
</dc:title>
<dcterms:alternative>Programming the semantic web
</dcterms:alternative>
<dc:creator>トビー・セガラン著 ; 玉川竜司訳</dc:creator>
<dc:publisher>オライリー・ジャパン</dc:publisher>
<dc:language>jpn</dc:language>
<dc:date>2010</dc:date>
<foaf:topic rdf:resource="http://ci.nii.ac.jp/books/search?q=
セマンティックウェブ" dc:title="セマンティックウェブ"/>
<cinii:ncid>BB02488158</cinii:ncid>
<dcterms:hasPartrdf:resource="urn:isbn:9784873114521"/>
</rdf:Description>
<rdf:Description
rdf:about="http://ci.nii.ac.jp/ncid/BB02488158#entity">
<foaf:maker>
<foaf:Person rdf:about="http://ci.nii.ac.jp/author/DA15839119">
<foaf:name>大向, 一輝</foaf:name>
<foaf:name xml:lang="ja-hrkt">
オオムカイ, イッキ
</foaf:name>
</foaf:Person>
</foaf:maker>
</rdf:Description>
http://ci.nii.ac.jp/ncid/BB02488158.rdf
http://ci.nii.ac.jp/ncid/BB02488158
NACSIS-CATのオープン化
• 制度面の検討
• 過去のデータのライセンスの主体は誰か、どのように意思
決定するか
• 規約の洗い出し→該当の条項は存在せず
• 「大学図書館と国立情報学研究所との連携・協力推進
会議」とNIIの協議体制を確立
• データ公開の主体をNIIとする
• 書誌データのライセンスをCC BYとする
• パブリックコメント(2013.12∼2014.1)
• オープンデータの公開(2014.7)
NACSIS-CATのオープン化
• 技術面の検討
• データフォーマット
• 表形式・ツリー形式・グラフ…
• 書誌情報を適切に表現できる手段は?
• データモデル
• 属性名・要素同士のつながり方
CiNii Booksの書誌モデル
NDLサーチの書誌モデル
典拠・ID・シソーラス
• 典拠・IDのオープンデータ
• LC Linked Data Service
• Web NDL Authorities
• VIAF:著者名典拠データの国際連携
• 世界中の図書館で同じ作者に同じIDを与える
• 各国語版のあらゆる著作を集められる可能性
• シソーラス
• dewey.info:DDCのオープンデータ化
• NDCオープンデータ化(期待!)
• MeSH Terms
つながるデータ
国立国会図書館
アメリカ議会図書館
Wikipedia日本語版 Wikipedia英語版
つながるデータの姿
LinkingOpenData clouddiagram, byRichardCyganiakandAnjaJenvtzsch. http://lod-cloud.net/ CC BY-SA
大規模データベースのオープン化
• Europeana
• 欧州の図書館・博物館・美術館2300館以上、3000万件以
上のメタデータを提供
• NDLデジタルコレクション
• 東寺百合文書
• 国文学研究資料館「歴史的典籍に関する大型プロジェクト」
• 30万点のデジタル化、オープンデータでの提供
http://www.lib-yamanakako.jp/list/20130610.html
図書館のオープンデータ
• 業務の中にある「かけがえのない情報」をオープンに
• 地域・郷土資料の書誌情報
• OPACから引き出し、使えるように
• レファレンス事例
• レファレンス協同データベース経由
• イベント・展示
• 本のリスト・写真…
• 一時的に作られる情報をアーカイブに、資産に
• 図書館自らが新たな情報をつくりだす
• ししょまろはん・残念な日本地図
• Wikipediaタウン
知識インフラとしての図書館データ
• 目に見える情報
• どのような資料が存在しているか(目録)
• 資料に関する基本事項(書誌)
• 情報源の多様化
• 出版社・オンライン書店・検索エンジン・ソーシャル
メディア…
• 情報発見環境としては明らかによくなっているが、図
書館の相対的重要性は…?
• 目に見えない情報
• 作品間の関係
• おすすめ
データを公開しない理由(1/5)
• 無関心
• 誰も気にしていない
• コミュニティからの支援が得られない(市民ハッカーがいない)
• 混乱
• 明確な事例がない
• データを何のために使うのかわからない
• どんなデータが必要とされるのかがわからない
• データを公開する前に、どんな便益があるか明確にしてほしい
• 今のシステムで十分だ
• 人々を混乱させるだけだ
データを公開しない理由(2/5)
• 困難
• とにかく複雑で難しい
• 大量のバックログを抱えている
• ついていけない、時間がない、変化が早すぎる
• データの量が膨大である
• 自分の時間の大部分が取られてしまう
• 費用
• 予算がない
• スタッフ問題
• それは私の仕事ではない
• 私の上司や政治家はデータ公開を望んでいない
• やり方を知っている人がいない
データを公開しない理由(3/5)
• 合法性
• データや記録を公開する法的な権限を持っていない
• このデータを公開すれば、市民は私たちを訴える
• 私たちはデータに対する権利を持っていない
• 私たちがデータの所有者なのかどうなのかわからない
• データは販売するべきである。もし売りたくなったらどうすればよいのか?す
でに売っている
• 機密データではないが、公開することでよいPRになるとは思えない
• 私たちの弁護士は特別なライセンスを付与するべきだと言っている
• このデータを集めるのに、膨大な時間・人・資源を投入した
• なぜデータを必要としているのかを知りたいので、直接窓口に来てほしい
• 誰かがパッケージングし直して売り払ってしまうのではないか
• データをだれが利用して、何を行ったのかをコントロールしたい
• 連邦政府や他の政府機関がすでにデータをもっているので、そちらから入手し
て欲しい
データを公開しない理由(4/5)
• 正確さ
• データを一括して公開すると、だれかがそれを変更してしまう
• データを公開したりすると、私たちがハックされる
• データを公開すると、やり方によっては人々が誤解する危険がある
• 市民が混乱する、データの品質がそもそも高くない
• プライバシー
• プライバシー保護の懸念があり、データを公開できない
• もう既に公開している
• 窓口やプロバイダーを通じてすでに公開している
• 情報公開制度があるではないか
• すでに十分にデータは公開している
• APIを提供しているではないか
• データポータルが必要なら、同じようなものはすでにある
データを公開しない理由(5/5)
• その他
• データが優秀な技術者集団や高等教育を受けたコミュニティに利用さ
れると、デジタルデバイド問題がさらに深刻化する
• 今、それは優先事項ではない
• それについてはペンディング状態だ、似たようなプロジェクトもすで
に始まっている
出典: Reasons to Not Release Data, Part 1-Part 10, Sunlight Foundation
(日本語訳: 「公的機関がデータを公開しない理由」OpenKnowledgeFoundationJapan)
オープンデータと図書館
• 見知らぬ他者に委ねることの難しさ
• 事前に投資効果を予測できない
• 予測できないことはやるべきでないか?
• 小さく始めて細かくチェックする
• 持っているものをそのままオープンにする
• コミュニティ・ソーシャルメディアを通じて積極的にア
ピールする
• 情報を価値につなげる仕組みとしての図書館
• 存在意義の認知
• 広く投資を呼び込む
• データを扱うことはそのための第一歩
まとめ
• オープンデータと図書館
• 活用する
• 多様な情報源の把握と利用
• 提供する
• 図書館データの充実とさらなるオープン化
• 作り出す
• コミュニティへの参画を通じて自らデータを作り出す
参考資料
• オープン&ビッグデータ活用・地方創生推進機構
• オープンデータガイド第2版(2015.7)
• http://www.vled.or.jp/news/1507/150730_001192.php
• 地方公共団体情報システム機構
• オープンデータ取組ガイド(2015.3)
• https://www.j-lis.go.jp/kenkai/opendata/h26_opendataguide.html
• GLOCOM
• 智場 No.119 特集 オープンデータ(2014.11)
• http://www.glocom.ac.jp/chijo/119
• 横浜市
• 調査季報 No.174 特集:自治体の未来を切り拓くオープンデータ(2014.3)
• http://www.city.yokohama.lg.jp/seisaku/seisaku/chousa/kihou/174/

More Related Content

オープンデータをつかう図書館、オープンデータをつくる図書館@京都図書館大会(2015.8.17)