ウィキデータ
ウィキデータ(英: Wikidata)はウィキメディア財団が提供する共同編集型のデータベース(知識基盤)である。パブリックドメイン・ライセンスの下で、誰もが使用できるオープンデータを提供することを目的としている[3]。ウィキメディア・コモンズがメディアファイルの格納場所を提供して他のウィキメディアプロジェクトがそれを利用する方法と同様に、データに対してこれを行う。ウィキデータはウィキベースソフトウェアを用いて稼働している[4]。
ウィキデータ | |
---|---|
URL | |
wikidata | |
タイプ | |
分野 | 限定なし |
使用言語 | 複数言語 |
閲覧 | 無料 |
登録 | 不要 |
運営元 | ウィキメディア財団 |
資金 | 一般からの寄付[1] |
営利性 | 非営利 |
設立 | 2012年10月29日[2] |
執筆者 | ウィキメディア・コミュニティ |
編集委員 | なし |
査読制度 | なし |
現状 | 稼働中 |
コンセプト
編集項目
編集ウィキデータは、トピック、概念、オブジェクトなどを表す項目に焦点を当てたドキュメント指向データベースである。各項目は、「QID」と呼ばれる文字Qが先頭に付いた番号で一意に識別される。たとえば「政治」はQ7163である。これにより、項目に必要な基本情報を言語を問わずに入力することができる。
項目の名称となるラベルは重複が可能で、たとえば日本語の「ケンブリッジ」というラベルは、英国、米国(2つ)、ニュージーランドの合計4つの「ケンブリッジ」という都市の項目につけられている。それぞれは説明によって区別される。
項目はラベル、説明、別名、そして文で構成される。
文
編集項目への情報の追加は文を作成することで行われる。文はキーと値のペアとなるプロパティと値で構成されている。たとえば、「牛乳は白い」という文は、項目「牛乳」内でプロパティ「色」に値「白」を設定することで実現できる。
プロパティには複数の値が設定でき、たとえば、マリ・キュリーの「職業」プロパティには、「物理学者」と「化学者」の値を設定することができる[6]。
値は、文字列、数値、メディアファイル、項目など、多くのデータ型を扱うことができ、プロパティには値がとりうるデータ型が設定される。たとえば、「公式ウェブサイト」というプロパティには、「URL」型の値が指定されている[7]。プロパティには、「制約」と呼ばれる、より複雑な規則を定義することもできる。たとえば、「首都」には「単一値制約」が設定されており、首都は1つしかないという現実を反映している。ただし、制約は違反してはならない規約というわけではなく、実際には、データの完全性などをチェックするための補助として扱われている[8]。
また、「修飾子」を使用して、文に追加情報を付け加えて文の意味を絞り込むこともできる。たとえば、プロパティ「人口」に、「2011年時点」と文の適用範囲を限定したいときなどに修飾子を使用する。また、「情報源」を使用して、その文の内容の出典はどこかということを示すことも可能である[9]。
語彙素
編集ウィクショナリーとの統合を開発する過程で、新しいエンティティタイプ、「語彙素」を導入した[10]。語彙素とは、言語学において語彙的意味の単位である。同様に、ウィキデータでの語彙素は、辞書学データの格納に適した構造を持つ項目になる。ウィキデータでは、ある言語の語彙素を、語形と語義とともに格納することができる[11]。
スキーマ
編集歴史
編集このプロジェクトは、アレン人工知能研究所、ゴードン・アンド・ベティ・ムーア財団、そしてグーグルから総額130万ユーロの寄付を受け設立された[13][14]。開発は主にウィキメディア・ドイツによって実施されており、最初の開発計画は3つのフェーズに分割された。
- 言語間リンクの一元化 - 異なる言語同士のウィキペディア記事間のリンク
- ウィキペディアの基礎情報ボックスのデータのための格納場所の提供
- ウィキデータのデータに基づいた一覧記事の作成および更新
初期の展開
編集ウィキデータは、ウィキメディア財団の2006年以降初めての新規プロジェクトとして、2012年10月29日に開始した[15][16][17]。当初は言語間リンクの一元化のみ利用可能で、項目を作成し、基本情報となるラベル、説明、別名と各言語版の記事へのリンクを入力することができた。
ウィキペディアの記事には、他言語版ウィキペディアに同じ主題の記事が存在する場合は、記事同士をつなぐ「言語間リンク」があった。この時点では、ウィキデータはその言語間リンクを格納した自己完結型リポジトリだった。各言語版ウィキペディアは、ウィキデータのデータにまだアクセスできず、言語間リンクを自身で管理していた。
2013年1月14日、ハンガリー語版ウィキペディアで、ウィキデータからの言語間リンクの提供が開始された[18]。その後、1月30日にヘブライ語版ウィキペディア、イタリア語版ウィキペディアに、2月13日に英語版ウィキペディアに、3月6日に他のすべての言語版ウィキペディアへと展開された[19][20][21][22]。2013年9月13日にウィキメディア・コモンズにも言語間リンクが展開された[23]。
文とデータ・アクセス
編集2013年2月4日、ウィキデータの項目に文が導入された。プロパティに指定できる値は、最初は項目とコモンズの画像のみの2種類に制限され、位置情報や日付などのその他の種類のデータ型は後に追加された。3月6日に、初めての新しいデータ型(文字列)が導入された[24]。
2013年4月25日から5月27日にかけて、各言語版ウィキペディアに対してウィキデータのデータにアクセスする機能が段階的に提供された[25][26]。
2015年9月15日、ウィキデータは、項目と直接関連していない項目のプロパティへの、いわゆる任意アクセスを有効化した。たとえば、「ベルリン」というウィキペディア記事から「ドイツ」に関するデータを読むことが可能になった[27]。2016年4月27日、ウィキメディア・コモンズで任意アクセスが有効となった[28]。
クエリ・サービス
編集2015年9月7日、ウィキメディア財団はウィキデータ・クエリ・サービスを発表した[29]。これは、問合せ言語としてSPARQLを使用する。また、2018年11月の時点で、その他の方法でデータを検索できるツールが少なくとも26種類開発されている[30]。
評価と利用状況
編集2014年11月、ウィキデータは「その規模と備わったオープン性」に対してオープンデータ研究所からオープンデータ・パブリッシャー・アワードを受賞した[31]。2014年12月、Googleはウィキデータを支持し、自社のFreebaseを閉鎖しウィキデータにデータを移行することを発表。2016年5月にFreebaseは終了した[32] 。
2018年11月の時点で、ウィキデータの情報は英語版ウィキペディアの全記事の58.4%で使用されており、その大部分は外部識別子や位置座標である。全体としてウィキデータからのデータは、ウィキペディアのページの64%、ウィキボヤージュ記事の93%、ウィキクォートの34%、ウィキソースの32%、そしてウィキメディア・コモンズの27%で表示されている。その他のウィキメディアプロジェクトでの利用も推奨されている[33]。
2018年11月の時点で、ウィキデータのデータを視覚化する外部ツールが少なくとも20種類[34]あり、ウィキデータに関して少なくとも100の論文が発表されている[35]。その重要性は多くの文化機関で認められている[36]。
GLAMとの連携
編集図書館や美術館、博物館などいわゆるGLAMと連携する動きが高まっている。ウィキデータは無料、パブリック・ドメイン(CC0)という特徴から、各機関のデータセットのハブとしての役割を担うようになってきている。各組織は、それぞれのデータセットに一意の識別子を保持している。これらのIDをすべてウィキデータに追加することで、多数のソースのデータにシームレスにアクセスできるようになる[37] 。
2019年5月、アメリカ議会図書館はNAFとLCSHの約100万件にウィキデータへのリンクを追加し、標準データを統合すると発表した[38]。
ロゴ
編集出典
編集- ^ 詳しくは寄付のページを参照のこと。
- ^ “Wikidata’s tenth anniversary has been celebrated in Tamale, Ghana, by the Dagbani Wikimedians User Group and two of its sister communities” (18 11月 2022). 4 10月 2024閲覧。 “Wikidata went live on October 29, 2012”
- ^ Catrin Schoneville (March 30, 2012). “Data Revolution for Wikipedia”. Wikimedia Deutschland. 2018年1月30日閲覧。
- ^ “Wikibase — Home”. 2018年1月30日閲覧。
- ^ ビデオゲーム The Elder Scrolls IV: Oblivion wikidata:Q49607
- ^ “Help:Statements”. 2019年9月20日閲覧。
- ^ “Help:Data type”. 2019年9月20日閲覧。
- ^ “Help:Property constraints portal”. 2019年9月20日閲覧。
- ^ “Help:Sources”. 2019年9月20日閲覧。
- ^ “First experiment of lexicographical data is out”. 2020年2月10日閲覧。
- ^ “Wikidata - Lexicographical data documentation”. 2019年9月20日閲覧。
- ^ “Shape Expressions arrive on Wikidata on May 28th”. 2020年2月10日閲覧。
- ^ Dickinson, Boonsri (March 30, 2012). “Paul Allen Invests In A Massive Project To Make Wikipedia Better”. Business Insider 2018年1月30日閲覧。
- ^ Perez, Sarah (March 30, 2012). “Wikipedia’s Next Big Thing: Wikidata, A Machine-Readable, User-Editable Database Funded By Google, Paul Allen And Others”. TechCrunch 2012年10月24日閲覧。
- ^ Wikidata (Archived October 30, 2012, at WebCite)
- ^ Pintscher, Lydia (30 October 2012). "wikidata.org is live (with some caveats)". wikidata-l (Mailing list). 2012年11月3日閲覧。
- ^ Roth, Matthew (March 30, 2012). “The Wikipedia data revolution”. Wikimedia Foundation 2018年1月30日閲覧。
- ^ Pintscher, Lydia (14 January 2013). “First steps of Wikidata in the Hungarian Wikipedia”. Wikimedia Deutschland. 17 December 2015閲覧。
- ^ Pintscher, Lydia. “Wikidata coming to the next two Wikipedias”. Wikimedia Deutschland. January 31, 2013閲覧。
- ^ Pintscher, Lydia (13 February 2013). “Wikidata live on the English Wikipedia”. Wikimedia Deutschland. 15 February 2013閲覧。
- ^ Pintscher, Lydia (6 March 2013). “Wikidata now live on all Wikipedias”. Wikimedia Deutschland. 8 March 2013閲覧。
- ^ “Wikidata ist für alle Wikipedien da” (German). Golem.de 29 January 2014閲覧。
- ^ Lydia, Pintscher (23 September 2013). “Wikidata is Here!”. Commons:Village pump
- ^ Pintscher, Lydia. “Wikidata/Status updates/2013 03 01”. Wikimedia Meta-Wiki. Wikimedia Foundation. 3 March 2013閲覧。
- ^ Pintscher, Lydia (27 March 2013). “You can have all the data!”. Wikimedia Deutschland. 28 March 2013閲覧。
- ^ “Wikidata goes live worldwide”. The H. (2013年4月25日). オリジナルの3 January 2014時点におけるアーカイブ。
- ^ Lydia, Pintscher (16 September 2015). “Wikidata: Access to data from arbitrary items is here”
- ^ Lydia, Pintscher (27 April 2016). “Wikidata support: arbitrary access is here” 30 August 2016閲覧。
- ^ “Announcing the release of the Wikidata Query Service”. 2018年11月15日閲覧。
- ^ “Wikidata Query Data tools”. 2018年11月15日閲覧。
- ^ “First ODI Open Data Awards presented by Sirs Tim Berners-Lee and Nigel Shadbolt”. 2016年3月24日時点のオリジナルよりアーカイブ。2018年11月15日閲覧。
- ^ “From Freebase to Wikidata: The Great Migration” (PDF). 2020年2月10日閲覧。
- ^ “Percentage of articles making use of data from Wikidata”. 2018年11月15日閲覧。
- ^ “Wikidata Tools - Visualize data”. 2018年11月15日閲覧。
- ^ “Scholia - Wikidata”. 2021年12月3日閲覧。
- ^ “International Semantic Web Conference 2018”. 2018年11月15日閲覧。
- ^ “ARL White Paper on Wikidata Opportunities and Recommendations” (PDF). 2020年2月10日閲覧。
- ^ “Integrating Wikidata at the Library of Congress”. 2020年2月10日閲覧。
- ^ commons:File talk:Wikidata-logo-en.svg#Hybrid. Retrieved 2016-10-06.
関連項目
編集外部リンク
編集- 公式ウェブサイト
- ウィキデータ・クエリ・サービス
- ウィキデータ (Wikidata) - Facebook
- ウィキデータ (@wikidata) - X(旧Twitter)