図書の網

@lumelyのブログです.概ね研究や教育の話を書きます.

2017/01/23 openBDセミナー 質疑応答文字起こし

2017/01/26 14:23修正:
facebookのグループ,openBD 情報共有にて,語研の高島様から「JPコード」となっている部分は「JP-eコード」のことであること,また最後の質問者はリブライズの河村氏であることをご本人からご指摘頂きましたので,そのように修正いたしました.


2017/01/26 01:10修正:
ゴケン(?) タカシマとなっていた箇所について,株式会社語研の高島利行氏ではないかというご指摘を頂きましたので,そのように修正いたしました.


こんにちは,lumelyです.

最近,趣味の一環として漫画を集めているのですが,中々読む暇がありません.1,000冊は本棚からオーバーフローして現在床に平積みになっている状態なので,卒業・修了等で本棚を廃棄する予定の筑波大生がいれば是非ともお声がけください.

先日の2017年1月23日にNIIにて,「書誌情報・書影を自由に」と謳うAPIであるopenBDのセミナーが開催されました.行く前の所感としては(結果的に)中小出版社の集まりである版元ドットコムのAPIがカーリル協力のもと高速になりました,くらいの話かと思っていたのですが,その実体はJPROを巻き込むことにより,日本の出版界の未来を左右するといっても過言ではない一大プロジェクトだと認識しました.

セミナーのほぼ全ての様子は既に公式にカーリルのスタッフによってYouTubeにアップロードされていますが,書籍のユニークキーのはずなのに現実にはユニークキーとして機能しないISBN,めちゃくちゃな書誌データに悩む関係者や,このopenBDプロジェクトのみならず日本の書誌データの未来に関する展望など,非常に有益な議論が質疑応答で行われていましたので,是非とも多くの人に読んで頂きたいと思いその全文を文字起こししました.

www.youtube.com

この文字起こしは公式にopenBDプロジェクトに問合せし,そのご厚意により公開許諾を頂いているものですので,その権利はopenBDプロジェクトにあります.ただし,ところどころURLを貼ってはおりますが,特に人名あたりは聞き取りにくい部分があったため,間違いがあるかもしれません.それは全て書き起こしを行った私の責任です.もし何かお気づきの点があれば池田光雪( mitsu[at]lumely.me )までお知らせいただければと存じます.

ちなみに,京都府立図書館の福島様から言及のあった書誌データのクリーニングは,L-Crowdというクラウドソーシングを使った図書館ボランティアを試みるプロジェクトのメンバーとして私も携わっています.ちょっと今は諸事情によりまだタスクを開始できていないのですが,本当にじきに,おそらく1月中くらいにはタスクを配信開始する予定ですので,その際は是非ともよろしくお願いいたします.

2017/1/23 openBDセミナー質疑応答部分書き起こし
書き起こし:池田光雪

「えー」などの言葉や言い直された言葉,質問者の交代時のやり取り等,本筋に関係ないと思われる部分は省略した.

----------------------------------------------------------
【質疑応答開始】
【https://www.youtube.com/watch?v=hh662-x-Bjg#t=1h29m12s】
((株)カーリル ふじた)
はい,それでは残りの時間は質疑応答ということなんですけども,7ページの右側の段にある申込みの際に頂いた質問というところからやればいいですかね.

黒丸がついている質問2つ,「ISBNが存在しない電子オリジナルの作品も,DBへの追加は検討されているのでしょうか」,また「ISBNのないタイトルも扱われるのでしょうか?」ということなんですけども,お願いします.

(版元ドットコム/ポット出版 沢辺)
収集の方は版元ドットコム役割分担なんで僕の方からお答えさせて頂きます.電子書籍も計画はしていますが,さっき言ったように,電子書籍の書誌データに一意なユニークコードをどっから,何を使うかどう使うか,非常に悩ましい問題に今ぶち当たっていまして,それらも研究しながら実装には取り組んでいきたいと思っています.

それから,ISBNにないのは現時点で想定にありませんでした.が,これは皆さんで育てて頂けると嬉しいと思っているopenBDですので,「こうした種類の資料があるのだが,これらを扱えないの?」というような提案があれば,それらのユニークキーをどうするのかとかどこから情報を持ってくるのかっていう流通経路も考えなければいけないので,考えながら取り組んでいきたいと思っていますので,全くやりませんという,現在検討はしていませんが,取り組む,みなさんからのご要望に応じて取り組むなどのことはやっていきたいと考えています.

(ふじた)
ありがとうございます.ではフロアの方から質問したい方挙手を.

----------------------------------------------------------
【質問者交代のやり取り省略】
【https://www.youtube.com/watch?v=hh662-x-Bjg#t=1h31m23s】
(ふじた)
はい,ではお願いします.

(同志社大学 原田)
名前は挙げるんですか?

(沢辺)
名前と所属を.

(原田)
同志社大学の原田と申します.
こういうの最初から期待していたので,今日はとても楽しくてですね,どんどん広がっていって頂きたいと思うのですが,補足のお話が1つと,それから質問と,3つ,2つほどさせて頂きたいんですが,まずあの,国会図書館のデータが一か月という話,まあ嘘ではないんですけども,実は4日目で提供しています.ですから,発行されてから4日間で国会図書館はデータを提供し,それらを修正した上で完全版を一か月後に出していると,いうお話であるのは,まあこれは補足のお話です.

----------------------------------------------------------
(原田)
確認しておきたいことが1つあって,先ほど見せていただいた7ページの図なんですけども,これ,見せていただいたときに,7ページじゃなかったかな.こっちだ.4ページだな.4ページの図なんですけれども,openBDで発信する書誌データの収集時期というお話が書いてあるんですが,これ,あくまで収集時期のお話なので,実際にJPROの配信データは,これは配信型だけれども,それ以前に入ってきて,最終的にこのopenBD上に残るという風に考えていいんですよね?

(沢辺)
はい,残してます.

(原田)
そういうことですよね.だからこれはあくまで配信させて,

(沢辺)
6年前から残ってます.

(原田)
ということですね.なので配信時期がこういう時期だけであって,ちゃんと残っているということですね.はいわかりました.

----------------------------------------------------------
(原田)
質問の方はですね,ISBNなんですけれどもISBNが同じ本というのが2つあった場合,というか実際存在するんですけれども,この場合に,先ほどISBNがユニークキーだとおっしゃったんですが,ユニークキーだとすると両方とものデータが返ってくるのでしょうか.それとも,別の方法があるんでしょうか.ISBNの,ユニークのことを教えて頂ければと思います.

(版元ドットコム/㈱ラング 大江和久)
今版元ドットコムの方ではですね,実はそれは考慮していないといいますか,1つの管理でしかまだできていません正直.なので,1個しか返りません.

(原田)
どれが返るかというお話に関してはわからないということですか.

(大江)
わからないです.要するに配信されたものをそのまま受け入れてますので,基本的に上書きされます.後から来たものが上書きされます.

(原田)
後から来たものが上書きされるということですか.ということは,後から来てしまえば中身は書き換えられてしまうと.

(大江)
書き換えられてしまいます.今現状ではそうです.ただ,それについてどう対策するかはちょっと今まで検討中ではありますけども.

(原田)
ありがとうございます.

----------------------------------------------------------
【質問者交代のやり取り省略】
【https://www.youtube.com/watch?v=hh662-x-Bjg#t=1h29m12s】

(筑波大学 高久)
筑波大の高久と申します.2点あるんですけど,1点目はちょっとテクニカルな確認なんですけど,今ちょっとAPI叩いてみたところだと,出版日が結構欠けているデータが見受けられるんですけどこれは今準備中みたいな感じなのか,それとも結構元データに問題があって捕捉できていないというお話なのか,どっちなんでしょう.

(沢辺)
発売日の話,だよね.捕捉できていません.なので,そういう意味では書影も,さっきもパーセンテージとかを色々と言いましたけど,書影が無い本だとか,まだまだいっぱい,不足しているものはあります.

ので,僕らが,特に僕らの立場かな,出版という業界にいる立場から言えば,それらをもっと出版社が本当に出すような環境を作るためにも,こういうところで「おいあそこの出版社年中書影ねーぜどうなってんだよ」っていう,クレームをですね,みなさんからいっぱい出ていただくことによって,対応しなきゃまずいんじゃないの,っていう風にしていきたいと考えています.

----------------------------------------------------------
(高久)
はい,是非.
もう1点は,やっぱりみなさん多分気になっているのは権利周りなんだろうと思っていて,どういう方向から聞けばいいかよくわかっていないんですが,これ自体はopenBDのデータを使ってさらに再利用していくことに関してはopenBDがこれはオープンであると,宣言して頂いたと思っていいんでしょうか.

(沢辺)
版元ドットコムが宣言していると思っています.それは版元ドットコムが,どうぞ書誌,書影はみなさんご随意にお使いください,ただしまあもちろん,書影のイラストの部分だけを使って,何か,別なものに使うとかっていう使い方は当然これ著作権法上バツですが,版元ドットコムのWebサイトでは,ここに載っている書誌書影はみなさんどうぞご自由にお使いくださいと,いう風に宣言していますので,openBDプロジェクトとしては,その版元ドットコムが公開している情報を,よりみんなに使っていただけるような形にするというのがopenBDプロジェクトの役割分担目的だと考えています.

【回答者交代のやり取り省略】
((株)カーリル 吉本)
規約の話だけしたい.
とはいえですね,カーリルという立場からもですね,これどういう風に使えるのかっていうことを明確にすることはとっても重要なことだと,いう風に考えてまして,もちろん,これ完全にいわゆるオープンデータ,CC-BYとかCCなんとかっていうような類のものではないということなんですね.それぞれ権利者があって,まあ下手すると出版社もそういう権利ないっていうケースもありますので,ではなくって,販促のためにある程度,要するに使うことを許諾,まあ黙認っていったらおかしいですね,なんとなくみんないいよっていう情報なんだけど,ここをいかに明確にしていくか.この利用規約の部分,要は細かく突っ込んじゃうとダメなことがいっぱい出ちゃうんだけど,実際には使っていいよという思いをちょっとどうやって規約にしていくかというところは今考えているところです.なのでちょっとこの利用規約というかポリシーについてはなるべく早い段階で公開していきたいという風に思っています.

----------------------------------------------------------
【質問者交代のやり取り省略】
【https://www.youtube.com/watch?v=hh662-x-Bjg#t=1h37m30s】
(NII 大向)
NIIの大向といいます.
丁度その画面なんですけども,カバレージでその全,要するにAPIを叩ける全ての書誌のISBNのリストだと思いますけども,これが,たとえば3日後,5日後ってどんどん変化していくときに,そのアップデートが取れるのかとか,何か書誌の中身が変わりましたみたいなことがこういう方法で何か通知を受けられるのか,もう自前で全部取って,そういうのは自分で考えろってのはどっちがあるべき姿なんでしょうか.

(吉本)
これ難しいところで,考えないといけないですねって思うんだけど,現時点のデータ量だと,毎日全件取っていただいて構わないんじゃないかという風に考えております.

(大向)
じゃあそうします.はい.

(沢辺)
基本的にキャッシュとかに頼って更新するとかっていうことから開放されたいよっていうのは,解放されたいキャッシュとかそういうのから解放されたいよってそういうことを気にして,同期をどうすんだってことから解放されたいよってことを考えてくれたんだよねカーリルくんは.ですよね.

(吉本)
どっちの方向性でも,要するにこれに頼っちゃうっていう方向性でも,取っちゃって自分で使うっていう方向性においても,そこをなるべくシンプルにしようと.なぜならそこにかかるコスト,いわゆるコンピュータの資源だったり,ネットワークの資源だっていうものは,これまでの書誌情報の考え方に対すれば,極めて,潤沢になってきているので,あまり考える必要はないんじゃないかという風に考えております.

(大江)
あとすみません1つ補足で,基本的にこの情報は当然増える一方なはずなんですけども,中には,無くなる可能性もあります.これはあの実際に,これ今JPROの方のデータっていうのは,あくまで出版予定の本が入ってきてますので,予定だけど中止になっちゃったっていうケースは当然あり得ます.そうすると情報はあったんだけど無くなってるっていうケースも当然出てきます.その場合は今何も返らないようになってますよね.

その場合は,だから元あった,いったん取ったものでも,そういうのは消して頂きたいと.だからもう既に取れなくなったものっていうものは出版中止だったりするものなので,そういうものは取れなかったら消していただくっていうのを基本的にそういう風にお願いしたいところです.

----------------------------------------------------------
【質問者交代のやり取り省略】
【https://www.youtube.com/watch?v=hh662-x-Bjg#t=1h39m57s】
(原田)
2回目なのでちょっとすみません,先ほどの高久さんのお話しのことが聞きたいのですけれども,先ほど沢辺さんの方から,版元ドットコムの責任にもってという風におっしゃったんですが,これは版元ドットコムの会員社のお話なんでしょうか.それともJPOのお話についてもということなんでしょうか.使うときに片一方に限らなければいけないのは大変なのでそれはこっちで,

(沢辺)
いえいえ両方です.版元ドットコムはJPOの,あれ何社っていうんだろうな,JPOっていう組織構成員であり,

(原田)
わかりました.使う方はしたがって気にせずに使っていいですよっていう風におっしゃっているという意味でしょうか.

(沢辺)
そうです.

----------------------------------------------------------
【質問者交代のやり取り省略】
【https://www.youtube.com/watch?v=hh662-x-Bjg#t=1h40m43s】
((株)トーハン ノジマ)
すみません,トーハンのノジマと申します.宜しくお願いいたします.
今日はありがとうございます.

収録範囲についてお伺いしたいんですけれども,今は版元ドットコムさんとあとJPROさんが主体になっていると思うんですけど,これ,中で国会さんのデータを補完的に使いますという風に書いてあるんですが,これたとえばその,具体的にどういう風に補完するかっていうお話ですね.極端な話ですけど,たとえば,1日300点本が出ましたと.その中でJPROさんと版元ドットコムさんで200点カバーしましたと.残り100点を全部国会さんの方から持ってきますよというそういうお話なのか,どの辺のことを想定されているかちょっとお聞かせいただきたいんですが.

(大江)
今現在,積極的な収集方法としては,JPROからのデータと,それから版元ドットコムの会員社が入力するデータっていうのが積極的な,あの,あれです.それ以外,補完的という風に今言っているのは,基本的に,検索されたりして,無かったら探しに行くという形になってます.

なので,全件の出版情報をどっかから持ってきて,それをまとめて丸々,
あのサーチして探すというやり方は今はしてません.ただ,その積極的に取る方向も,今まではJPROと会員社なんですけども,今後,出版社のサイトですとか,そういうところに広げていこうという計画は今してます.

【回答者交代のやり取り省略】
(吉本)
そういう意味では書評情報とかああいうもので,版元会員社以外についてもデータ提供しているものがあるので,そういうものの規定も多少必要になってくるっていうところで,基本的な項目を整備しているっていう認識でいいんですかね.

----------------------------------------------------------
(ノジマ)
もう1個今思い出したんですけど,さっき版元ドットコムさんのデータはじゃんじゃか使って頂いて構わないよというお話だったんですが,これはまあ,もちろんJPROさんからのデータっていうのもいっぱいあると思うんですね.版元ドットコムに非加盟の版元さんですけども.そこのデータっていうのはじゃんじゃか使っていいよっていう風に認識してよろしいのでしょうか.

(沢辺)
ごめん,JPRO経由のデータもじゃんじゃか使っていいよって言ってるかってこと?

(ノジマ)
そうですね.まさに加盟されていない版元さんのデータですね.

(沢辺)
はい,どうぞじゃんじゃか使ってください.

(ノジマ)
ありがとうございます.

(沢辺)
ただ,トーハンさんはJPOを受信してますけどね.

(ノジマ)
はい,トーハンMARCの作成に大いに役立たせていただいております.

----------------------------------------------------------
【https://www.youtube.com/watch?v=hh662-x-Bjg#t=1h43m10s】
((株)BOOK WALKER ヤナセ)
すみません,BOOK WALKERのヤナセと申します.

非常に有用なAPIとして活用させて頂きたいと思うんですけども,先ほど規約は今後整備というというところはあると思うんですけども,早速利用した場合に,マストではないけれどもたとえばどっかから情報を取ってますみたいな表記なり,こういう風な,出すにあたってこういうことをしてもらえるとありがたいというのがもしあればそれをお伺いしたいというのがあります.特にそのデータだけ抜いて,データだけ自体を表示して終わりでいいのか,それともどっかから取ってますみたいな,

(大江)
いちいちそのデータのところにopenBDから取りましたみたいな表記を
しなきゃいけないっていう風には今は考えていない.

(ヤナセ)
マストではないけども,して貰った方がうれしいのであれば是非そういうようなところを.

(大江)
たとえばサイトのどっか隅の方に,入れていただくとそれはうれしいかもしれません.

(ヤナセ)
なるほど.

(沢辺)
うれしいけどまあ,今回はそういうことよりも,ともかく使ってもらっているっていう実態がより増えた方がいいなっていうニュアンスではいますよね.

(ヤナセ)
なるほどわかりました.ありがとうございます.

----------------------------------------------------------
【質問者交代のやり取り省略】
【https://www.youtube.com/watch?v=hh662-x-Bjg#t=1h44m29s】
(個人参加 ナカムラ)
個人参加で申し訳ない,ナカムラと申します.

書影の情報でちょっと細かい話なんですけど,画像のID,まあ数字,羅列ありますけど,これって一度決まったら変わるもんですか?

(大江)
画像のID?URLはISBN.

(吉本)
現時点では,ISBNをつけて呼べば,ある場合は返るし無い場合はNot Foundになるってことなんですが,ちょっとこれまだ詰めきれていない部分があって,データとしてはあるんですけども,どういう風に配信してったらもうちょっと使いやすくなるか,っていうところはもうちょっと揉んでいるところです.で,それの状況によって,APIからURL取ってそれを使うのか,あるいはそのまま貼っちゃって動くのかってとこはちょっと,追々,決めさせてください.

基本的には画像,URLにIDをなんか貼ったらパコって出てきた方が楽だということは重々承知の上で,ちょっと運用との兼ね合いで検討します.

(ナカムラ)
お願いいたします.ありがとうございます.

----------------------------------------------------------
【質問者交代のやり取り省略】
【https://www.youtube.com/watch?v=hh662-x-Bjg#t=1h45m49s】
(コンテンツ・プランナー(株) カミムラ)
コンテンツ・プランナーのカミムラと申します.
本日はありがとうございます.
私どもの方では,現在版元ドットコム様の方のAPIを使わせて頂いているのですが,こちらのAPIが,本日公開になったopenBDのAPIの公開に伴って,何か変更になったりとか,一本化とかそういったような話というのはあるのでしょうか?

(沢辺)
あの,全くありません.

(カミムラ)
このまま使っても今のところは問題ないということでしょうか,

(大江)
ただ,正直,多分版元ドットコムのAPIは実はあんまり速くなくてですね,こちらの方が先ほどの話にもありますように全然速いと思います.

(沢辺)
これをやろうとしたきっかけの,個人的な理由の1つは,版元ドットコムでおんなじことを,全く同じデータをAPIで公開しているんですよ.なんだけど,カーリルと版元ドットコムが組んでセミナーをやると,みなさんのようにいっぱい集まってくれたんだけど,版元ドットコムがおんなじことやってても何にも,あの,御社くらいですね.いやいや,何社か,もうちょっと,御社くらいじゃない,もう何社かあったんですけど.だから,これは,このAPIをもっと広げたいと,いう目的でやったのも事実ですし,

それからもう1つは,いま大江さんが言ったようにスピードの問題も,もっともっと速くさせるっていうことも目的の1つで,じゃあ,よし
【ここで映像が飛ぶ】
ただ,実用上こちらの方に切り替えてもらうと,多分そちらもより,良くなるような気はいたします.

(カミムラ)
ありがとうございます.

----------------------------------------------------------
【質問者交代のやり取り省略】
【https://www.youtube.com/watch?v=hh662-x-Bjg#t=1h47m45s】
((株)教育システム ナガオ)
株式会社教育システムのナガオと申します.すばらしい取り組みだと思います.本当お疲れ様でございます.
先ほどの質問ともちょっと関わりがあるんですが,やっぱり「powered by なんとか」みたいなロゴを作ってくれるとより宣伝になっていいんじゃないかっていうこれはお願いに近いものなんで,是非作ってください.回答なくてもいいです.

(大江)
まだ間に合ってない.

(沢辺)
ありがとうございます.じゃあ,あくまで自分たちが目立ちたいからじゃなくて,セミナーでそういう風に言っていただいたのでやるという.非常にあの,ありがとうございます.

(ふじた)
はい,デザイナーが頑張りますということで.

----------------------------------------------------------
【質問者交代のやり取り省略】
【https://www.youtube.com/watch?v=hh662-x-Bjg#t=1h48m27s】
((株)堀之内出版 コバヤシ)
堀之内出版のコバヤシです.

版元ドットコム会員で,沢辺さんたちにも直接的にお世話になっているのであれなんですけども,やっぱり仲間内というか知り合いで,一人出版社で,版元ドットコムとか,JPROも,入っといたらいいんだろうし,そのぐらい払ってほしいっていうのはあると思うんですけど,やっぱり会員社でないところっていうところの情報の入手,さっきもご質問もあったかと思うんですけども,書誌情報の入力に関して,そういった版元会員社でないところへ開放するご予定だとか,そういったことっていうのはご計画があるでしょうか.お考えがあるでしょうかといったことをお聞きしたかったんですが.

(沢辺)
それは主に版元ドットコムに対する質問だと思うんですけど,これについては,何の,いいとかやるとかやらないとか,何の考えも今のところ多分ないので,版元ドットコムの組合員社,役員社みたいなのがあるんですけど,そこに言ってみたらどうでしょうか.是非そこでご解決をお願いしたいと思います.

(コバヤシ)
わかりました.提案できればさせて頂きます.

----------------------------------------------------------
【質問者交代のやり取り省略】
【https://www.youtube.com/watch?v=hh662-x-Bjg#t=1h49m58s】
(個人参加 道広)
道広といいます.

版元が作った書誌データって結構間違っていると思うんですけど,どんな風に品質を確保していくんでしょうか.

(沢辺)
もちろん自覚しております.版元が作った書誌情報は間違っているし,世に流通している書誌情報はいっぱい間違えてますよね.版元ドットコムでは,この書誌情報について間違えを見つけた場合,通報システムってあるんですよ.そこにも,いろいろ通報が来ますね.それは大体出版社出自のものであるわけだから,間違えたのは出版社であるっていう可能性が極めて高いんですが.ただし,これはopenBDプロジェクトとして議論していないんですが,多分,八割方共有できるとは思う考え,僕個人による部分も,意見になってしまうとこもあると思うんですけど,それは,僕は,第二段階第三段階だと思っています.

既に,今日この会場を色々,国立情報学研究所の中で,手配してくれた高野さんとか,書誌情報の様々な間違いについては,さまざまぶつけたり,いろんなことをして,苦労されている方もいっぱい,あと国会図書館の方も実は,原田さんなんかも苦労,困っているぜっていうところはここでは言わないけどさぁみたいなところはいっぱい持ってらっしゃる方,多分出版業界だけではなくて,出版業界も困ってる.で,僕が聞いた一番お笑いネタとしてはですね,ISBNの使い方として,チェックデジットの最後の桁を枝番として使っていたっていう報告がありまして,これはお笑いネタなんですけど,確かにひどいことはいっぱいあると思います.

ただ,僕がopenBDプロジェクトを始めたのはまさにそういう出版社の作ったデータがより以上に世に晒されて,世の中で見えることになって,その結果,間違えの指摘が,間違えが修正されていくと,いう回路を作っていく,1つの大きな回路にしたかったなというのがあるわけです.で,さっきの吉本君が説明していましたが,みなさんのところでローカルにダウンロードしてしまったり,キャッシュを使ったりしたりしたら,こちらから発信するデータをたとえ直しても,その先では変わらないんですよね.そのためにも,キャッシュレスでやりたいぜってことに「おおっいいねいいね!」って僕も言ったんですけど,それは,そうした間違いを修正してくシステムを,このネットワークの中で組み込みたいな,作っていきたいなと思っているからなので,

質問への直接のお答えは,大変申し訳ありませんが現在では何の考えもありません.ただ,将来,今後,これが普及し,みなさんに使ってもらうことによって,間違えの指摘が増えること,それからキャッシュレスで提供できる,というようなことができていけば,修正をして新しいデータをみなさんのところに瞬時に直させていただくということも可能になっていくので,そのこと,今ご指摘の点については十分に考慮をしているところです.というお答えではいかがでしょうか.

(道広)
当面は間違えを見つけたらどうすればいいんでしょう?

(沢辺)
何も,

(大江)
いや,版元ドットコムの方からいえばいい.

(沢辺)
あの,openBDとしては何もありません.が,今現在は通報システムはありませんが,版元ドットコムのWebサイトでは,一応ささやかに,通報できるボタンをつけています.ただ,これも難しくて,じゃあ版元ドットコムが収蔵しているデータだけ直せばよいのか,というと既にですね,ネット書店あまたあるところに配信されてるんですね.先ほどご質問頂いたトーハンの取次の方のところに言っているデータも,既にもう配信されていて,そのトーハンの社内にあるデータを直す術がないんですよ.

だから,openBDとしてはまだそこは未検討ですが,取り組んでいきたいとは思っているし,版元ドットコムには通報システムがある,そうした,直していくことを,これはですね先ほどから何度か紹介したJPO日本出版インフラセンターとも相談しながら書誌情報をより正確にしていく,それからISBNの間違えとかですね,そういうようなことも修正していって,本当に信頼に足るデータベースをどこかに作るということは考えていかなきゃいけないとは思っていますが,これものすごくでかいことなんですね.
なので,課題にはしますが,前向きな,役人のような,答弁で今日のところは勘弁してほしいというとこです.

(道広)
ありがとうございました.

----------------------------------------------------------
【質問者交代のやり取り省略】
【https://www.youtube.com/watch?v=hh662-x-Bjg#t=1h55m59s】
(京都府立図書館 福島)
すみません,京都府立図書館の福島です.
今の書誌情報の,書誌データの間違えの話で,ご存じのように公立図書館もシステム側の問題と,大体昔から,凄く早い段階からデータベースを作ってた関係で,非常にばらばらの書誌を持っていることはみんな知っていたのですが,今年度ですね,横断検索を高速化したことによってものすごく見えるようになりました.で,今会場に何人も関係者が来ていて,僕が喋るより他の人が喋った方がいいんですが,京都府立図書館はですね,京都内の書誌のデータをですね,国会のデータとかいろんなのとぶつけて,クリーニングをしていこうってことをちょっとやろうとしています.

で,今のところ国会とかですね,府内でまず一回ぶつけてみた.まあ大体流通しているような本はクリーニングされてしまって.要するに連動するキーが,ユニークキーがまた新しくできるのかもしれませんが,できるので,それをまたこちらの方の成果とぶつけ合うことでちょっと楽しい書誌のデータの世界を作れればなと.1コピー1データみたいな表をちょっと言い出しているんですが,そういう風にしていければと思っています.ちょっとこっち側もキーマンが実は吉本さんなので,ともかく彼が死なないようにだけをちょっと心配しているところなのですが,ちょっと今の話をここで言っておいたほうがいいだろうと思ってお話ししました.よろしくお願いします.

(沢辺)
ありがとうござました.おしゃべりな沢辺,僕からも一言言わせていただくと,つまり,今いろんな材料が,書誌情報や書影に関するいろんな様々な情報が,本当に現実に利用可能なような状態のところの戸口に立っていると思うんですね.出版社がこれだけの情報を出して,インターネット上で配信型とはいえ,提供している状態が来るというのは,僕らが2000年に版元ドットコムを作ったときには想定,うーんいつか来るといいねぐらいの話だったわけで,そうしたものもできてますし,今福島さんたちの取り組んでいる書誌情報をクリーニングしてくっていうのを利用者側の立場に立ってやっているという取り組みも出てきているわけですよね.

で,取次さんなど民間企業も含めて,その書誌情報の共通の利用の機運は
どんどん盛り上がっていると思うので,だからこそこのopenBDプロジェクトが,今日構想することが出来てですね,出発することができた環境だと思うので,この道をもっと広げて,進めていきたいなぁという風に余計なおしゃべりをさせて頂きました.

----------------------------------------------------------
【質問者交代のやり取り省略】
【https://www.youtube.com/watch?v=hh662-x-Bjg#t=1h59m04s】
((株)語研 高島利行)
語研の高島と申します,JPOの,出版情報登録センターJPROの普及促進というのもやっております.

ちょっと,今日出た話の中で,規約というか,利用についてのお話なんですけども,JPROの方では利用規約としては,JPROから提供した先で,その先で販売促進等に利用して頂く分には全く問題がないということを当初から規約に謳っている状態です.

書影もそういった問題がないようなものを出してくださいと,いうことでやっておりますので,そこから先で利用して頂くことに,書誌情報それから書影を利用して頂くことについて,特に問題はないという風に考えております.あの,JPOを代表して言っているわけではないので,そういうことになってます.

それから,質問なんですけども,まず1つ目が,現状JPROの書誌情報の中には電子書籍が混ざっています.レコードリファレンス,ユニークIDがJP-eコードを使った形で電子書籍の情報が混ざっているんですけども,今回,このopenBDでは,JP-eコード,そちらのコードの電子書籍も対応しているのか,それとも13桁のISBNコードだけなのか.まずそこをお聞かせください.
【注:JP-eコードとはJPO等が電子書籍への附番を推進している流通コードのこと】

(大江)
そこに関しては取ってません.電子に関しては今.で,電子の方は結局,まあこれもまだ今後の課題なんですけどJPROの方はJPROの方でやっているんですけども,パブリッジですね.あちらの方でも情報の整備を進めてますから,ちょっとそちらの方とにらみながらどういう形でそことまた連携をできるかみたいなことは探っていきたいと思っています.

----------------------------------------------------------
【https://www.youtube.com/watch?v=hh662-x-Bjg#t=2h00m50s】
(高島)
はい,わかりました.
次の質問は,JPROから出している情報は,販売促進に使う情報ということになっていて,その中には外に出してほしくない情報,出さないでくださいっていう情報が含まれています.特に重要なのが情報解禁日っていう日付が設定されていて,情報解禁日以前には,この情報は一切外に流さないで欲しいという情報が含まれています.今回頂いた資料の中では,情報解禁日は項目,ONIX準拠項目の中に入っていないのですが,これは,版元ドットコムの段階で弾いて,要はopenBDに含まれない形で使うということになりますか.

(大江)
弾いています.それに関しては弾いています.

(高島)
はい.

(大江)
あと,今ですね,もともとONIXの,JPROのONIXの方に入っている情報のうちですね,連絡先の情報,出版社の担当連絡先は今抜いてます.あれは出版社の代表っていうよりは個人情報に近いものなので.あれは抜いてます.

----------------------------------------------------------
【https://www.youtube.com/watch?v=hh662-x-Bjg#t=2h01m52s】
(高島)
はい,ありがとうございます.

それから,JPOの特に近刊情報に関しては,近刊情報センターを立ち上げたときからその話は出ているんですけども,仮の情報,出るまでの仮の情報ということで,特に発売前の情報っていうのはどんどんどんどん情報が変わる,変化するってのがもう大前提になっています.それこそタイトルが変わるとか,内容紹介はもちろんですけど,タイトルが変わるとか発売日が変わるってのは,というかそうじゃないと事前の情報って出せないっていう事情があると思うんですけども,そこについては当然最新のものがどんどん入ってくるって理解で間違いないですね.

(大江)
はい.

----------------------------------------------------------
【https://www.youtube.com/watch?v=hh662-x-Bjg#t=2h02m31s】
(高島)
はい.それと,もう1つ事前の情報の中で重要な情報が価格情報で,価格情報ってのは出版情報登録センターJPROの情報の中では何種類か持っているんですね.特別価格だとか,期間を限定したような価格のものがあったりします.

で,今回の,このプライスはもともとのONIXの中のプライス,一番通常の価格の部分だって理解していいですよね.特別価格とかが入ってきちゃうことはないですよね.

(大江)
ONIXの方で,価格は何種類は規定されていますよね.それについては実は今はそのまま出してますね.もしあれば,元々の方に,価格のフィールドは複数持てるようにたしかなっていたと思うので.そこに関しては今はそのままですね.

(高島)
じゃあどういう形で出てくるんですかね?

(大江)
本体価格,特価本価格,再販という項目があって,プライスのレコードは複数許されてますね.だからさっきのJSONでも,それが配列になって出てくるという可能性はあるということ.

(高島)
じゃあ価格のところは配列になって出てくる可能性があるということですね.

(大江)
ありますね.まあ実際どれくらいそういうデータがあるかはサーベイしてないですけども.

(高島)
わかりました.

----------------------------------------------------------
【https://www.youtube.com/watch?v=hh662-x-Bjg#t=2h03m50s】
(高島)
それと,これは別になんかもう話出てるんで言っちゃっても構わないんだと思うんですけども,JPROと,Books,書協のデータベース,
【注:日本書籍出版協会のBooks.or.jp】
こちらの方を将来的に統合していこうという話があると思うんですけども,今日もいくつか間違っていた場合というような話がありましたけども,間違っているっていうよりも,古い情報を修正していくとか,特に近刊の情報はどんどんどんどん実は書き直しているんで案外直っているんですけど,古い本の情報を直したいっていったときにBooksの方の修正ってのがこれから先出てくると思うんですけども,そういった,要は,昔の本の情報の修正が入った場合も差分という形で取るのではなくて,現状では全部ドンと落とすっていう方を推奨っていうことですよね.

(大江)
そうですね.結局差分のどこが変わったという情報までは作ってないので.はい.

(高島)
はい,わかりました.

----------------------------------------------------------
【https://www.youtube.com/watch?v=hh662-x-Bjg#t=2h04m57s】
(高島)
もう1つはすみません質問じゃなくてちょっとこれは別の話なんですけど,このJPOのONIXを自分でプログラムとかで使えるように頑張ろうと思ってXMLを勉強したんですけども,XMLはもうダメだということなので,これからJSONを勉強しようと思いますので,まあちょっとがっかりなんですけど,ちょっと頑張ろうと思います.ただ,XMLはもう今日の話を伺っている限りにおいてはXMLでの配信はないと思いますので,JSON頑張ります.

----------------------------------------------------------
【質問者交代のやり取り省略】
【https://www.youtube.com/watch?v=hh662-x-Bjg#t=2h05m40s】
(リブライズ 地藏)
リブライズというWebサービスをやっております地藏と申します.宜しくお願いします.

1つご質問なんですけれども,サービスの持続性に関して,ちょっと2点ほどお聞きしたいことがありまして,ご質問ですが,まず1点目ですね,これあの今日始まるか明日始まるかっていう話かと思うんですが,どれくらいの期間,実際やられることをイメージしているのかなっていう話をお考えだけでいいと思いますのでお聞かせいただきたいのと.

あとそれからですね,実際カーリルとかのすごい技術力でやっているところはあると思うのですが,実際これをサービスとして運営するにあたって,何らかのコストっていうのはかかってくると思うのですが,そのあたりの負担に関してのお考えがあればお聞かせ頂ければと思います.

(吉本)
今の段階ではですね,まずデータを整備していく,収集して,貯めていって,管理していくってことは版元ドットコムの負担でやっていくと,いうことですね.カーリルは配信,このAPIの維持,提供について責任を持つと,いうことです.基本的に,僕たちが欲しいものを作っていると.

カーリルが,社内インフラとしてこれぐらいは要るってスペックのものを用意して,どうせそれ誰でも呼べるようになるので認証しないと.それは言い過ぎかもしれないです,すみません.ということで,若干うちの存続性が継続性になる部分は現時点ではある,っていうのは事実です.ただし,特に今回さっきの版元のAPIが持続されるのかっていう話もあって,持続するという話があったかと思います.

で,カーリルのAPIも6年前に出して,実は細かな挙動まで全部維持しているんですね.というのはちょっと変えちゃうと,これは僕たちが悪いんですけど,仕様化をちゃんとやっていなかったがために,仕様に書いてない仕様がいっぱいあってですね,それを変えると動かなくなるアプリとか出てきちゃうので,今回はですねJSONスキーマを全部出して,型のバリデーションとかも全部やったりとかってこともちょっと真面目に取り組んでいます.

これは何が言いたいかというと,APIのこの仕様に関する持続性については,たとえば今後JPOのフォーマットが変わったり,今は単独項目になっているのが複数入るよ,っていったときに,データフォーマットが変わる可能性は十分にあります.その時に,このv1のデータで読んだときはたとえば選ばないけど頭の1個が入ってくるよとか.そういったようなフォーマットの維持については,5年10年の単位で面倒をみていきたいと考えています.

(地藏)
ありがとうございました.

(沢辺)
個人的な感想を言っていいですか.あのー大丈夫だと思うんですけど,それよりも早く書誌を巡る状況は大きく変わるんじゃないんでしょうかと思っております.

先ほどの福島さんの話のような取組みをやるとしたら,openBDでデータを流せばいいだろって話にはならなくて,国会図書館とどうするとか,出版界とどうするとか,そういうことの検討が様々必要になるので,openBDのような枠組みが,10年20年先に続いていなければならないということは,あんまり考えられないかなぁという風には考えております.僕は.

(地藏)
ありがとうございます.

----------------------------------------------------------
【質問者交代のやり取り省略】
【https://www.youtube.com/watch?v=hh662-x-Bjg#t=2h09m30s】
(リブライズ 河村)
今日いろいろ面白い話が出てきたと思うんですけど,今後こういう話をどっかでやるには,なんかSlackとか用意されるんでしょうか.

(ふじた)
ありがとうございます.7ページですね.openBDのサイト,吉本さんお願いします.

(吉本)
はい,この議論,まさに昨日議論していた気がするんですけど,一応今openBDとして今チームでSlackを立ち上げてやってはいる,やり始めているというというところです.で,とりあえず今回こんなに人集まるし,すごいレガシーにメールアドレスでも集めといたらっていうので,メールフォームを昨日の夜中の2時くらいにつけました.で,とりあえず次Slackとか決まったらここに流すんで,っていうことです.

ちなみに昨日の議論では,ちょっとSlackとかまだみんなのってくれないんじゃないかなーとか言ってたんですが,意外とのってくれるかもしれないという.ちなみにこん中でSlack使っている人どれくらいいますか?
【注:会場内で挙手をしたのは3割程度の印象だった】
実は結構いたっていう.はい,ありがとうございます.

----------------------------------------------------------
【登壇者間でのやり取り省略】
【https://www.youtube.com/watch?v=hh662-x-Bjg#t=2h11m08s】
(吉本)
僕1個忘れていた.主にこれ図書館の人向けなんですけど,API出来たのが,先週末,違う,まあ今日の朝APIが出来たんですけどとにかく.うちのエンジニアがですね,朝こういうの作ってくれました.openBDのChrome Extensionと.
【注:https://github.com/CALIL/openBD-Chrome-Extension 】

まあこれちょっとサンプル代わりに.オープンソースでカーリルのリポジトリの中にとりあえずぽこって置いてあるんですけど,これ何かっていうと,図書館のOPACとか,カーリルとか,Amazon.まあ何でもいいんですけど.特にこれは朝みつくろったものなんですけど,openBDのAPIを読んで,自動的に重ねてくれるっていうプラグインです.実際にこれちょっと朝,富士通のiLiswingというものと,NECのLiCS-ReというOPAC.これ全国で800館,合わせると1,000館くらい,のOPACにこのプラグインをいって,検索をするとですね,まあちょっと適当に,あれ.これは違うんですよ,別の書誌なんけど.これちょっと見た目は適当ですが,目次,本当はこれ改行とんじゃっているのであんまりあれなんですけど,目次,内容紹介,著者略歴とか.まあこんな感じでちょっと重ねてくれるということで,まあこれはちょこっと作ってこんなのできましたと,いうような形で,是非開発できる方は遊んでみてくださいということです.

【以降閉会まで省略】

Â