Published 2022/01/16 16:59 (JST) Updated 2022/01/16 17:17 (JST) 絶版本など入手困難となっている貴重な書籍や資料をインターネットで閲覧できるサービスが、5月から国立国会図書館のウェブサイトで始まる。現在は同館や他の図書館に足を運ばねばならないが、自宅のパソコンやタブレット端末でも見られるようになる。 国会図書館が保有する「入手困難資料」のうち、電子データ化が済んだものが対象。漫画や商業雑誌などは除外される。本人確認のため身分証明書を示し、個人として同館の利用登録をすることが必要となる。サービス開始当初は閲覧機能しかないが、不正コピー対策を講じた上で来年1月には印刷できるようにする予定。
『独学大全──絶対に「学ぶこと」をあきらめたくない人のための55の技法』著者の読書猿さんは昨年「独学」「執筆」に加えて「復刊」をライフワークとしていくことをTwitterで宣言した。この連載「読書猿が推す『良書復刊』プロジェクト」では、読書猿さんが推す復刊本や、復刊に関係する話を紹介していく。 2022年5月19日より、国会図書館による「個人向けデジタル化資料送信サービス」がスタートする。ごく簡単に説明すると「国会図書館デジタルコレクション所蔵の絶版本や雑誌が、自宅で読み放題になる無料サービス」だ。読書猿さんは、このニュースは全国の独学者にとっても福音であると話す。今回は、元司書でレファレンス担当だった書物蔵さんを対談相手に迎え、同サービスの使いこなし方、楽しみ方を語ってもらった。(取材・執筆/藤田美菜子) 「自宅の隣に国会図書館」のインパクト ――今回スタートする、国会図書館の「個人向け
国立国会図書館デジタルコレクションを使い始めてもう15年になる。昔は牧歌的な時期もあり、面白そうなタイトルを選び、チビチビ楽しみながら読むといった感じであった。ところが国立国会図書館デジタルコレクションが際限なく良くなっていくため、どんどん読み方が変っていった。 今の国立国会図書館デジタルコレクションは便利すぎるため、アクセスする資料の数がものすごいことになってきている。ここ数日のアクセスした資料を抽出してみたら、平均すると1日500あたりで、もう人間の能力では処理できない。 どう読んでいるのかというと、先にブラウザのタブで必要なものが掲載されていそうな資料を10-20程度開いておいて読み進め、必要ならページをめくるとデータを読み込む時間が発生するので、別のタブに移動してまた読むみたいなのを繰り返している。この読み方だと基本的にタイトルや著者といった情報は頭に置かない。データの断片があるだ
国立国会図書館デジタルコレクションは最高である。 「国立国会図書館デジタルコレクション」が面白い まずは遊んでみる 使いまくりたくなったら準備しておくと効率が良い 無料でできる 検索演算子だけ覚えておく 国立国会図書館デジタルコレクションの使い方を知っておく 国立国会図書館オンラインに登録しておく メモ環境を作る 有料でできる パソコンを用意する できれば良い椅子とモニタがあったほうがいい 速度を意識して使う 速くなるとどうなるのか そこに全てはない ものすごいものをどうでもいいことに使うということ 「国立国会図書館デジタルコレクション」が面白い 「国立国会図書館デジタルコレクション」が面白い。 dl.ndl.go.jp 「国立国会図書館デジタルコレクション」では著作権など権利状況に問題がないことが確認できた約36万点の資料が無料で公開されており、ようするに古い本が無限に読めるサービスだ。
2022年04月25日 NDLラボのGitHubから、次の2件を公開しました。ライセンスや詳細については、各リポジトリのREADMEをご参照ください。 NDLOCR 国立国会図書館(以下、「当館」とします。)が令和3年度に株式会社モルフォAIソリューションズに委託して実施したOCR処理プログラムの研究開発事業の成果である、日本語のOCR処理プログラムです。 このプログラムは、国立国会図書館がCC BY 4.0ライセンスで公開するものです。なお、既存のライブラリ等を利用している部分については寛容型オープンライセンスのものを採用しているため、商用非商用を問わず自由な改変、利用が可能です。 機能ごとに7つのリポジトリに分かれていますが、下記リポジトリの手順に従うことで、Dockerコンテナとして構築・利用することができます。 リポジトリ : https://github.com/ndl-lab/
国立国会図書館では、さまざまなオープンデータが公開されています。 その中に「図書館及び関連組織のための国際標準識別子(ISIL)」試行版LODがあります。 これは、日本全国の図書館に関する情報が網羅的にまとめられているRDFデータとなります。 提供されているデータはXMLファイルなので個別にデータを取得するためにはプログラムなどで処理する必要があるので、Webブラウザで各データを見やすく提供するWebサイト「図書館施設データポータル」を作成しました。 ここでは、 図書館施設データポータル を紹介します。 図書館及び関連組織のための国際標準識別子(ISIL)」試行版LOD とは 元データは、「図書館及び関連組織のための国際標準識別子(ISIL)」という図書館等につけられる国際的な識別子で、国立国会図書館では、このISILが付与される図書館の情報をオープンデータ(XMLファイルのRDFデータ)
","naka5":"<!-- BFF501 PC記事下(中⑤企画)パーツ=1541 -->","naka6":"<!-- BFF486 PC記事下(中⑥デジ編)パーツ=8826 --><!-- /news/esi/ichikiji/c6/default.htm -->","naka6Sp":"<!-- BFF3053 SP記事下(中⑥デジ編)パーツ=8826 -->","adcreative72":"<!-- BFF920 広告枠)ADCREATIVE-72 こんな特集も -->\n<!-- Ad BGN -->\n<!-- dfptag PC誘導枠5行 ★ここから -->\n<div class=\"p_infeed_list_wrapper\" id=\"p_infeed_list1\">\n <div class=\"p_infeed_list\">\n <div class=\"
国内で発行される全ての出版物が集められる国立国会図書館(東京都千代田区)が、蔵書のデジタル化を進めている。本や雑誌・新聞のほか地図やCD、DVDもあり、所蔵資料は4600万点を超える。だが、そのうちデジタル化されているのは今年3月現在、6%。古い資料を中心に約281万点にとどまる。 その国会図書館のデジタル化の一部を障害のある人たちが担っているという。なぜなのか。背景を聞いてみると、障害者が働いて得られる賃金が驚くほど低いという事情があった。現場を訪ねてみた。(共同通信=市川亨) ▽「未来に残る仕事」 東京都東村山市にある工場のような建物。中にある一室のドアを開けると、黒い布で仕切られた暗室が並ぶ。そこには、ちょっと変わったスキャナーとパソコン。本を広げて黙々と作業する人たちがいた。 ここは障害者が通って働く作業所「コロニー東村山」。スキャンをしている人たちも障害者だ。そのうちの一人、吉田
30日に解散する公益財団法人東京オリンピック・パラリンピック競技大会組織委員会(事務所=東京都新宿区西新宿2丁目、会長=橋本聖子参院議員、事務総長=武藤敏郎・元財務事務次官)の公式ウェブサイトについて、国立国会図書館の「インターネット資料収集保存事業(WARP)(注1) 」による公開が年明けからストップしている。組織委のサイトはきょう6月30日午後6時に閉鎖されるが、関係者間の話がつかず、その最後の姿の収集・保存も不可能な状況となっているという。国立国会図書館法の規定に基づき同図書館は国や自治体など公的機関のウェブサイトを許諾なしで保存・公開する権限を持つが、組織委は民間団体の扱いでその対象外。組織委は取材に対し、大会の「レガシー」(遺産)を国内に残していくため、過去のウェブサイトを含む「アーカイブ資産」を国内関係者に引き継ぐべく、現在、国際オリンピック委員会(IOC)など関係者間で「調整
《この記事は約 16 分で読めます(1分で600字計算)》 コロナ禍による図書館休館問題を受け、文化庁はいま著作権法第31条 図書館等での権利制限規定を見直す検討を進めています。「図書館の本、スマホで閲覧可能に」という報道に喜ぶ声や、出版関係者が「民業圧迫だ」と反発している報道もあります。実際のところ、いまどのような制度になっていて、どのように改正されようとしているのでしょうか? まだ報告書が確定していない段階ではありますが、現時点での状況について解説します。 デジタル化・ネットワーク化に対応できていなかった まず前提として、著作権法には「私的使用」「引用」「学校の授業」「非営利無償の貸与」など、著作権者に無断で利用できる権利制限規定がいくつもあります。そのうちの1つが、第31条「図書館等における複製等」です。 複写サービスはFAXやメールが違法 この図書館での権利制限規定は以前から、デジ
閲覧できる資料の内訳は、1968年までに収集した図書約55万点、古典資料約2万点など。明治以降に発行された雑誌のうち、商業出版されておらず、刊行から5年以上が経過した資料約82万点も含む。 日本に住む、国立国会図書館の利用登録を済ませた個人を対象に提供する。サービスの利用料は無料。利用登録はネットでも済ませられる。当面はPCやスマートフォン、タブレット端末での閲覧のみ可能だが、2023年1月をめどに資料を印刷できるサービスも提供する。 国立国会図書館はすでに、同様のサービスを公共図書館や大学図書館向けに提供している。一方で個人向けには提供しておらず、著作権保護期間が満了となった資料約56万点のみ、絶版本などとは別にネット経由で閲覧できるようにしていた。 しかしコロナ禍でデジタル資料の需要が増したことを受け、政府が2021年6月に著作権法を改正。これにより、デジタル化した絶版本などをネット経
日本で出版されたほぼ全ての本が収蔵されるという、国立国会図書館。 現在、新型コロナウィルスの感染拡大防止のため休館しているが、ネットを介したデジタルコレクションの閲覧は、これまで通りにできる。 この機会に、国会図書館のデジタルコレクションの本をいろいろ漁って、おもしろそうな本をみつけたい。 無料で誰でも自由にいつでも昔の本が読み放題 国会図書館では、収蔵されている資料のうち、著作権保護期間が終わり、パブリックドメインとなった書籍や資料などをデジタル化し、公開している。 国立国会図書館デジタルコレクション このデジタルコレクションでは、図書だけでなく、雑誌、論文、官報、各種資料、そして、あげくのはてには昔のレコード音源や映像まで視聴できる。 図書だけに限っても、デジタルコレクションで公開されている数は35万7千件近くある。この例え方にどれほどに意味があるかわからないけれど、1日10冊ほどチェ
2024年8月23日 帝国議会会議録検索システムで全期間の本文テキストデータが利用できるようになりました(付・プレスリリース) 国立国会図書館は、帝国議会会議録検索システムにおいて、戦前・戦中期分(明治23(1890)年11月~昭和20(1945)年8月)の速記録の画像データ(合計約27万ページ)からOCR(光学的文字認識)処理により作成した本文テキストデータを、新たに公開しました。 これにより、既に本文テキストデータを提供している戦後期分(昭和20(1945)年9月~昭和22(1947)年3月)と合わせて、帝国議会の全期間にわたり、速記録に掲載された質疑や議案本文などの全文検索とテキスト表示ができるようになりました。 ぜひご利用ください。 なお、今回公開した戦前・戦中期分の本文テキストデータは、人手による校正を行った戦後期分と異なり、OCR処理による文字の認識間違い(誤字・脱字)や認識不
国立国会図書館は、「国立国会図書館のデジタル化資料の個人送信に関する合意文書」(令和3年12月3日)に基づき、「個人向けデジタル化資料送信サービス」(略称:個人送信)を令和4年5月19日から新たに開始します。 これは、令和3年6月2日に著作権法の一部を改正する法律 (令和3年法律第52号)が公布されたことによるものです。この改正により、国立国会図書館はデジタル化した資料のうち絶版等資料をインターネット経由で個人に送信できるようになりました。法改正の背景には、デジタル化・ネットワーク化への対応とともに、コロナ禍により、当館や公共図書館、大学図書館等に来館せずに利用できるデジタル化資料へのニーズが、研究者・学生等の個人から高まったことがあります。 サービス概要 当館のデジタル化資料のうち、絶版等の理由で入手が困難なものを、利用者ご自身の端末(スマートフォン、タブレット、パソコン)等を用いてイン
リニューアルに際して、ブックマークレットの箇所も更新しました。(2022/12/21) 使えなくなってたのでまた更新しました。(2023/01/05) これは何の記事 国会図書館次世代デジタルライブラリーで古典籍が検索できるようになって、いよいよすごいことになっている。 / 古典籍資料の全文検索が可能になります! \ 11月1日(火)に、実験システム #次世代デジタルライブラリー に古典籍資料6万点のOCR全文テキストデータを追加します。これまでの明治以降の図書に加え、江戸期以前のくずし字等資料の全文検索も可能となります。https://t.co/9KT1CdaSYa pic.twitter.com/aOz7OmyWew— 国立国会図書館 NDL (@NDLJP) 2022年10月26日 まじでいいんですか? 次世代デジタルライブラリー上でテキストのダウンロードもできる(右下の「この資料の
「(古い資料の)本文検索ができるようになれば、新たな本の価値を届けられる」。国立国会図書館次世代システム開発研究室の徳原直子室長は力を込める。 国立国会図書館(NDL)は2022年4月25日、新たに開発した「NDLOCR」をオープンソースとして公開した。NDLOCRは、書籍や雑誌などの画像データから本文のテキストデータを作成できるOCR(光学的文字認識)処理プログラム。明治~昭和期の独特なレイアウトにも対応しているのが特徴だ。古い資料でも本文検索ができるようになる。 NDLが蔵書のデジタル化に乗り出したのは2000年代に遡る。資料をスキャンし、主に「JPEG 2000」のフォーマットで保存、提供してきた。NDLが手掛けるオンラインサービス「国立国会図書館デジタルコレクション」から利用可能だ。 デジタル化を進める最大の目的は資料の保存にある。時がたつほど紙は劣化していくからだ。 ただし、ND
「日本で出版されるすべての本が収められる場所」、国立国会図書館が収蔵する約4560万点の浮世絵や図書、雑誌などから、選りすぐりの画像を集めたオンラインコレクション、NDLイメージバンク。 掲載されている画像は、すべて著作権保護期間を満了しており、無料で閲覧できるだけでなく、出典を記載すれば自由に転載することも可能です。 「国立国会図書館デジタルコレクション」にある数百万点以上の資料から、検索だけではみつけにくい、知られざる資料を幅広く取り上げ、分かりやすく親しみやすく紹介しています。 著作権フリー画像素材をダウンロードできるNDLイメージバンク NDLイメージバンクは、資料にわかりやすい解説を付けてテーマごとに紹介する、国立国会図書館の「電子展示会」のひとつ。 掲載されている画像は、国立国会図書館が所蔵する資料をデジタル化し、著作権保護期間が満了した、いわゆる著作権フリーの素材となっていま
『独学大全──絶対に「学ぶこと」をあきらめたくない人のための55の技法』著者の読書猿さんは昨年「独学」「執筆」に加えて「復刊」をライフワークとしていくことをTwitterで宣言した。この連載「読書猿が推す『良書復刊』プロジェクト」では、読書猿さんが推す復刊本や、復刊に関係する話を紹介していく。 2022年5月19日より、国会図書館による「個人向けデジタル化資料送信サービス」がスタートする。ごく簡単に説明すると「国会図書館デジタルコレクション所蔵の絶版本や雑誌が、自宅で読み放題になる無料サービス」だ。読書猿さんは、このニュースは全国の独学者にとっても福音であると話す。今回は、元司書でレファレンス担当だった書物蔵さんを対談相手に迎え、同サービスの使いこなし方、楽しみ方を語ってもらった。(取材・執筆/藤田美菜子) 第1回 元司書が語る!国立国会図書館の絶版本「読み放題解禁」がスゴい 膨大な資料を
「国立国会図書館のデジタル化資料の個人送信に関する合意文書」(令和3年12月3日)を公表しました。 この文書は、国立国会図書館がデジタル化資料を個人に向けて送信することを可能とする「著作権法の一部を改正する法律」(令和3年法律第52号)が令和3年6月2日に公布されたことを受け、文化庁と国立国会図書館が共催した「国立国会図書館による入手困難資料の個人送信に関する関係者協議会」(構成員名簿)において、各権利者団体、図書館関係者及び有識者で議論を重ねて合意したものです。 国立国会図書館では、この文書に基づき、個人向けのデジタル化資料送信サービスの準備を進めています。 ポイントは以下のとおりです。(詳細については今後ご案内する予定です。) サービスの開始(予定): 令和4年5月(当面は閲覧のみ。印刷については令和5年1月を目途に開始予定) サービスの対象資料: 当館のデジタル化資料のうち、絶版等の
概要 ノートブック 実行方法 入力フォルダの準備 ノートブックの実行:1.初期セットアップ ノートブックの実行:2.設定 ノートブックの実行:3.実行 まとめ 追記 2022.05.02 2022.04.30 概要 前回、Google Cloud PlatformのCompute Engineを用いたNDLOCRアプリの実行方法を共有しました。 nakamura196.hatenablog.com ただし、上記の方法は手続きが一部面倒で、かつ費用がかかる方法です。本番環境で使用するには適した方法ですが、小規模に、または試験的に使用するにはハードルが高い方法でした。 この課題に対して、 @blue0620 さんがGoogle Colabを用いたNDLOCRアプリの実行方法を作成されました。 https://twitter.com/blue0620/status/151929433215901
デジタル資料の長期保存に関する基礎的な知識の習得を目指します。「基礎知識1」では、記録媒体の特性の違いやそれらの保存にあたっての課題について、「基礎知識2」では、デジタル資料の長期保存の基本的課題と実践事例について、学びます。
import os import torch print(torch.__version__) torch_ver, cuda_ver = torch.__version__.split('+') os.system(f'pip install mmcv-full==1.4.0 -f https://download.openmmlab.com/mmcv/dist/{cuda_ver}/torch{torch_ver}/index.html --no-cache-dir') os.system('cd src/ndl_layout/mmdetection && python setup.py bdist_wheel && pip install dist/*.whl') os.system('wget https://lab.ndl.go.jp/dataset/ndlocr/text_re
2022年2月18日、国立国会図書館(NDL)が、JAPAN/MARC全件データの提供を開始しました。 提供を行うのは、単行資料・逐次刊行資料の全国書誌データを収録するJAPAN/MARC(M/S)と、個人名・家族名等の典拠データを収録するJAPAN/MARC(A)の全件データです。データ形式はJAPAN/MARC MARC21フォーマットです。 希望者は電子メールでの申し込みが必要です。 書誌データに関するお知らせ(NDL) https://www.ndl.go.jp/jp/data/news.html ※2022年2月18日付で「JAPAN/MARC全件データの提供を開始しました。」とあります。 JAPAN/MARC全件データ提供(NDL) https://www.ndl.go.jp/jp/data/data_service/index.html#jmall 参考: 国立国会図書館(N
国立国会図書館は、令和4年12月21日に、国立国会図書館デジタルコレクションをリニューアルします。 リニューアルにより、全文検索可能なデジタル化資料が増加するとともに、閲覧画面が改善されます。 詳しくはプレスリリースをご覧ください。 新しくなった国立国会図書館デジタルコレクションをぜひご活用ください。 プレスリリース(PDF: 972KB)
2024年4月1日に、慶應義塾の名誉教授である倉田敬子氏が国立国会図書館長に就任した。スマホやインターネットが普及し、簡単に手に入れることができる情報が溢れる中、本を読む人は年々少なくなってきていると言われている。そんな時代において館長に就任された倉田氏に、就任の経緯とともに、館長としての抱負や塾生に向けたメッセージを伺った。 インタビューを受ける倉田館長 ―国会図書館長に就任された経緯を教えてください。 国会の事務局の方から突然メールがありました。私は、国立国会図書館の科学技術情報整備審議会の委員を14年ほどやっていたので、私のことを全く知らないで選んだわけではないとは思いますが、どのような経緯で選ばれたのかは私もわかりません。慶應は日本における図書館情報学研究のパイオニアで、歴史や実績もあり、図書館情報学の研究者が多く在籍する教育機関として有名ですが、これまで図書館情報学の研究者が国立
次世代デジタルライブラリーの機能が充実してきた。 次世代デジタルライブラリー」は、国立国会図書館次世代システム開発研究室での研究を基に開発した機能を実装した実験的な検索サービスです。 国立国会図書館デジタルコレクションで提供している資料の中から、著作権の保護期間が満了した図書資料・古典籍資料全部(約33万6千点)が検索可能です。 というわけで使いまくっている。まだまだベータ版なので多少は雑なところもあるけれど、普通に使えている。使い込むうちに検索のコツも解ってきた。 例えば『永田一茂』で検索する際に、『永田一』でも検索するとヒット数が増える。 OCR が『永田一』を誤読することはほぼないけれど、『茂』は間違える可能性があるといった考え方である。もちろんノイズを拾うこともあるので善し悪しだが、絶対に情報を拾い落したくない時にはこうやって検索する。 名前の場合は『茂一田永』なんかで検索すること
みんな大好き、国立国会図書館デジタルコレクションのお話。 ※著作権法で認められた範囲を超えるためと思われますが、個人送信対象資料のスクリーンショット、ネットへのアップロードはNGなはずですので、写真は載せてません。 ※利用規約、以下のTwitterでも紹介されています。 「個人向けデジタル化資料送信サービス」の利用には、国立国会図書館オンラインへのログインの際に表示される「利用規約」の確認・同意が必要です。なお、「利用規約」の内容は、こちらでも参照が可能です。https://t.co/A3S7lI2GZw — 国立国会図書館 NDL (@NDLJP) May 19, 2022 5月19日から、国立国会図書館デジタルコレクションの収録資料のうち、これまで国立国会図書館(以外 NDLという。)の館内、または特定の図書館内(※)でしかみられなかった資料が、登録利用者でも見られるようになった。 (
NDL、国立国会図書館デジタルコレクションをリニューアル 関西館電子図書館課・大森穂乃香(おおもりほのか) 国立国会図書館(NDL)は、2022年12月21日に「国立国会図書館デジタルコレクション」(以下「デジタルコレクション」)のリニューアルを行った。デジタルコレクションとは、NDLがデジタル化した所蔵資料や収集・保存した電子書籍・電子雑誌等を検索・閲覧できるサービスのことで、その歴史は2000年提供開始の「貴重書画像データベース」まで遡り、「近代デジタルライブラリー」(2002年提供開始)、「国立国会図書館デジタル化資料」(2011年提供開始)などを経て、2014年から現在のシステムとなった。2014年の現行サービス提供開始以来、デジタルコレクションが大規模なリニューアルを行うのは今回が初めてである。その背景として、検索機能強化やユーザーインターフェース改善の必要性のほかに、2022年
国立国会図書館は2020年10月14日、東京本館6階にある食堂の営業を20日に終了すると公式サイトで発表した。J-CASTニュースは同日、国立国会図書館に、閉店理由やこれまでの人気メニューを電話で取材した。 「お子様ランチが、、、」 国立国会図書館の広報担当者によれば、新型コロナウイルス感染症の拡大に伴い、図書館内での事業継続が困難となり、営業を終了することとなったという。 人気メニューとして挙げたのは、「メガカレー」と「図書館カレー」。「メガカレー」は、その名の通り大皿に大盛りのカレーで、「図書館カレー」は、牛丼の具とカレーを合い掛けにしたものである。担当者は、「当館の特色のあるメニューとして、ご好評いただいていたのかなと思います」と語った。 またインターネット上では、大人でも「お子様ランチ」が食べられる食堂としても親しまれていた。 「利用者の方の『色んなものを少しずつ楽しみたい』という
ページをめくる音、シャッターを切る際の「ピッ」という音がフロアに響く。「三井倉庫ビジネスパートナーズ」では、多い日で120人ほどがスキャニング作業に当たるという =東京都港区(川口良介撮影) 膨大な資料をデジタル化して後世に残そうと、日本唯一の国立の図書館「国立国会図書館」(東京都千代田区)で作業が進んでいる。 4500万点を超える蔵書のうち希少なものや劣化したものなどを優先して着手。始めたのは平成12年からだが、令和3年度は大規模な補正予算を組み、図書だけで約30万冊分をデジタル化した。 作業が加速しているのは新型コロナの感染拡大の影響だ。各地で図書館の臨時休館が相次ぐなか、閲覧を望む利用者の声が多く寄せられた。デジタル資料なら、図書館に足を運ばなくてもインターネットを介して読むことができる。 デジタル化作業のデモの様子。開いたページにガラス面を押し付け、テンポよく足元のスイッチでシャッ
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く