fc2ブログ
    (例文/コーパス)

    ◯KOTONOHA「現代日本語書き言葉均衡コーパス」 少納言
    www.kotonoha.gr.jp/shonagon/search_form

    現代の日本語の書き言葉の全体像を把握できるように集められた約1億語収録の『現代日本語書き言葉均衡コーパス』をジャンルを指定したり、前後にくる言葉を指定した上で検索できる。用例を探したいときはまずここを当たる。

    shonagon.png



    ◯コーパス検索ツールNINJAL-LWP for BCCWJ (NLB)
    nlb.ninjal.ac.jp/

    『現代日本語書き言葉均衡コーパス』を検索するために、国語研とLago言語研究所が共同開発したオンライン検索システム。上の少納言との違いは、名詞や動詞などの内容語の共起関係や文法的振る舞いを網羅的に表示できるところ。
     たとえば「タバコ」を検索すると、用例が「タバコ+助詞+動詞」や「動詞+タバコ」+「タバコ+助詞+形容詞」などのパターンに分類される。この中から例えば「形容詞+タバコ」というパターンを選ぶと、タバコにどんな形容詞がつくのかがリストアップされ、その中から例えば「うまいタバコ」を選ぶと

    ・「しかし、そうやって「働いて」きた人間だけが本当に旨い酒の味が解り、本当に旨い煙草が味わえる。」
    (Yahoo!ブログ, 2008, 人文科学)
    ・「そして、この先、波瀾に満ちた生涯が待ち受けているはずの彼に、今の僕ができることは、せめて日本の旨い煙草を差し出すことぐらいだった。」 (長岡洋幸全撮影・文 『チベットの夜空の下で眠りたい』, 2002, 292)

    といった用例がリストアップされる。

    NLB.png
    (クリックで拡大)



     なお、NINJAL-LWP for TWChttp://corpus.tsukuba.ac.jp/)は、日本語のウェブサイトから収集して構築した約11億語のコーパス『筑波ウェブコーパス』(Tsukuba Web Corpus: TWC)を、NLBと同じユーザーインターフェースで検索できる。




    ◯日本語作文作成支援システムなつめ
    https://hinoki-project.org/natsume/

    『現代日本語書き言葉均衡コーパス』やWikipedia、科学技術論文のデータを用いて、日本語を外国語として学ぶ人のための日本語作文を支援するサイト。
    東京工業大学留学生センター仁科研究室グループが開発している日本語学習支援システム(ひのきプロジェクト)の一部。
    日本語の新聞や論文やブログのデータベースの中から、単語が実際にどのように使われているのか調べることができる。

    たとえば「学ぶ」と入力し「Verbal(動詞)」を選び、「Search」をクリックすると、
    「学ぶ」+助詞ごとに、どのような単語が結びつくか頻度順に表示される。
    natume.png

    その内の一つを選ぶと
    ジャンル別の頻度も表示されて、論文で使われる表現なのか、プログで使われる表現なのかを知ることもできる。

    natume2.jpg



    ◯日本語用例検索(青空文庫を対象に)
    www.let.osaka-u.ac.jp/~tanomura/kwic/aozora/

     青空文庫の収録作品を対象に、先行文脈/後続文脈を指定して用例検索できる。
     たとえば「のような」や「のように」というキーワードと共に検索すると、青空文庫から自分のほしい比喩(直喩)を探したりできる。

    yorei-aozora1.png




    ◯日本語KWIC辞書使用例検索・コロケーション抽出システムfinder
    www.nihon.co.kr/kwic.html

     青空文庫や新聞社説を対象に、正規表現を使った用例検索ができる。

    jkwic.png



    ◯日本語表現インフォ(小説の言葉集):ピンとくる描写が見つかる辞典
    hyogen.info/

     感情/風景/食べ物/人物/感覚(五感)についての比喩表現や情景表現を集めたデータベース。似ている表現へのリンクも表示されて便利。

    jinfo.png



    ◯小説投稿サイト検索
    https://www.google.com/cse/publicurl.....

     Googleのカスタム検索エンジンで作ってみた。
     以下の小説投稿サイト検索を横断検索できる。
     ノベリスト.jp、星空文庫、E★エブリスタ、ふみふみ、作家でごはん!、dNoVeLs、FC2小説、のべぷろ!、小説家になろう、アットノベルス、ライトノベル、作法研究所、ラノベジェネレーション、Arcadia、小説カキコ、すぴばる小説部、QBOOKS、jyunbun、幻創文庫、PiPi's World『投稿小説』
     
     自分が書いた表現が「白魚のような手」「ツンと上を向いた乳首」のような紋切り型になっていないかをチェックするのに使える。

    toukou.png





    (採点/レベルチェック)

    ◯Jess®: 日本語小論文 評価採点システム
    coca.rd.dnc.ac.jp/jess/

     小論文のお題と自分が書いた回答を入力すると、採点してくれるシステム。

    Jess.png



    ◯帯3:日本語テキストの難易度を測る
    http://kotoba.nuee.nagoya-u.ac.jp/sc/obi3/

     カフカ『変身』はラノベよりもずっと読みやすい←日本語難易度推定をやってみた 読書猿Classic: between / beyond readers カフカ『変身』はラノベよりもずっと読みやすい←日本語難易度推定をやってみた 読書猿Classic: between / beyond readers このエントリーをはてなブックマークに追加で紹介した日本語の難易度判定システム。
     テキストをコピペしてボタンを押すだけで、小学校から大学にかけての教科書127冊から抽出した1478サンプル、約100万字のコーパス(教科書コーパス)を用い、小学1年から高校3年+大学レベルの13段階で、日本語のテキストの難易度(リーダビリティ)を推定する。

    obi.jpg



    ◯日本語難語レポーター
    https://mbc.dl.itc.u-tokyo.ac.jp/nango_report/

     学術度判定(学術(ac.jpドメイン)と、限定なしのWeb検索の比率で学術度を計算)、レア語(IPADICの[形態素生起コスト]をもとにした用語生起コストと、Yahoo!検索件数をもとに計算)、テキスト中の常用漢字(学年別)、ひらがなの比率などを計算してくれる。

    nango.png


    ◯小説形態素解析CGI(β)
    http://www.ennach.sakura.ne.jp/

     「かな:漢字の比率」や「ひとつの文章の長さ」、品詞の頻度などの傾向を解析して、「説明・要約的な文章展開」なのか、「物事を形容する言葉より、動きの描写が多い」のか、など文体を分析してくれるサイト。




    (校正)

    ◯Enno - 日本語のタイポ/変換ミス/誤字脱字エラーをチェック
    enno.jp/

     日本語のあからさまなエラー 、タイポ、スペースのエラー、誤字脱字、変換ミス、入力後の編集ミス、文字化けを自動チェックしてくれる。

    enno.png



    ◯文章校正支援 日本語プルーフリーダー
    www.languagecraft.jp/proofreader/nihongopr_2.html



    ※青山学院大学 日本語表現法開発プロジェクト
    http://www.pawel.jp/outline_of_tools/

    サイト上のサービスではないが有用なツールを提供しているので紹介。
    文章構造理解支援ツールHinako、文章見直し支援ツールComiQlip、校正・推敲支援ツールTomarigi、文章相互評価支援ツールHiyodori、演習問題生成支援ツールYamagaraなどをダウンロードして利用できる。




    (辞書)

    ◯翻訳類語辞典
    www.dictjuggler.net/ruigo/

     Wordnet翻訳訳語辞典のデータを元にした類語辞典。
     これを類語辞典のベースにするメリットは、類語玉手箱や国語辞典、英和辞典、Wikkipediaへのリンクもあるところ。

    ruigo.png


    ◯辞典・百科事典の検索サービス - Weblio辞書
    www.weblio.jp/

    570の専門辞書や国語辞典、百科事典などを横断検索できる。
    約380万語の類語や同義語・関連語が引ける類語辞典(http://thesaurus.weblio.jp/)や、
    古典、民話から小説、映画や漫画に至るまでを対象に、物語のパーツとなる「物語要素」(物語素)を拾い出し、分類、整理した物語要素事典もこの中から引ける。



    ◯漢ぺき君
    http://www.sanrui.co.jp/web/

    サンルイ・ワードバンクが公開する難読語に強い漢和辞典サイト。漢字のパーツの読みを使い、かな2〜3文字で読めない漢字を検索できる。漢字字典の検索結果として区点コード、シフトJISコード、よみ、熟語などを出力。

    kanpeki.png



    ◯Yahoo!辞書: 国語・類語・英和・和英・百科事典・用語集
    http://dic.yahoo.co.jp/

    日本大百科全書(小学館)をベースにしたYahoo!百科事典、大辞泉、プログレッシブ英和/和英辞典などを検索できる。


    ◯辞典横断検索 Metapedia - 551の辞書・辞典サイトを一括検索
    metapedia.jp


    ◯excite国語辞書ー大辞林第三版(三省堂)
    www.excite.co.jp/dictionary/japanese/

    ◯goo国語辞典ーデジタル大辞泉(小学館)
    dictionary.goo.ne.jp/jn/
    関連記事
    Secret

    TrackBackURL
    →https://readingmonkey.blog.fc2.com/tb.php/715-55bb9476