NAIST DSCサマーセミナー2022の発表資料です。 http://www-dsc.naist.jp/dsc_naist/naist-dsc-summer-seminar-2022/
タグ検索の該当結果が少ないため、タイトル検索結果を表示しています。
こんにちは、品川です。 最近仕事でGPT-2,3について調べてたのですが、日本語GPT-2を作っているプロジェクトのことを知りました。 github.com 見てみると学習済みモデル(small, medium)が公開済みで、fine-tuning用のコードなども揃っておりいたく感動しました。 本記事は生成結果をぜひみてみたいということで試してみたという趣旨の記事になります。 使い方は上記リポジトリのREADMEを読んでいただければ良いかと思います。 contextをオプションで指定することで、contextに沿った生成が可能とのこと。なるほど、ならば架空のNAIST生をD進させてD進後の状況を独白してもらうことも可能・・・? 早速試してみる(この結果はフィクションです) python gpt2-generate.py \ --model gpt2ja-medium \ --num_gen
こんにちは、品川です。大学教員になって約3年半、ボスの定年退職に伴い、異動することにしました。 新しい所属先はSB Intuitionsです。民間企業ではありますが、研究機関登録もされていて科研費もそのまま移すことができます。まだ学生の投稿中の論文誌が残ってたりするのでありがたいですし、色々と面白いことができそうでワクワクしています。 アカデミアから民間に移った理由はいくつかありますが、雑に箇条書きにすると アカデミアの世界しか知らないことにリスクを感じたから 情報系のポストが増えていて、新しいことにチャレンジして失敗しても教員として戻れる可能性がそこそこありそうだから 大量のGPUをぶん回したい気持ちが高まっていたから 日本の中でも最高の教育を提供する研究室に所属して教育の可能性や限界を思い知ったから。結局教員が多忙過ぎるし、教育がスケールしないのが問題(私が成長させたいと思う「できない
このうち、「対訳作文 DB」について、誤りタイプの情報を XML 形式で付与したものが NAIST 誤用コーパスになります。「対訳作文 DB」は国立国語研究所で収集・公開されているデータベースで、さまざまな国・地域の日本語学習者の書いた課題作文に対する手書き原稿に対して、一部に添削情報が付与されています。この添削情報には誤りタイプが付与されていないので、それに誤りタイプを付与した、というものです。 日本語学習者コーパスに対する文法誤りのタイプは、上記の中でも寺村誤用例集データベースや日本語学習者作文コーパス、国際日本語学習者作文コーパスおよび「なたね」には付与されているのですが、寺村誤用例集データベースには誤用に対する正用例がアノテートされていないので、誤り検出の評価には使えるものの誤り訂正の評価には使えませんし、日本語学習者作文コーパスは正用例がアノテートされているものの「文法」「文字」
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く