SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

新着記事一覧を見る

連載記事

おすすめのイベント

おすすめの講座

'); document.write('
'); document.write('
'); googletag.cmd.push(function() { googletag.pubads().addEventListener('slotRenderEnded', function(e) { var ad_id = e.slot.getSlotElementId(); if (ad_id == 'div-gpt-ad-1653367697895-0') { var ad = $('#'+ad_id).find('iframe'); if ($(ad).width() == 728) { var ww = $(window).width(); if ($('#'+ad_id).closest("#main").length) { ww = ww - 46; $(ad).addClass("opt-article-toc-bottom"); } ww = ww*0.90; var style = document.createElement("style"); document.head.appendChild( style ); var sheet = style.sheet; sheet.insertRule( "#div-gpt-ad-1653367697895-0 iframe {-moz-transform: scale("+ww/728+","+ww/728+");-moz-transform-origin: 0 0;-webkit-transform: scale("+ww/728+","+ww/728+");-webkit-transform-origin: 0 0;-o-transform: scale("+ww/728+","+ww/728+");-o-transform-origin: 0 0;-ms-transform: scale("+ww/728+","+ww/728+");-ms-transform-origin: 0 0;}", 0 ); sheet.insertRule( "#div-gpt-ad-1653367697895-0 div{ height:"+(90*ww/728)+"px;width:"+728+"px;}", 0 ); } else { if ($(window).width() < 340) { var ww = $(window).width(); ww = ww*0.875; var style = document.createElement("style"); document.head.appendChild( style ); var sheet = style.sheet; sheet.insertRule( "#div-gpt-ad-1653367697895-0 iframe {-moz-transform: scale("+ww/320+","+ww/320+");-moz-transform-origin: 0 0;-webkit-transform: scale("+ww/320+","+ww/320+");-webkit-transform-origin: 0 0;-o-transform: scale("+ww/320+","+ww/320+");-o-transform-origin: 0 0;-ms-transform: scale("+ww/320+","+ww/320+");-ms-transform-origin: 0 0;}", 0 ); sheet.insertRule( "#div-gpt-ad-1653367697895-0 div{ height:"+(180*ww/320)+"px;width:"+320+"px;}", 0 ); } } } }); }); } else { document.write('
'); document.write('
'); }
Biz/Zineニュース

リクルートのAI研究機関、『じゃらんnet』のクチコミを活用した学術研究用データセット公開

  • Facebook
  • X
  • Pocket

 リクルートホールディングスの中間持ち株会社であるリクルートは、このたび、リクルートのAI研究機関であるMegagon Labsより、日本語の自然言語処理研究の発展に貢献するため、リクルートライフスタイルが運営する旅行サイト『じゃらんnet』のクチコミに基づく約12万件のデータを含む学術研究用データセットを、公的研究機関および大学の研究用に公開した。

  • Facebook
  • X
  • Pocket

 自然言語処理とは、日常的に使っている言語(自然言語)をコンピューターに解析させる一連の処理を指し、検索エンジンや機械翻訳、対話システム、顧客の声分析など、生活・ビジネスにおけるさまざまなシーンで利用されている。

 日本語の自然言語処理の場合、主要な他言語と比べて、公開されているデータセットの数が圧倒的に少ないという課題があるのだという。日本語の自然言語処理を発展させるために、学術研究用に利用可能なデータセットを充実させることが特に望まれていた。

 今回、Megagon Labsが公開するデータセットは、 リクルートライフスタイルが提供する旅行サイト『じゃらんnet』上で公開されている宿泊施設へのクチコミと、それを基に加工・作成した文章にラベル付け(アノテーション)を行ったもの。実際に『じゃらんnet』を利用する多くの顧客による事実の説明や感想、評価などを含む様々な文章が基となっており、幅広い日本語自然言語処理に活用が可能。具体的には、以下2つのデータセットをそれぞれのリポジトリにて公開する。

1:含意関係データセット

 「部屋はオーシャンビューで景色がよかったです。」という文が成り立つとき「部屋から海が見える」という文も成り立つかどうか(含意関係の有無)というラベルを付与したデータセット。(約55,000件)

 ポジティブ/ネガティブ/ニュートラルといった感情極性ラベルや、宿の特徴が含まれているかどうかというラベルも付与した文も含まれている。(約5,600件)

2:根拠説明データセット

 宿をお薦めする際に、ユーザーの要求に対する推薦根拠を説明するためのデータセット。(約37,300件)

 例えば、「お子様連れに優しい宿」を求めるユーザーに対して、「この宿には大きなキッズスペースがあるので、あなたにオススメです」と根拠付きで返答することを目指している。文単位で要求に対応する根拠かどうかをラベル付けし、その後、根拠と判断された文を推薦文へと言い換えている。

 日本語の自然言語処理研究に取り組む研究者にこれらのデータセットを提供することで、さらなる研究の加速が期待できる。なお、本データセットは学術研究用途での利用を意図したもので、非営利目的でのみ利用可能なライセンス付与を行っている。

' ); }

この記事は参考になりましたか?

  • Facebook
  • X
  • Pocket
関連リンク
この記事の著者

BizZine編集部(ビズジンヘンシュウブ)

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この記事は参考になりましたか?

この記事をシェア

  • Facebook
  • X
  • Pocket

Special Contents

PR

' ); document.write(''); } $(window).on('load', function() { // 中身が無い広告でslotOnloadを通らない場合がある var show_ad = 0; dfp_special.map(function(ad_id) { var ad_special_flag = 0; var ad = $('#'+ad_id[0]).find('iframe').last(); var contents = ad.contents(); if (contents.find('body').length === 0 || !contents.find('body').html()) { $('#ad_special_' + ad_id[0]).remove(); $('#ad_special_' + ad_id[0]).attr('class', 'noad'); } else { show_ad++; } }); if (show_ad == 0) { $('.ad-special-wrap-sp').hide(); } }); } else { $('.ad-special-wrap-sp').hide(); }

Job Board

PR

' ); document.write(''); } $(window).on('load', function() { // 中身が無い広告でslotOnloadを通らない場合がある var show_ad = 0; dfp_job_board.map(function(ad_id) { var ad = $('#'+ad_id[0]).find('iframe').last(); var contents = ad.contents(); if (contents.find('body').length === 0 || !contents.find('body').html()) { $('#' + ad_id[0]).remove(); //$('#' + ad_id[0]).attr('class', 'noad'); } else { show_ad++; } }); if (show_ad == 0) { $('.ad-job-board-wrap-sp').hide(); } }); } else { $('.ad-job-board-wrap-sp').hide(); }

おすすめ

新規会員登録無料のご案内

メールバックナンバー

アクセスランキング

  1. 1
    日本企業にはパーパスではなく、憲法が必要──企業理念の現代語訳と行動の集積による、組織カルチャー変革 NEW
  2. 2
    ベンチャースタジオを活用したオープンイノベーション──三菱倉庫、大林組などが語る、新たな“可能性” NEW
  3. 3
    “会いにいくDX組織”が企業変革のエンジンになる──不動産販売を顧客起点でアップデートするには?
  4. 4
    なぜ新規事業のアイデアは“とりあえず◯◯”になるのか──人間を理解し美辞麗句を疑う、新インサイト論
  5. 5
    心理的安全性を高めたはずなのに離職率が上昇、マネージャーはどうすれば?
  1. 6
    仮説指向計画法(DDP)が必要な理由
  2. 7
    中部電力ミライズが進める顧客接点の進化──ADDIXとのワンチームによるデータ起点の新たな価値創出
  3. 8
    東京ガスがエネルギーからソリューションへ舵を切る理由──巨大な組織を変える、伴走型支援者の存在とは?
  4. 9
    利益を生み出すビジネスモデルに共通する「財務構造」
  5. 10
    百戦錬磨の叩き上げと外部人材が担う変革の戦略と実行とは──過去の成功体験を紐解き、現代流に再解釈する

アクセスランキング

  1. 1
    日本企業にはパーパスではなく、憲法が必要──企業理念の現代語訳と行動の集積による、組織カルチャー変革 NEW
  2. 2
    ベンチャースタジオを活用したオープンイノベーション──三菱倉庫、大林組などが語る、新たな“可能性” NEW
  3. 3
    “会いにいくDX組織”が企業変革のエンジンになる──不動産販売を顧客起点でアップデートするには?
  4. 4
    なぜ新規事業のアイデアは“とりあえず◯◯”になるのか──人間を理解し美辞麗句を疑う、新インサイト論
  5. 5
    心理的安全性を高めたはずなのに離職率が上昇、マネージャーはどうすれば?
  6. 6
    仮説指向計画法(DDP)が必要な理由
  7. 7
    中部電力ミライズが進める顧客接点の進化──ADDIXとのワンチームによるデータ起点の新たな価値創出
  8. 8
    東京ガスがエネルギーからソリューションへ舵を切る理由──巨大な組織を変える、伴走型支援者の存在とは?
  9. 9
    利益を生み出すビジネスモデルに共通する「財務構造」
  10. 10
    百戦錬磨の叩き上げと外部人材が担う変革の戦略と実行とは──過去の成功体験を紐解き、現代流に再解釈する
  1. 1
    なぜ新規事業のアイデアは“とりあえず◯◯”になるのか──人間を理解し美辞麗句を疑う、新インサイト論
  2. 2
    東亜新薬増田氏に聞く、「ビオスリー」が60年以上売れ続ける理由──新市場開拓戦略によるイノベーション
  3. 3
    ローランド ・ ベルガー小野塚氏が語る、サプライチェーン領域の現状と2025年の展望
  4. 4
    “会いにいくDX組織”が企業変革のエンジンになる──不動産販売を顧客起点でアップデートするには?
  5. 5
    日本企業にはパーパスではなく、憲法が必要──企業理念の現代語訳と行動の集積による、組織カルチャー変革 NEW
  6. 6
    なぜLIXILは既存人材を中心にDXに取り組むのか──推進目的をコスト削減から価値創出へシフトする
  7. 7
    LIXILが「採用より育成」を重視する理由──「顧客と業務」の理解が必須なDXの最新潮流
  8. 8
    JR西日本の成功事例に学ぶ、DXでの組織変革──データに基づきヒトが意思決定する行動様式とは?
  9. 9
    仮説指向計画法(DDP)が必要な理由
  10. 10
    心理的安全性を高めたはずなのに離職率が上昇、マネージャーはどうすれば?
  1. 1
    新規事業の打率を上げる事業構想を書いたその後に──MVPによる事業仮説の弱点把握、不足人材の補強
  2. 2
    なぜLIXILは既存人材を中心にDXに取り組むのか──推進目的をコスト削減から価値創出へシフトする
  3. 3
    トヨタモビリティパーツに学ぶ、現場DXの最前線──ギックスと共同開発したAI整備見積もりシステム
  4. 4
    東亜新薬増田氏に聞く、「ビオスリー」が60年以上売れ続ける理由──新市場開拓戦略によるイノベーション
  5. 5
    ローランド ・ ベルガー小野塚氏が語る、サプライチェーン領域の現状と2025年の展望
  6. 6
    なぜ新規事業のアイデアは“とりあえず◯◯”になるのか──人間を理解し美辞麗句を疑う、新インサイト論
  7. 7
    LIXILが「採用より育成」を重視する理由──「顧客と業務」の理解が必須なDXの最新潮流
  8. 8
    ジョブ型ではなく「G型かL型か」で考える経営人材像──「事業家思考」と「投資家思考」を両立するには?
  9. 9
    JR西日本がコロナ危機で描いた、鉄道一本足打法からの脱却──現場の暗黙知とデータ活用によるDXとは?
  10. 10
    創業経営者にあり、サラリーマン社長にはないもの──佐藤教授に聞く「事業家思考」と「投資家思考」とは?