Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
Submit search
EN
Uploaded by
Nな人 -enunahito-
PPTX, PDF
3,272 views
MeCabでオリジナル辞書を構築してみる
MeCabのユーザオリジナル辞書の作り方と,その辞書をMeCabに登録する方法です
Software
◦
Read more
0
Save
Share
Embed
Embed presentation
Download
Downloaded 11 times
1
/ 6
2
/ 6
Most read
3
/ 6
4
/ 6
Most read
5
/ 6
Most read
6
/ 6
More Related Content
PDF
Flutterで単体テストを行う方法とGitHub Actionsを使った自動化
by
Shinnosuke Tokuda
PPTX
地域での脳梗塞治療について【ADVANCED】
by
NEURALGPNETWORK
PPTX
セキュリティの基本とAWSでのセキュリティ対策をフルコースで味あう
by
ShinodaYukihiro
PPTX
第15回JSSUG「Azure SQL Database 超入門」
by
裕之 木下
PPTX
怖い咽頭痛を見極めるTips_新撰医チバ 第5回ミニセミナー
by
shinsenichiba
PDF
ベロシティを上手く使って 技術的負債を計画的に解消する
by
Koichiro Matsuoka
PPTX
ASTERIA WARPをもっと便利に使いこなすためのtips紹介
by
ASTERIA User Group
PPTX
もしWebセキュリティのエンジニアがRFC7540の「HTTP/2アプリ」をWeb診断したら
by
abend_cve_9999_0001
Flutterで単体テストを行う方法とGitHub Actionsを使った自動化
by
Shinnosuke Tokuda
地域での脳梗塞治療について【ADVANCED】
by
NEURALGPNETWORK
セキュリティの基本とAWSでのセキュリティ対策をフルコースで味あう
by
ShinodaYukihiro
第15回JSSUG「Azure SQL Database 超入門」
by
裕之 木下
怖い咽頭痛を見極めるTips_新撰医チバ 第5回ミニセミナー
by
shinsenichiba
ベロシティを上手く使って 技術的負債を計画的に解消する
by
Koichiro Matsuoka
ASTERIA WARPをもっと便利に使いこなすためのtips紹介
by
ASTERIA User Group
もしWebセキュリティのエンジニアがRFC7540の「HTTP/2アプリ」をWeb診断したら
by
abend_cve_9999_0001
What's hot
PDF
運用中の大規模オンラインゲームで 8年ぶりにPHPバージョンアップをした話
by
KLab Inc. / Tech
PDF
ストリーミングサービス研究グループ
by
Masaaki Nabeshima
PDF
オススメのJavaログ管理手法 ~コンテナ編~(Open Source Conference 2022 Online/Spring 発表資料)
by
NTT DATA Technology & Innovation
PDF
知っておきたいFirebase の色んな上限について
by
Kenichi Tatsuhama
PDF
.NET 6 と Blazor で作るクロスプラットフォームアプリ概要
by
Akira Inoue
PPTX
脱 Excel設計書
by
rai
PDF
Hyper vを理解する
by
Naoki Abe
PPTX
関数型・オブジェクト指向宗教戦争に疲れたなたに送るGo言語入門
by
Tadahiro Ishisaka
PPTX
『VMware Cloud on AWS』×『Veeam』移行/データ保護の最適解はこれだ!
by
株式会社クライム
PDF
20180717 AWS Black Belt Online Seminar AWS大阪ローカルリージョンの活用とAWSで実現するDisaster Rec...
by
Amazon Web Services Japan
PDF
マスターデータの キャッシュシステムの改善の話
by
natsumi_ishizaka
PPTX
[社内勉強会]ELBとALBと数万スパイク負荷テスト
by
Takahiro Moteki
PDF
[DI12] あらゆるデータをビジネスに活用! Azure Data Lake を中心としたビックデータ処理基盤のアーキテクチャと実装
by
de:code 2017
PDF
【de:code 2020】 Power Platform いまさら聞けないモデル駆動型アプリケーション
by
日本マイクロソフト株式会社
PDF
ドメイン駆動設計 ( DDD ) をやってみよう
by
増田 亨
PDF
AWS Black Belt Techシリーズ Elastic Load Balancing (ELB)
by
Amazon Web Services Japan
PDF
IT エンジニアのための 流し読み Microsoft 365 - 入門!Microsoft Defender ATP
by
TAKUYA OHTA
PDF
20200526 AWS Black Belt Online Seminar AWS X-Ray
by
Amazon Web Services Japan
PDF
“見てわかる”ファイバーチャネルSAN基礎講座(第6弾: 最終回)~困った時もこれで安心(?)、FC SANにおけるトラブルシューティングのコツとは??~
by
Brocade
PPTX
ZabbixとAWS
by
真乙 九龍
運用中の大規模オンラインゲームで 8年ぶりにPHPバージョンアップをした話
by
KLab Inc. / Tech
ストリーミングサービス研究グループ
by
Masaaki Nabeshima
オススメのJavaログ管理手法 ~コンテナ編~(Open Source Conference 2022 Online/Spring 発表資料)
by
NTT DATA Technology & Innovation
知っておきたいFirebase の色んな上限について
by
Kenichi Tatsuhama
.NET 6 と Blazor で作るクロスプラットフォームアプリ概要
by
Akira Inoue
脱 Excel設計書
by
rai
Hyper vを理解する
by
Naoki Abe
関数型・オブジェクト指向宗教戦争に疲れたなたに送るGo言語入門
by
Tadahiro Ishisaka
『VMware Cloud on AWS』×『Veeam』移行/データ保護の最適解はこれだ!
by
株式会社クライム
20180717 AWS Black Belt Online Seminar AWS大阪ローカルリージョンの活用とAWSで実現するDisaster Rec...
by
Amazon Web Services Japan
マスターデータの キャッシュシステムの改善の話
by
natsumi_ishizaka
[社内勉強会]ELBとALBと数万スパイク負荷テスト
by
Takahiro Moteki
[DI12] あらゆるデータをビジネスに活用! Azure Data Lake を中心としたビックデータ処理基盤のアーキテクチャと実装
by
de:code 2017
【de:code 2020】 Power Platform いまさら聞けないモデル駆動型アプリケーション
by
日本マイクロソフト株式会社
ドメイン駆動設計 ( DDD ) をやってみよう
by
増田 亨
AWS Black Belt Techシリーズ Elastic Load Balancing (ELB)
by
Amazon Web Services Japan
IT エンジニアのための 流し読み Microsoft 365 - 入門!Microsoft Defender ATP
by
TAKUYA OHTA
20200526 AWS Black Belt Online Seminar AWS X-Ray
by
Amazon Web Services Japan
“見てわかる”ファイバーチャネルSAN基礎講座(第6弾: 最終回)~困った時もこれで安心(?)、FC SANにおけるトラブルシューティングのコツとは??~
by
Brocade
ZabbixとAWS
by
真乙 九龍
MeCabでオリジナル辞書を構築してみる
1.
MeCabでオリジナル辞書を 構築してみる
2.
辞書の作り方 〜名詞〜 STEP1 Excelなどで,以下のように作成します. 登録した い名詞 ID ID
重み 品詞 品詞の 説明 * * * * 登録した い単語 カタカナ 表示 カタカナ 表記 IDは適当なものでOK 重みは低い値のものから 優先されるので,重要単語は 低く設定する
3.
辞書の作り方 〜動詞〜 STEP1 Excelなどで,以下のように作成します. • 動詞の辞書は,「原型」と「活用形」を表記する必要あり. •
IDは,MeCabに登録されている「する」「きる」「つく」などの IDを動詞に合わせて設定する. • 重みは,名詞と同様で低いものが優先される.
4.
CSVファイルの文字コードをUTF-8に変換する STEP2 MeCab辞書は,UTF-8の文字コードになっている. なので,CSVファイルの文字コードをUTF-8に変換する. COMMAND $ nkf –w
変換元のCSVファイル名.csv > 変換後のCSVファイル名.csv Icing on the cake 「-bash: nkf: command not found」が出る場合 HOME BREWなどでnkfコマンドのパッケージをインストールします. →HOME BREWのインストール:http://brew.sh/index_ja.html HOME BREWでnkfをインストール →$ brew install nkf
5.
CSVファイルをMeCab辞書にコンパイルする STEP3 文字コードがUTF-8のオリジナル辞書用CSVファイルを, MeCab辞書に変換する. COMMAND $ /usr/local/libexec/mecab/mecab-dict-index -d /usr/local/lib/mecab/dic/ipadic
-u original.dic -f utf-8 -t utf-8 オリジ ナル辞書CSVファイル名.csv ※文字コードは「UTF-8」,改行コードは「¥r(LINUX)」でないと エラーが出る 「original.dec」ファイルが作成される
6.
オリジナル辞書をMeCabに登録する STEP4 出来上がったMeCab用オリジナル辞書(original.dic)を, MeCabに登録する. 作成された,「original.dec」ファイルを,以下のディレクトリに移動 /usr/local/lib/mecab/dic/ipadic/ COMMAND $ sudo vi
/usr/local/lib/mecab/dic/ipadic/dicrc /usr/local/lib/mecab/dic/ipadic/dicrc に,以下の一行を追加 userdic = /usr/local/lib/mecab/dic/ipadic/original.dic
Download