この記事を読むのに必要な時間は約 3 分です。
コマンド
余り解説する程の話はありませんのですぱぱぱぱーっと行きます。
git clone https://github.com/neologd/mecab-ipadic-neologd.git
cd mecab-ipadic-neologd/seed
xz -dv *ls.xz
/usr/libexec/mecab/mecab-dict-index -d /usr/lib64/mecab/dic/ipadic -u o.dic -f utf-8 -t utf-8 *.csv
cd mecab-ipadic-neologd/seed
xz -dv *ls.xz
/usr/libexec/mecab/mecab-dict-index -d /usr/lib64/mecab/dic/ipadic -u o.dic -f utf-8 -t utf-8 *.csv
それでは形態素解析を再びやってみましょう!!
before
echo 西野カナは日本の歌姫 | mecab
西野 名詞,人名,*,*,西野,にしの,*
カナ 名詞,普通名詞,*,*,*,*,*
は 助詞,副助詞,*,*,は,は,*
日本 名詞,地名,*,*,日本,にっぽん,*
の 助詞,接続助詞,*,*,の,の,*
歌姫 名詞,普通名詞,*,*,歌姫,うたひめ,代表表記:歌姫
カナ 名詞,普通名詞,*,*,*,*,*
は 助詞,副助詞,*,*,は,は,*
日本 名詞,地名,*,*,日本,にっぽん,*
の 助詞,接続助詞,*,*,の,の,*
歌姫 名詞,普通名詞,*,*,歌姫,うたひめ,代表表記:歌姫
after
echo 西野カナは日本の歌姫 | mecab -u o.dic
西野カナ 名詞,固有名詞,人名,一般,*,*,西野カナ,ニシノカナ,ニシノカナ
は 助詞,副助詞,*,*,は,は,*
日本 名詞,地名,*,*,日本,にっぽん,*
の 助詞,接続助詞,*,*,の,の,*
歌姫 名詞,普通名詞,*,*,歌姫,うたひめ,代表表記:歌姫
西野カナ 名詞,固有名詞,人名,一般,*,*,西野カナ,ニシノカナ,ニシノカナ
は 助詞,副助詞,*,*,は,は,*
日本 名詞,地名,*,*,日本,にっぽん,*
の 助詞,接続助詞,*,*,の,の,*
歌姫 名詞,普通名詞,*,*,歌姫,うたひめ,代表表記:歌姫
見事に 西野カナ に一致してくれました!!
viterbi.cpp(50) [tokenizer_->open(param)] tokenizer.cpp(130) [sysdic->isCompatible(*d)] incompatible dictionary: ****.dic
こんなエラーが出た人!!
多分出る人が多いんじゃないかなと思います。
このエラーで困った人はこちらの記事も見てください。
viterbi.cpp(50) [tokenizer_->open(param)] tokenizer.cpp(130) [sysdic->isCompatible(*d)] incompatible dictionary: ****.dic
viterbi.cpp(50) [tokenizer_->open(param)] tokenizer.cpp(130) [sysdic->isCompatible(*d)] incompatible dictionary: で困っている人!!文字コードとかバージョン以外にも原因があるかもしれませんよ!
※このエラーは文字コードばかり見てても気づけないかもしれませんよ♪
(´◉◞౪◟◉)