Janome は現在最も利用されていると思われる MeCab という形態素解析器の Python での再実装版です.Janome の準備は MeCab と比べて非常に簡単です.Windows では Anaconda Prompt や Powershell を,macOS ではターミナルを使って,pip
コマンドで Janome をインストールできます.なお,Jupyter Notebook のシェルコマンドを利用しても構いません.
% pip install janome ⏎
Collecting janome
Downloading Janome-0.4.1-py2.py3-none-any.whl (19.7 MB)
|████████████████████████████████| 19.7 MB 13.0 MB/s
Installing collected packages: janome
Successfully installed janome-0.4.1
学内の情報処理実習室で pip install janome
を実行するとエラーになる可能性があります.この場合は pip install janome --user
のように --user
オプションを指定して実行してください.
なお,Janome は MeCab と比較すると処理速度は低速であるので,大量の文章を形態素解析する際には圧倒的に不利になります.また,MeCab で特に高機能な mecab-ipadic-NEologd 辞書を使った形態素解析結果と比べると,Janome で得られる結果は劣ります.しかしながら,イントールに手間がかからないため学内の情報処理実習室でも気軽に利用できるという利点があります.