Python入門トップページ


目次

  1. 準備
  2. Janome の第一歩
  3. 簡単な形態素解析
  4. TF-IDF を計算してみよう
  5. ワードクラウドを作成してみよう

Python で自然言語処理をしてみよう - Janome 編

準備

Janome は現在最も利用されていると思われる MeCab という形態素解析器の Python での再実装版です.Janome の準備は MeCab と比べて非常に簡単です.Windows では Anaconda Prompt や Powershell を,macOS ではターミナルを使って,pip コマンドで Janome をインストールできます.なお,Jupyter Notebook のシェルコマンドを利用しても構いません.

% pip install janome ⏎
Collecting janome
  Downloading Janome-0.4.1-py2.py3-none-any.whl (19.7 MB)
     |████████████████████████████████| 19.7 MB 13.0 MB/s
Installing collected packages: janome
Successfully installed janome-0.4.1

学内の情報処理実習室で pip install janome を実行するとエラーになる可能性があります.この場合は pip install janome --user のように --user オプションを指定して実行してください.

なお,Janome は MeCab と比較すると処理速度は低速であるので,大量の文章を形態素解析する際には圧倒的に不利になります.また,MeCab で特に高機能な mecab-ipadic-NEologd 辞書を使った形態素解析結果と比べると,Janome で得られる結果は劣ります.しかしながら,イントールに手間がかからないため学内の情報処理実習室でも気軽に利用できるという利点があります.

目次に戻る