仮想開発環境の構築トップページ


Cabocha で構文解析(係り受け解析)を行う

ここの手順で Ubuntu の設定をすると CaboCha とMeCabの拡張辞書 (mecab-ipadic-NEologd) がインストールされています.このページでは CaboCha で構文解析(係り受け解析)を行なってみよう.

目次

  1. 構文解析の実行
  2. 辞書の指定
  3. テキストファイルの準備
  4. テキストファイルの構文解析

構文解析の実行

CaboCha で構文解析(係り受け解析)を行うには ubuntu にログインして cabocha コマンドを実行します.その後,構文解析を実行したい文を入力し,Enter で実行します.終了するには Ctrl + C を押します.

vagrant@ubuntu2204 ~ $ cabocha ⏎
今日はメロンパンを食べました ⏎
      今日は---D
  メロンパンを-D
      食べました
EOS
自然言語処理の基本である形態素解析と構文解析を勉強します ⏎
自然言語処理の-D
      基本である---D
      形態素解析と-D
          構文解析を-D
            勉強します
EOS
^C # 終了するには Ctrl + C を押す
vagrant@ubuntu2204 ~ $

上の簡易 Tree 表示による結果から,最初の文では「今日は 食べました」という係り受けと,「メロンパンを 食べました」という係り受けがわかります.コンピュータで処理しやすい形式で結果を取得するには -f1 オプションを指定します.

vagrant@ubuntu2204 ~ $ cabocha -f1 ⏎
今日はメロンパンを食べました ⏎
* 0 2D 0/1 -1.940068
今日	名詞,副詞可能,*,*,*,*,今日,キョウ,キョー
は	助詞,係助詞,*,*,*,*,は,ハ,ワ
* 1 2D 1/2 -1.940068
メロン	名詞,一般,*,*,*,*,メロン,メロン,メロン
パン	名詞,一般,*,*,*,*,パン,パン,パン
を	助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
* 2 -1D 0/2 0.000000
食べ	動詞,自立,*,*,一段,連用形,食べる,タベ,タベ
まし	助動詞,*,*,*,特殊・マス,連用形,ます,マシ,マシ
た	助動詞,*,*,*,特殊・タ,基本形,た,タ,タ
EOS
自然言語処理の基本である形態素解析と構文解析を勉強します ⏎
* 0 1D 2/3 1.581318
自然	名詞,形容動詞語幹,*,*,*,*,自然,シゼン,シゼン
言語	名詞,一般,*,*,*,*,言語,ゲンゴ,ゲンゴ
処理	名詞,サ変接続,*,*,*,*,処理,ショリ,ショリ
の	助詞,連体化,*,*,*,*,の,ノ,ノ
* 1 3D 0/2 1.677741
基本	名詞,一般,*,*,*,*,基本,キホン,キホン
で	助動詞,*,*,*,特殊・ダ,連用形,だ,デ,デ
ある	助動詞,*,*,*,五段・ラ行アル,基本形,ある,アル,アル
* 2 3D 1/2 1.021878
形態素	名詞,一般,*,*,*,*,形態素,ケイタイソ,ケイタイソ
解析	名詞,サ変接続,*,*,*,*,解析,カイセキ,カイセキ
と	助詞,並立助詞,*,*,*,*,と,ト,ト
* 3 4D 1/2 1.677741
構文	名詞,一般,*,*,*,*,構文,コウブン,コーブン
解析	名詞,サ変接続,*,*,*,*,解析,カイセキ,カイセキ
を	助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
* 4 -1D 1/2 0.000000
勉強	名詞,サ変接続,*,*,*,*,勉強,ベンキョウ,ベンキョー
し	動詞,自立,*,*,サ変・スル,連用形,する,シ,シ
ます	助動詞,*,*,*,特殊・マス,基本形,ます,マス,マス
EOS
^C # 終了するには Ctrl + C を押す
vagrant@ubuntu2204 ~ $

上の結果から例えば「メロンパンを 食べました」という係り受けの「メロンパンを」の文節について,「メロン」「パン」「を」という形態素に分割されていることがわかります.

目次に戻る

辞書の指定

構文解析に用いる辞書を指定するには -d オプションを利用します.次の例では標準辞書を指定しているので,上と全く同じ結果が得られるはずです.標準の辞書では「メロンパン」が「メロン」と「パン」という形態素に分割されていることがわかります.

vagrant@ubuntu2204 ~ $ cabocha -d /var/lib/mecab/dic/ipadic-utf8 ⏎
今日はメロンパンを食べました ⏎
      今日は---D
  メロンパンを-D
      食べました
EOS
自然言語処理の基本である形態素解析と構文解析を勉強します ⏎
自然言語処理の-D
      基本である---D
      形態素解析と-D
          構文解析を-D
            勉強します
EOS
^C
vagrant@ubuntu2204 ~ $ cabocha -d /var/lib/mecab/dic/ipadic-utf8 -f1 ⏎
今日はメロンパンを食べました ⏎
* 0 2D 0/1 -1.940068
今日	名詞,副詞可能,*,*,*,*,今日,キョウ,キョー
は	助詞,係助詞,*,*,*,*,は,ハ,ワ
* 1 2D 1/2 -1.940068
メロン	名詞,一般,*,*,*,*,メロン,メロン,メロン
パン	名詞,一般,*,*,*,*,パン,パン,パン
を	助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
* 2 -1D 0/2 0.000000
食べ	動詞,自立,*,*,一段,連用形,食べる,タベ,タベ
まし	助動詞,*,*,*,特殊・マス,連用形,ます,マシ,マシ
た	助動詞,*,*,*,特殊・タ,基本形,た,タ,タ
EOS
自然言語処理の基本である形態素解析と構文解析を勉強します ⏎
* 0 1D 2/3 1.581318
自然	名詞,形容動詞語幹,*,*,*,*,自然,シゼン,シゼン
言語	名詞,一般,*,*,*,*,言語,ゲンゴ,ゲンゴ
処理	名詞,サ変接続,*,*,*,*,処理,ショリ,ショリ
の	助詞,連体化,*,*,*,*,の,ノ,ノ
* 1 3D 0/2 1.677741
基本	名詞,一般,*,*,*,*,基本,キホン,キホン
で	助動詞,*,*,*,特殊・ダ,連用形,だ,デ,デ
ある	助動詞,*,*,*,五段・ラ行アル,基本形,ある,アル,アル
* 2 3D 1/2 1.021878
形態素	名詞,一般,*,*,*,*,形態素,ケイタイソ,ケイタイソ
解析	名詞,サ変接続,*,*,*,*,解析,カイセキ,カイセキ
と	助詞,並立助詞,*,*,*,*,と,ト,ト
* 3 4D 1/2 1.677741
構文	名詞,一般,*,*,*,*,構文,コウブン,コーブン
解析	名詞,サ変接続,*,*,*,*,解析,カイセキ,カイセキ
を	助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
* 4 -1D 1/2 0.000000
勉強	名詞,サ変接続,*,*,*,*,勉強,ベンキョウ,ベンキョー
し	動詞,自立,*,*,サ変・スル,連用形,する,シ,シ
ます	助動詞,*,*,*,特殊・マス,基本形,ます,マス,マス
EOS
^C # 終了するには Ctrl + C を押す
vagrant@ubuntu2204 ~ $

次に,MeCabの拡張辞書である mecab-ipadic-NEologd を指定して構文解析を実行します.拡張辞書を利用すると「メロンパン」が認識できているだけでなく,「自然言語処理」や「形態素解析」「構文解析」なども一つの形態素として認識されていることがわかります.拡張辞書では芸能人の芸名のような固有名詞についても多くが登録されています.

vagrant@ubuntu2204 ~ $ cabocha -d /usr/lib/x86_64-linux-gnu/mecab/dic/mecab-ipadic-neologd ⏎
今日はメロンパンを食べました ⏎
      今日は---D
  メロンパンを-D
      食べました
EOS
自然言語処理の基本である形態素解析と構文解析を勉強します ⏎
自然言語処理の-D
      基本である-D
      形態素解析と-D
          構文解析を-D
            勉強します
EOS
^C
vagrant@ubuntu2204 ~ $ cabocha -d /usr/lib/x86_64-linux-gnu/mecab/dic/mecab-ipadic-neologd -f1 ⏎
今日はメロンパンを食べました ⏎
* 0 2D 0/1 -1.880791
今日	名詞,副詞可能,*,*,*,*,今日,キョウ,キョー
は	助詞,係助詞,*,*,*,*,は,ハ,ワ
* 1 2D 0/1 -1.880791
メロンパン	名詞,固有名詞,一般,*,*,*,メロンパン,メロンパン,メロンパン
を	助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
* 2 -1D 0/2 0.000000
食べ	動詞,自立,*,*,一段,連用形,食べる,タベ,タベ
まし	助動詞,*,*,*,特殊・マス,連用形,ます,マシ,マシ
た	助動詞,*,*,*,特殊・タ,基本形,た,タ,タ
EOS
自然言語処理の基本である形態素解析と構文解析を勉強します ⏎
* 0 1D 0/1 1.499403
自然言語処理	名詞,固有名詞,一般,*,*,*,自然言語処理,シゼンゲンゴショリ,シゼンゲンゴショリ
の	助詞,連体化,*,*,*,*,の,ノ,ノ
* 1 2D 0/2 0.027028
基本	名詞,一般,*,*,*,*,基本,キホン,キホン
で	助動詞,*,*,*,特殊・ダ,連用形,だ,デ,デ
ある	助動詞,*,*,*,五段・ラ行アル,基本形,ある,アル,アル
* 2 3D 0/1 0.256312
形態素解析	名詞,固有名詞,一般,*,*,*,形態素解析,ケイタイソカイセキ,ケイタイソカイセキ
と	助詞,並立助詞,*,*,*,*,と,ト,ト
* 3 4D 0/1 0.256312
構文解析	名詞,固有名詞,一般,*,*,*,構文解析,コウブンカイセキ,コーブンカイセキ
を	助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
* 4 -1D 1/2 0.000000
勉強	名詞,サ変接続,*,*,*,*,勉強,ベンキョウ,ベンキョー
し	動詞,自立,*,*,サ変・スル,連用形,する,シ,シ
ます	助動詞,*,*,*,特殊・マス,基本形,ます,マス,マス
EOS
^C # 終了するには Ctrl + C を押す
vagrant@ubuntu2204 ~ $

なお,拡張辞書のインストール先は環境によって異なる可能性があることにも注意してください.

テキストファイルの準備

テキストファイルの形態素解析を行うこともできます.なおテキストファイルの文字コードは UTF-8 として作業します.既に解析したいテキストファイルがあれば,Documents フォルダなど任意の場所に設置して次のステップに進んでください.ここでは GitHub のサンプルデータセットをダウンロードして展開します.

まず,GitHub からクローンを作成(ダウンロード)します.

vagrant@ubuntu2204 ~ $ cd Documents/ ⏎
vagrant@ubuntu2204 Documents $ git clone https://github.com/rinsaka/sample-data-sets.git ⏎
Cloning into 'sample-data-sets'...
remote: Enumerating objects: 282, done.
remote: Counting objects: 100% (77/77), done.
remote: Compressing objects: 100% (47/47), done.
remote: Total 282 (delta 39), reused 68 (delta 30), pack-reused 205
Receiving objects: 100% (282/282), 15.32 MiB | 13.46 MiB/s, done.
Resolving deltas: 100% (131/131), done.
vagrant@ubuntu2204 Documents $

ダウンロードされたデータセットを確認します.サンプル文書データは corpora.zip です.この圧縮ファイルを unzip コマンドで展開します.

vagrant@ubuntu2204 Documents $ cd sample-data-sets/ ⏎
vagrant@ubuntu2204 sample-data-sets $ ls ⏎
(中略)
corpora.zip                            names.json
(中略)
vagrant@ubuntu2204 sample-data-sets $ unzip corpora.zip ⏎
Archive:  corpora.zip
  inflating: corpora/en_abs_1.txt
  inflating: corpora/en_abs_2.txt
  inflating: corpora/en_abs_3.txt
  inflating: corpora/en_abs_4.txt
  inflating: corpora/ja_abs_1.txt
  inflating: corpora/ja_abs_2.txt
  inflating: corpora/ja_abs_3.txt
  inflating: corpora/ja_abs_4.txt
  inflating: corpora/ja_abs_5.txt
  inflating: corpora/sample_1.txt
  inflating: corpora/sample_2.txt
  inflating: corpora/sample_3.txt
 extracting: corpora/sample_4.txt
  inflating: corpora/sample_5.txt
vagrant@ubuntu2204 sample-data-sets $ ls ⏎
(中略)
corpora                                names.json
corpora.zip                            novels.json
(中略)
vagrant@ubuntu2204 sample-data-sets $ cd corpora/ ⏎
vagrant@ubuntu2204 corpora $

展開されたテキストファイルを確認します.例えば ja_abs_1.txt ファイルの中身を確認します.

vagrant@ubuntu2204 corpora $ ls ⏎
  en_abs_1.txt  en_abs_4.txt  ja_abs_3.txt  sample_1.txt  sample_4.txt
  en_abs_2.txt  ja_abs_1.txt  ja_abs_4.txt  sample_2.txt  sample_5.txt
  en_abs_3.txt  ja_abs_2.txt  ja_abs_5.txt  sample_3.txt
vagrant@ubuntu2204 corpora $ cat ja_abs_5.txt ⏎
本論文ではシステムアベイラビリティを最大化する最適ソフトウェア若化スケジュールを適応的に導出するアプローチを提案する。具体的にはn個の障害発生時間データからノンパラメトリック予測推論に基づき,信頼度関数の上下限を定式化する。次に,信頼度関数の上下限を用いてシステムアベイラビリティの上下限を定式化し,n+1番目の障害に対してこれらを最大化する最適ソフトウェア若化スケジュールを導出する。更に,n+2番目の障害に対しては適応的に最適ソフトウェア若化スケジュールを導出する。シミュレーション実験を通して提案手法の有効性を検証する。
vagrant@ubuntu2204 corpora $

目次に戻る

テキストファイルの構文解析

テキストファイルの構文解析を行うには,ファイル名を引数に与えます.

vagrant@ubuntu2204 corpora $ cabocha -d /usr/lib/x86_64-linux-gnu/mecab/dic/mecab-ipadic-neologd ja_abs_5.txt ⏎
                        本論文では-------------D
          システムアベイラビリティを-D         |
                            最大化する-D       |
      最適ソフトウェア若化スケジュールを---D   |
                                  適応的に-D   |
                                    導出する-D |
                                  アプローチを-D
                                      提案する。-------------D
                                        具体的には-----------D
                                               n個の-D       |
                                障害発生時間データから-------D
                            ノンパラメトリック予測推論に-----D
                                       基づき,信頼度関数の-D |
                                                    上下限を-D
                                                  定式化する。-----------------------D
                                                            次に-----D               |
                                                     ,信頼度関数の-D |               |
                                                            上下限を-D               |
                                                                用いて-----------D   |
                                              システムアベイラビリティの-D       |   |
                                                                  上下限を-------D   |
                                                          定式化し,n+1番目の-D   |   |
                                                                  障害に対して---D   |
                                                                        これらを-D   |
                                                                        最大化する-D |
                                                  最適ソフトウェア若化スケジュールを-D
                                                                            導出する。-----------D
                                                                                    更に---------D
                                                                                ,n+2番目の-D     |
                                                                              障害に対しては-----D
                                                                                      適応的に---D
                                                              最適ソフトウェア若化スケジュールを-D
                                                                                        導出する。-------D
                                                                        シミュレーション実験を通して-----D
                                                                                            提案手法の-D |
                                                                                                有効性を-D
                                                                                                検証する。
EOS
vagrant@ubuntu2204 corpora $

出力形式を変更します.

vagrant@ubuntu2204 corpora $ cabocha -d /usr/lib/x86_64-linux-gnu/mecab/dic/mecab-ipadic-neologd ja_abs_5.txt -f1 ⏎
* 0 7D 1/3 1.635588
本	接頭詞,名詞接続,*,*,*,*,本,ホン,ホン
論文	名詞,一般,*,*,*,*,論文,ロンブン,ロンブン
で	助詞,格助詞,一般,*,*,*,で,デ,デ
は	助詞,係助詞,*,*,*,*,は,ハ,ワ
* 1 2D 1/2 2.274324
システム	名詞,一般,*,*,*,*,システム,システム,システム
アベイラビリティ	名詞,一般,*,*,*,*,アベイラビリティ,アベイラビリティ,アベイラビリティ
を	助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
* 2 3D 2/2 1.882897
最大	名詞,一般,*,*,*,*,最大,サイダイ,サイダイ
化	名詞,接尾,サ変接続,*,*,*,化,カ,カ
する	動詞,自立,*,*,サ変・スル,基本形,する,スル,スル
* 3 5D 4/5 1.303629
最適	名詞,一般,*,*,*,*,最適,サイテキ,サイテキ
ソフトウェア	名詞,一般,*,*,*,*,ソフトウェア,ソフトウェア,ソフトウェア
若	名詞,一般,*,*,*,*,若,ワカ,ワカ
化	名詞,接尾,サ変接続,*,*,*,化,カ,カ
スケジュール	名詞,一般,*,*,*,*,スケジュール,スケジュール,スケジュール
を	助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
* 4 5D 1/2 2.109265
適応	名詞,サ変接続,*,*,*,*,適応,テキオウ,テキオー
的	名詞,接尾,形容動詞語幹,*,*,*,的,テキ,テキ
に	助詞,副詞化,*,*,*,*,に,ニ,ニ
* 5 6D 1/1 1.484273
導出	名詞,サ変接続,*,*,*,*,導出,ドウシュツ,ドーシュツ
する	動詞,自立,*,*,サ変・スル,基本形,する,スル,スル
* 6 7D 0/1 3.580149
アプローチ	名詞,サ変接続,*,*,*,*,アプローチ,アプローチ,アプローチ
を	助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
* 7 14D 1/1 2.268678
提案	名詞,サ変接続,*,*,*,*,提案,テイアン,テイアン
する	動詞,自立,*,*,サ変・スル,基本形,する,スル,スル
。	記号,句点,*,*,*,*,。,。,。
* 8 14D 0/2 1.332075
具体的	名詞,固有名詞,一般,*,*,*,具体的,グタイテキ,グタイテキ
に	助詞,格助詞,一般,*,*,*,に,ニ,ニ
は	助詞,係助詞,*,*,*,*,は,ハ,ワ
* 9 10D 1/2 1.333740
n	名詞,固有名詞,組織,*,*,*,*
個	名詞,一般,*,*,*,*,個,コ,コ
の	助詞,連体化,*,*,*,*,の,ノ,ノ
* 10 14D 3/4 2.309502
障害	名詞,一般,*,*,*,*,障害,ショウガイ,ショーガイ
発生	名詞,サ変接続,*,*,*,*,発生,ハッセイ,ハッセイ
時間	名詞,副詞可能,*,*,*,*,時間,ジカン,ジカン
データ	名詞,一般,*,*,*,*,データ,データ,データ
から	助詞,格助詞,一般,*,*,*,から,カラ,カラ
* 11 14D 3/4 2.466074
ノン	接頭詞,名詞接続,*,*,*,*,ノン,ノン,ノン
パラメトリック	名詞,固有名詞,一般,*,*,*,パラメトリック,パラメトリック,パラメトリック
予測	名詞,サ変接続,*,*,*,*,予測,ヨソク,ヨソク
推論	名詞,サ変接続,*,*,*,*,推論,スイロン,スイロン
に	助詞,格助詞,一般,*,*,*,に,ニ,ニ
* 12 13D 3/4 1.736117
基づき	動詞,自立,*,*,五段・カ行イ音便,連用形,基づく,モトヅキ,モトズキ
,	記号,一般,*,*,*,*,*
信頼度	名詞,固有名詞,一般,*,*,*,信頼度,シンライド,シンライド
関数	名詞,一般,*,*,*,*,関数,カンスウ,カンスー
の	助詞,連体化,*,*,*,*,の,ノ,ノ
* 13 14D 1/2 3.246175
上下	名詞,サ変接続,*,*,*,*,上下,ジョウゲ,ジョーゲ
限	名詞,接尾,一般,*,*,*,限,ゲン,ゲン
を	助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
* 14 26D 2/2 1.630560
定式	名詞,一般,*,*,*,*,定式,テイシキ,テイシキ
化	名詞,接尾,サ変接続,*,*,*,化,カ,カ
する	動詞,自立,*,*,サ変・スル,基本形,する,スル,スル
。	記号,句点,*,*,*,*,。,。,。
* 15 18D 0/0 1.206832
次に	副詞,一般,*,*,*,*,次に,ツギニ,ツギニ
* 16 17D 2/3 1.828548
,	記号,一般,*,*,*,*,*
信頼度	名詞,固有名詞,一般,*,*,*,信頼度,シンライド,シンライド
関数	名詞,一般,*,*,*,*,関数,カンスウ,カンスー
の	助詞,連体化,*,*,*,*,の,ノ,ノ
* 17 18D 1/2 2.029559
上下	名詞,サ変接続,*,*,*,*,上下,ジョウゲ,ジョーゲ
限	名詞,接尾,一般,*,*,*,限,ゲン,ゲン
を	助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
* 18 24D 0/1 0.976441
用い	動詞,自立,*,*,一段,連用形,用いる,モチイ,モチイ
て	助詞,接続助詞,*,*,*,*,て,テ,テ
* 19 20D 1/2 2.100285
システム	名詞,一般,*,*,*,*,システム,システム,システム
アベイラビリティ	名詞,一般,*,*,*,*,アベイラビリティ,アベイラビリティ,アベイラビリティ
の	助詞,連体化,*,*,*,*,の,ノ,ノ
* 20 24D 1/2 0.325360
上下	名詞,サ変接続,*,*,*,*,上下,ジョウゲ,ジョーゲ
限	名詞,接尾,一般,*,*,*,限,ゲン,ゲン
を	助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
* 21 22D 7/8 1.898785
定式	名詞,一般,*,*,*,*,定式,テイシキ,テイシキ
化	名詞,接尾,サ変接続,*,*,*,化,カ,カ
し	動詞,自立,*,*,サ変・スル,連用形,する,シ,シ
,	記号,一般,*,*,*,*,*
n	名詞,固有名詞,組織,*,*,*,*
+	記号,一般,*,*,*,*,*
1番	名詞,固有名詞,一般,*,*,*,1番,イチバン,イチバン
目	名詞,接尾,一般,*,*,*,目,メ,メ
の	助詞,連体化,*,*,*,*,の,ノ,ノ
* 22 24D 0/1 0.852684
障害	名詞,一般,*,*,*,*,障害,ショウガイ,ショーガイ
に対して	助詞,格助詞,連語,*,*,*,に対して,ニタイシテ,ニタイシテ
* 23 24D 0/1 1.930482
これら	名詞,代名詞,一般,*,*,*,これら,コレラ,コレラ
を	助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
* 24 25D 2/2 1.417459
最大	名詞,一般,*,*,*,*,最大,サイダイ,サイダイ
化	名詞,接尾,サ変接続,*,*,*,化,カ,カ
する	動詞,自立,*,*,サ変・スル,基本形,する,スル,スル
* 25 26D 4/5 2.991441
最適	名詞,一般,*,*,*,*,最適,サイテキ,サイテキ
ソフトウェア	名詞,一般,*,*,*,*,ソフトウェア,ソフトウェア,ソフトウェア
若	名詞,一般,*,*,*,*,若,ワカ,ワカ
化	名詞,接尾,サ変接続,*,*,*,化,カ,カ
スケジュール	名詞,一般,*,*,*,*,スケジュール,スケジュール,スケジュール
を	助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
* 26 32D 1/1 1.974833
導出	名詞,サ変接続,*,*,*,*,導出,ドウシュツ,ドーシュツ
する	動詞,自立,*,*,サ変・スル,基本形,する,スル,スル
。	記号,句点,*,*,*,*,。,。,。
* 27 32D 0/0 2.279492
更に	副詞,助詞類接続,*,*,*,*,更に,サラニ,サラニ
* 28 29D 4/5 1.928752
,	記号,一般,*,*,*,*,*
n	名詞,固有名詞,組織,*,*,*,*
+	記号,一般,*,*,*,*,*
2番	名詞,固有名詞,一般,*,*,*,2番,ニバン,ニバン
目	名詞,接尾,一般,*,*,*,目,メ,メ
の	助詞,連体化,*,*,*,*,の,ノ,ノ
* 29 32D 0/2 2.004942
障害	名詞,一般,*,*,*,*,障害,ショウガイ,ショーガイ
に対して	助詞,格助詞,連語,*,*,*,に対して,ニタイシテ,ニタイシテ
は	助詞,係助詞,*,*,*,*,は,ハ,ワ
* 30 32D 1/2 3.172817
適応	名詞,サ変接続,*,*,*,*,適応,テキオウ,テキオー
的	名詞,接尾,形容動詞語幹,*,*,*,的,テキ,テキ
に	助詞,副詞化,*,*,*,*,に,ニ,ニ
* 31 32D 4/5 3.652001
最適	名詞,一般,*,*,*,*,最適,サイテキ,サイテキ
ソフトウェア	名詞,一般,*,*,*,*,ソフトウェア,ソフトウェア,ソフトウェア
若	名詞,一般,*,*,*,*,若,ワカ,ワカ
化	名詞,接尾,サ変接続,*,*,*,化,カ,カ
スケジュール	名詞,一般,*,*,*,*,スケジュール,スケジュール,スケジュール
を	助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
* 32 36D 1/1 -0.847292
導出	名詞,サ変接続,*,*,*,*,導出,ドウシュツ,ドーシュツ
する	動詞,自立,*,*,サ変・スル,基本形,する,スル,スル
。	記号,句点,*,*,*,*,。,。,。
* 33 36D 1/2 -0.847292
シミュレーション	名詞,サ変接続,*,*,*,*,シミュレーション,シミュレーション,シミュレーション
実験	名詞,サ変接続,*,*,*,*,実験,ジッケン,ジッケン
を通して	助詞,格助詞,連語,*,*,*,を通して,ヲトオシテ,ヲトーシテ
* 34 35D 1/2 2.068991
提案	名詞,サ変接続,*,*,*,*,提案,テイアン,テイアン
手法	名詞,一般,*,*,*,*,手法,シュホウ,シュホー
の	助詞,連体化,*,*,*,*,の,ノ,ノ
* 35 36D 1/2 -0.847292
有効	名詞,形容動詞語幹,*,*,*,*,有効,ユウコウ,ユーコー
性	名詞,接尾,一般,*,*,*,性,セイ,セイ
を	助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
* 36 -1D 1/1 0.000000
検証	名詞,サ変接続,*,*,*,*,検証,ケンショウ,ケンショー
する	動詞,自立,*,*,サ変・スル,基本形,する,スル,スル
。	記号,句点,*,*,*,*,。,。,。
EOS
vagrant@ubuntu2204 corpora $

解析結果をファイルに書き出すには > 出力ファイル名 によるリダイレクトを使うと良いでしょう.例えば解析結果を result.txt に書き出します.

vagrant@ubuntu2204 corpora $ cabocha -d /usr/lib/x86_64-linux-gnu/mecab/dic/mecab-ipadic-neologd ja_abs_5.txt -f1 > result.txt ⏎
vagrant@ubuntu2204 corpora $ ls ⏎
en_abs_1.txt  en_abs_4.txt  ja_abs_3.txt  result.txt    sample_3.txt
en_abs_2.txt  ja_abs_1.txt  ja_abs_4.txt  sample_1.txt  sample_4.txt
en_abs_3.txt  ja_abs_2.txt  ja_abs_5.txt  sample_2.txt  sample_5.txt
vagrant@ubuntu2204 corpora $ cat result.txt ⏎
* 0 7D 1/3 1.635588
本	接頭詞,名詞接続,*,*,*,*,本,ホン,ホン
論文	名詞,一般,*,*,*,*,論文,ロンブン,ロンブン
で	助詞,格助詞,一般,*,*,*,で,デ,デ
は	助詞,係助詞,*,*,*,*,は,ハ,ワ
* 1 2D 1/2 2.274324
システム	名詞,一般,*,*,*,*,システム,システム,システム
アベイラビリティ	名詞,一般,*,*,*,*,アベイラビリティ,アベイラビリティ,アベイラビリティ
を	助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
* 2 3D 2/2 1.882897
最大	名詞,一般,*,*,*,*,最大,サイダイ,サイダイ
化	名詞,接尾,サ変接続,*,*,*,化,カ,カ
する	動詞,自立,*,*,サ変・スル,基本形,する,スル,スル
* 3 5D 4/5 1.303629
最適	名詞,一般,*,*,*,*,最適,サイテキ,サイテキ
ソフトウェア	名詞,一般,*,*,*,*,ソフトウェア,ソフトウェア,ソフトウェア
若	名詞,一般,*,*,*,*,若,ワカ,ワカ
化	名詞,接尾,サ変接続,*,*,*,化,カ,カ
スケジュール	名詞,一般,*,*,*,*,スケジュール,スケジュール,スケジュール
を	助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
* 4 5D 1/2 2.109265
適応	名詞,サ変接続,*,*,*,*,適応,テキオウ,テキオー
的	名詞,接尾,形容動詞語幹,*,*,*,的,テキ,テキ
に	助詞,副詞化,*,*,*,*,に,ニ,ニ
* 5 6D 1/1 1.484273
導出	名詞,サ変接続,*,*,*,*,導出,ドウシュツ,ドーシュツ
する	動詞,自立,*,*,サ変・スル,基本形,する,スル,スル
* 6 7D 0/1 3.580149
アプローチ	名詞,サ変接続,*,*,*,*,アプローチ,アプローチ,アプローチ
を	助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
* 7 14D 1/1 2.268678
提案	名詞,サ変接続,*,*,*,*,提案,テイアン,テイアン
する	動詞,自立,*,*,サ変・スル,基本形,する,スル,スル
。	記号,句点,*,*,*,*,。,。,。
* 8 14D 0/2 1.332075
具体的	名詞,固有名詞,一般,*,*,*,具体的,グタイテキ,グタイテキ
に	助詞,格助詞,一般,*,*,*,に,ニ,ニ
は	助詞,係助詞,*,*,*,*,は,ハ,ワ
* 9 10D 1/2 1.333740
n	名詞,固有名詞,組織,*,*,*,*
個	名詞,一般,*,*,*,*,個,コ,コ
の	助詞,連体化,*,*,*,*,の,ノ,ノ
* 10 14D 3/4 2.309502
障害	名詞,一般,*,*,*,*,障害,ショウガイ,ショーガイ
発生	名詞,サ変接続,*,*,*,*,発生,ハッセイ,ハッセイ
時間	名詞,副詞可能,*,*,*,*,時間,ジカン,ジカン
データ	名詞,一般,*,*,*,*,データ,データ,データ
から	助詞,格助詞,一般,*,*,*,から,カラ,カラ
* 11 14D 3/4 2.466074
ノン	接頭詞,名詞接続,*,*,*,*,ノン,ノン,ノン
パラメトリック	名詞,固有名詞,一般,*,*,*,パラメトリック,パラメトリック,パラメトリック
予測	名詞,サ変接続,*,*,*,*,予測,ヨソク,ヨソク
推論	名詞,サ変接続,*,*,*,*,推論,スイロン,スイロン
に	助詞,格助詞,一般,*,*,*,に,ニ,ニ
* 12 13D 3/4 1.736117
基づき	動詞,自立,*,*,五段・カ行イ音便,連用形,基づく,モトヅキ,モトズキ
,	記号,一般,*,*,*,*,*
信頼度	名詞,固有名詞,一般,*,*,*,信頼度,シンライド,シンライド
関数	名詞,一般,*,*,*,*,関数,カンスウ,カンスー
の	助詞,連体化,*,*,*,*,の,ノ,ノ
* 13 14D 1/2 3.246175
上下	名詞,サ変接続,*,*,*,*,上下,ジョウゲ,ジョーゲ
限	名詞,接尾,一般,*,*,*,限,ゲン,ゲン
を	助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
* 14 26D 2/2 1.630560
定式	名詞,一般,*,*,*,*,定式,テイシキ,テイシキ
化	名詞,接尾,サ変接続,*,*,*,化,カ,カ
する	動詞,自立,*,*,サ変・スル,基本形,する,スル,スル
。	記号,句点,*,*,*,*,。,。,。
* 15 18D 0/0 1.206832
次に	副詞,一般,*,*,*,*,次に,ツギニ,ツギニ
* 16 17D 2/3 1.828548
,	記号,一般,*,*,*,*,*
信頼度	名詞,固有名詞,一般,*,*,*,信頼度,シンライド,シンライド
関数	名詞,一般,*,*,*,*,関数,カンスウ,カンスー
の	助詞,連体化,*,*,*,*,の,ノ,ノ
* 17 18D 1/2 2.029559
上下	名詞,サ変接続,*,*,*,*,上下,ジョウゲ,ジョーゲ
限	名詞,接尾,一般,*,*,*,限,ゲン,ゲン
を	助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
* 18 24D 0/1 0.976441
用い	動詞,自立,*,*,一段,連用形,用いる,モチイ,モチイ
て	助詞,接続助詞,*,*,*,*,て,テ,テ
* 19 20D 1/2 2.100285
システム	名詞,一般,*,*,*,*,システム,システム,システム
アベイラビリティ	名詞,一般,*,*,*,*,アベイラビリティ,アベイラビリティ,アベイラビリティ
の	助詞,連体化,*,*,*,*,の,ノ,ノ
* 20 24D 1/2 0.325360
上下	名詞,サ変接続,*,*,*,*,上下,ジョウゲ,ジョーゲ
限	名詞,接尾,一般,*,*,*,限,ゲン,ゲン
を	助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
* 21 22D 7/8 1.898785
定式	名詞,一般,*,*,*,*,定式,テイシキ,テイシキ
化	名詞,接尾,サ変接続,*,*,*,化,カ,カ
し	動詞,自立,*,*,サ変・スル,連用形,する,シ,シ
,	記号,一般,*,*,*,*,*
n	名詞,固有名詞,組織,*,*,*,*
+	記号,一般,*,*,*,*,*
1番	名詞,固有名詞,一般,*,*,*,1番,イチバン,イチバン
目	名詞,接尾,一般,*,*,*,目,メ,メ
の	助詞,連体化,*,*,*,*,の,ノ,ノ
* 22 24D 0/1 0.852684
障害	名詞,一般,*,*,*,*,障害,ショウガイ,ショーガイ
に対して	助詞,格助詞,連語,*,*,*,に対して,ニタイシテ,ニタイシテ
* 23 24D 0/1 1.930482
これら	名詞,代名詞,一般,*,*,*,これら,コレラ,コレラ
を	助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
* 24 25D 2/2 1.417459
最大	名詞,一般,*,*,*,*,最大,サイダイ,サイダイ
化	名詞,接尾,サ変接続,*,*,*,化,カ,カ
する	動詞,自立,*,*,サ変・スル,基本形,する,スル,スル
* 25 26D 4/5 2.991441
最適	名詞,一般,*,*,*,*,最適,サイテキ,サイテキ
ソフトウェア	名詞,一般,*,*,*,*,ソフトウェア,ソフトウェア,ソフトウェア
若	名詞,一般,*,*,*,*,若,ワカ,ワカ
化	名詞,接尾,サ変接続,*,*,*,化,カ,カ
スケジュール	名詞,一般,*,*,*,*,スケジュール,スケジュール,スケジュール
を	助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
* 26 32D 1/1 1.974833
導出	名詞,サ変接続,*,*,*,*,導出,ドウシュツ,ドーシュツ
する	動詞,自立,*,*,サ変・スル,基本形,する,スル,スル
。	記号,句点,*,*,*,*,。,。,。
* 27 32D 0/0 2.279492
更に	副詞,助詞類接続,*,*,*,*,更に,サラニ,サラニ
* 28 29D 4/5 1.928752
,	記号,一般,*,*,*,*,*
n	名詞,固有名詞,組織,*,*,*,*
+	記号,一般,*,*,*,*,*
2番	名詞,固有名詞,一般,*,*,*,2番,ニバン,ニバン
目	名詞,接尾,一般,*,*,*,目,メ,メ
の	助詞,連体化,*,*,*,*,の,ノ,ノ
* 29 32D 0/2 2.004942
障害	名詞,一般,*,*,*,*,障害,ショウガイ,ショーガイ
に対して	助詞,格助詞,連語,*,*,*,に対して,ニタイシテ,ニタイシテ
は	助詞,係助詞,*,*,*,*,は,ハ,ワ
* 30 32D 1/2 3.172817
適応	名詞,サ変接続,*,*,*,*,適応,テキオウ,テキオー
的	名詞,接尾,形容動詞語幹,*,*,*,的,テキ,テキ
に	助詞,副詞化,*,*,*,*,に,ニ,ニ
* 31 32D 4/5 3.652001
最適	名詞,一般,*,*,*,*,最適,サイテキ,サイテキ
ソフトウェア	名詞,一般,*,*,*,*,ソフトウェア,ソフトウェア,ソフトウェア
若	名詞,一般,*,*,*,*,若,ワカ,ワカ
化	名詞,接尾,サ変接続,*,*,*,化,カ,カ
スケジュール	名詞,一般,*,*,*,*,スケジュール,スケジュール,スケジュール
を	助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
* 32 36D 1/1 -0.847292
導出	名詞,サ変接続,*,*,*,*,導出,ドウシュツ,ドーシュツ
する	動詞,自立,*,*,サ変・スル,基本形,する,スル,スル
。	記号,句点,*,*,*,*,。,。,。
* 33 36D 1/2 -0.847292
シミュレーション	名詞,サ変接続,*,*,*,*,シミュレーション,シミュレーション,シミュレーション
実験	名詞,サ変接続,*,*,*,*,実験,ジッケン,ジッケン
を通して	助詞,格助詞,連語,*,*,*,を通して,ヲトオシテ,ヲトーシテ
* 34 35D 1/2 2.068991
提案	名詞,サ変接続,*,*,*,*,提案,テイアン,テイアン
手法	名詞,一般,*,*,*,*,手法,シュホウ,シュホー
の	助詞,連体化,*,*,*,*,の,ノ,ノ
* 35 36D 1/2 -0.847292
有効	名詞,形容動詞語幹,*,*,*,*,有効,ユウコウ,ユーコー
性	名詞,接尾,一般,*,*,*,性,セイ,セイ
を	助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
* 36 -1D 1/1 0.000000
検証	名詞,サ変接続,*,*,*,*,検証,ケンショウ,ケンショー
する	動詞,自立,*,*,サ変・スル,基本形,する,スル,スル
。	記号,句点,*,*,*,*,。,。,。
EOS
vagrant@ubuntu2204 corpora $

目次に戻る