ここの手順で Ubuntu の設定をすると CaboCha とMeCabの拡張辞書 (mecab-ipadic-NEologd) がインストールされています.このページでは CaboCha で構文解析(係り受け解析)を行なってみよう.
CaboCha で構文解析(係り受け解析)を行うには ubuntu にログインして cabocha
コマンドを実行します.その後,構文解析を実行したい文を入力し,Enter
で実行します.終了するには Ctrl + C を押します.
vagrant@ubuntu2204 ~ $ cabocha ⏎
今日はメロンパンを食べました ⏎
今日は---D
メロンパンを-D
食べました
EOS
自然言語処理の基本である形態素解析と構文解析を勉強します ⏎
自然言語処理の-D
基本である---D
形態素解析と-D
構文解析を-D
勉強します
EOS
^C # 終了するには Ctrl + C を押す
vagrant@ubuntu2204 ~ $
上の簡易 Tree 表示による結果から,最初の文では「今日は 食べました」という係り受けと,「メロンパンを 食べました」という係り受けがわかります.コンピュータで処理しやすい形式で結果を取得するには -f1
オプションを指定します.
vagrant@ubuntu2204 ~ $ cabocha -f1 ⏎
今日はメロンパンを食べました ⏎
* 0 2D 0/1 -1.940068
今日 名詞,副詞可能,*,*,*,*,今日,キョウ,キョー
は 助詞,係助詞,*,*,*,*,は,ハ,ワ
* 1 2D 1/2 -1.940068
メロン 名詞,一般,*,*,*,*,メロン,メロン,メロン
パン 名詞,一般,*,*,*,*,パン,パン,パン
を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
* 2 -1D 0/2 0.000000
食べ 動詞,自立,*,*,一段,連用形,食べる,タベ,タベ
まし 助動詞,*,*,*,特殊・マス,連用形,ます,マシ,マシ
た 助動詞,*,*,*,特殊・タ,基本形,た,タ,タ
EOS
自然言語処理の基本である形態素解析と構文解析を勉強します ⏎
* 0 1D 2/3 1.581318
自然 名詞,形容動詞語幹,*,*,*,*,自然,シゼン,シゼン
言語 名詞,一般,*,*,*,*,言語,ゲンゴ,ゲンゴ
処理 名詞,サ変接続,*,*,*,*,処理,ショリ,ショリ
の 助詞,連体化,*,*,*,*,の,ノ,ノ
* 1 3D 0/2 1.677741
基本 名詞,一般,*,*,*,*,基本,キホン,キホン
で 助動詞,*,*,*,特殊・ダ,連用形,だ,デ,デ
ある 助動詞,*,*,*,五段・ラ行アル,基本形,ある,アル,アル
* 2 3D 1/2 1.021878
形態素 名詞,一般,*,*,*,*,形態素,ケイタイソ,ケイタイソ
解析 名詞,サ変接続,*,*,*,*,解析,カイセキ,カイセキ
と 助詞,並立助詞,*,*,*,*,と,ト,ト
* 3 4D 1/2 1.677741
構文 名詞,一般,*,*,*,*,構文,コウブン,コーブン
解析 名詞,サ変接続,*,*,*,*,解析,カイセキ,カイセキ
を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
* 4 -1D 1/2 0.000000
勉強 名詞,サ変接続,*,*,*,*,勉強,ベンキョウ,ベンキョー
し 動詞,自立,*,*,サ変・スル,連用形,する,シ,シ
ます 助動詞,*,*,*,特殊・マス,基本形,ます,マス,マス
EOS
^C # 終了するには Ctrl + C を押す
vagrant@ubuntu2204 ~ $
上の結果から例えば「メロンパンを 食べました」という係り受けの「メロンパンを」の文節について,「メロン」「パン」「を」という形態素に分割されていることがわかります.
構文解析に用いる辞書を指定するには -d
オプションを利用します.次の例では標準辞書を指定しているので,上と全く同じ結果が得られるはずです.標準の辞書では「メロンパン」が「メロン」と「パン」という形態素に分割されていることがわかります.
vagrant@ubuntu2204 ~ $ cabocha -d /var/lib/mecab/dic/ipadic-utf8 ⏎
今日はメロンパンを食べました ⏎
今日は---D
メロンパンを-D
食べました
EOS
自然言語処理の基本である形態素解析と構文解析を勉強します ⏎
自然言語処理の-D
基本である---D
形態素解析と-D
構文解析を-D
勉強します
EOS
^C
vagrant@ubuntu2204 ~ $ cabocha -d /var/lib/mecab/dic/ipadic-utf8 -f1 ⏎
今日はメロンパンを食べました ⏎
* 0 2D 0/1 -1.940068
今日 名詞,副詞可能,*,*,*,*,今日,キョウ,キョー
は 助詞,係助詞,*,*,*,*,は,ハ,ワ
* 1 2D 1/2 -1.940068
メロン 名詞,一般,*,*,*,*,メロン,メロン,メロン
パン 名詞,一般,*,*,*,*,パン,パン,パン
を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
* 2 -1D 0/2 0.000000
食べ 動詞,自立,*,*,一段,連用形,食べる,タベ,タベ
まし 助動詞,*,*,*,特殊・マス,連用形,ます,マシ,マシ
た 助動詞,*,*,*,特殊・タ,基本形,た,タ,タ
EOS
自然言語処理の基本である形態素解析と構文解析を勉強します ⏎
* 0 1D 2/3 1.581318
自然 名詞,形容動詞語幹,*,*,*,*,自然,シゼン,シゼン
言語 名詞,一般,*,*,*,*,言語,ゲンゴ,ゲンゴ
処理 名詞,サ変接続,*,*,*,*,処理,ショリ,ショリ
の 助詞,連体化,*,*,*,*,の,ノ,ノ
* 1 3D 0/2 1.677741
基本 名詞,一般,*,*,*,*,基本,キホン,キホン
で 助動詞,*,*,*,特殊・ダ,連用形,だ,デ,デ
ある 助動詞,*,*,*,五段・ラ行アル,基本形,ある,アル,アル
* 2 3D 1/2 1.021878
形態素 名詞,一般,*,*,*,*,形態素,ケイタイソ,ケイタイソ
解析 名詞,サ変接続,*,*,*,*,解析,カイセキ,カイセキ
と 助詞,並立助詞,*,*,*,*,と,ト,ト
* 3 4D 1/2 1.677741
構文 名詞,一般,*,*,*,*,構文,コウブン,コーブン
解析 名詞,サ変接続,*,*,*,*,解析,カイセキ,カイセキ
を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
* 4 -1D 1/2 0.000000
勉強 名詞,サ変接続,*,*,*,*,勉強,ベンキョウ,ベンキョー
し 動詞,自立,*,*,サ変・スル,連用形,する,シ,シ
ます 助動詞,*,*,*,特殊・マス,基本形,ます,マス,マス
EOS
^C # 終了するには Ctrl + C を押す
vagrant@ubuntu2204 ~ $
次に,MeCabの拡張辞書である mecab-ipadic-NEologd を指定して構文解析を実行します.拡張辞書を利用すると「メロンパン」が認識できているだけでなく,「自然言語処理」や「形態素解析」「構文解析」なども一つの形態素として認識されていることがわかります.拡張辞書では芸能人の芸名のような固有名詞についても多くが登録されています.
vagrant@ubuntu2204 ~ $ cabocha -d /usr/lib/x86_64-linux-gnu/mecab/dic/mecab-ipadic-neologd ⏎
今日はメロンパンを食べました ⏎
今日は---D
メロンパンを-D
食べました
EOS
自然言語処理の基本である形態素解析と構文解析を勉強します ⏎
自然言語処理の-D
基本である-D
形態素解析と-D
構文解析を-D
勉強します
EOS
^C
vagrant@ubuntu2204 ~ $ cabocha -d /usr/lib/x86_64-linux-gnu/mecab/dic/mecab-ipadic-neologd -f1 ⏎
今日はメロンパンを食べました ⏎
* 0 2D 0/1 -1.880791
今日 名詞,副詞可能,*,*,*,*,今日,キョウ,キョー
は 助詞,係助詞,*,*,*,*,は,ハ,ワ
* 1 2D 0/1 -1.880791
メロンパン 名詞,固有名詞,一般,*,*,*,メロンパン,メロンパン,メロンパン
を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
* 2 -1D 0/2 0.000000
食べ 動詞,自立,*,*,一段,連用形,食べる,タベ,タベ
まし 助動詞,*,*,*,特殊・マス,連用形,ます,マシ,マシ
た 助動詞,*,*,*,特殊・タ,基本形,た,タ,タ
EOS
自然言語処理の基本である形態素解析と構文解析を勉強します ⏎
* 0 1D 0/1 1.499403
自然言語処理 名詞,固有名詞,一般,*,*,*,自然言語処理,シゼンゲンゴショリ,シゼンゲンゴショリ
の 助詞,連体化,*,*,*,*,の,ノ,ノ
* 1 2D 0/2 0.027028
基本 名詞,一般,*,*,*,*,基本,キホン,キホン
で 助動詞,*,*,*,特殊・ダ,連用形,だ,デ,デ
ある 助動詞,*,*,*,五段・ラ行アル,基本形,ある,アル,アル
* 2 3D 0/1 0.256312
形態素解析 名詞,固有名詞,一般,*,*,*,形態素解析,ケイタイソカイセキ,ケイタイソカイセキ
と 助詞,並立助詞,*,*,*,*,と,ト,ト
* 3 4D 0/1 0.256312
構文解析 名詞,固有名詞,一般,*,*,*,構文解析,コウブンカイセキ,コーブンカイセキ
を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
* 4 -1D 1/2 0.000000
勉強 名詞,サ変接続,*,*,*,*,勉強,ベンキョウ,ベンキョー
し 動詞,自立,*,*,サ変・スル,連用形,する,シ,シ
ます 助動詞,*,*,*,特殊・マス,基本形,ます,マス,マス
EOS
^C # 終了するには Ctrl + C を押す
vagrant@ubuntu2204 ~ $
なお,拡張辞書のインストール先は環境によって異なる可能性があることにも注意してください.
テキストファイルの形態素解析を行うこともできます.なおテキストファイルの文字コードは UTF-8 として作業します.既に解析したいテキストファイルがあれば,Documents フォルダなど任意の場所に設置して次のステップに進んでください.ここでは GitHub のサンプルデータセットをダウンロードして展開します.
まず,GitHub からクローンを作成(ダウンロード)します.
vagrant@ubuntu2204 ~ $ cd Documents/ ⏎ vagrant@ubuntu2204 Documents $ git clone https://github.com/rinsaka/sample-data-sets.git ⏎ Cloning into 'sample-data-sets'... remote: Enumerating objects: 282, done. remote: Counting objects: 100% (77/77), done. remote: Compressing objects: 100% (47/47), done. remote: Total 282 (delta 39), reused 68 (delta 30), pack-reused 205 Receiving objects: 100% (282/282), 15.32 MiB | 13.46 MiB/s, done. Resolving deltas: 100% (131/131), done. vagrant@ubuntu2204 Documents $
ダウンロードされたデータセットを確認します.サンプル文書データは corpora.zip
です.この圧縮ファイルを unzip
コマンドで展開します.
vagrant@ubuntu2204 Documents $ cd sample-data-sets/ ⏎ vagrant@ubuntu2204 sample-data-sets $ ls ⏎ (中略) corpora.zip names.json (中略) vagrant@ubuntu2204 sample-data-sets $ unzip corpora.zip ⏎ Archive: corpora.zip inflating: corpora/en_abs_1.txt inflating: corpora/en_abs_2.txt inflating: corpora/en_abs_3.txt inflating: corpora/en_abs_4.txt inflating: corpora/ja_abs_1.txt inflating: corpora/ja_abs_2.txt inflating: corpora/ja_abs_3.txt inflating: corpora/ja_abs_4.txt inflating: corpora/ja_abs_5.txt inflating: corpora/sample_1.txt inflating: corpora/sample_2.txt inflating: corpora/sample_3.txt extracting: corpora/sample_4.txt inflating: corpora/sample_5.txt vagrant@ubuntu2204 sample-data-sets $ ls ⏎ (中略) corpora names.json corpora.zip novels.json (中略) vagrant@ubuntu2204 sample-data-sets $ cd corpora/ ⏎ vagrant@ubuntu2204 corpora $
展開されたテキストファイルを確認します.例えば ja_abs_1.txt
ファイルの中身を確認します.
vagrant@ubuntu2204 corpora $ ls ⏎ en_abs_1.txt en_abs_4.txt ja_abs_3.txt sample_1.txt sample_4.txt en_abs_2.txt ja_abs_1.txt ja_abs_4.txt sample_2.txt sample_5.txt en_abs_3.txt ja_abs_2.txt ja_abs_5.txt sample_3.txt vagrant@ubuntu2204 corpora $ cat ja_abs_5.txt ⏎ 本論文ではシステムアベイラビリティを最大化する最適ソフトウェア若化スケジュールを適応的に導出するアプローチを提案する。具体的にはn個の障害発生時間データからノンパラメトリック予測推論に基づき,信頼度関数の上下限を定式化する。次に,信頼度関数の上下限を用いてシステムアベイラビリティの上下限を定式化し,n+1番目の障害に対してこれらを最大化する最適ソフトウェア若化スケジュールを導出する。更に,n+2番目の障害に対しては適応的に最適ソフトウェア若化スケジュールを導出する。シミュレーション実験を通して提案手法の有効性を検証する。 vagrant@ubuntu2204 corpora $
テキストファイルの構文解析を行うには,ファイル名を引数に与えます.
vagrant@ubuntu2204 corpora $ cabocha -d /usr/lib/x86_64-linux-gnu/mecab/dic/mecab-ipadic-neologd ja_abs_5.txt ⏎ 本論文では-------------D システムアベイラビリティを-D | 最大化する-D | 最適ソフトウェア若化スケジュールを---D | 適応的に-D | 導出する-D | アプローチを-D 提案する。-------------D 具体的には-----------D n個の-D | 障害発生時間データから-------D ノンパラメトリック予測推論に-----D 基づき,信頼度関数の-D | 上下限を-D 定式化する。-----------------------D 次に-----D | ,信頼度関数の-D | | 上下限を-D | 用いて-----------D | システムアベイラビリティの-D | | 上下限を-------D | 定式化し,n+1番目の-D | | 障害に対して---D | これらを-D | 最大化する-D | 最適ソフトウェア若化スケジュールを-D 導出する。-----------D 更に---------D ,n+2番目の-D | 障害に対しては-----D 適応的に---D 最適ソフトウェア若化スケジュールを-D 導出する。-------D シミュレーション実験を通して-----D 提案手法の-D | 有効性を-D 検証する。 EOS vagrant@ubuntu2204 corpora $
出力形式を変更します.
vagrant@ubuntu2204 corpora $ cabocha -d /usr/lib/x86_64-linux-gnu/mecab/dic/mecab-ipadic-neologd ja_abs_5.txt -f1 ⏎ * 0 7D 1/3 1.635588 本 接頭詞,名詞接続,*,*,*,*,本,ホン,ホン 論文 名詞,一般,*,*,*,*,論文,ロンブン,ロンブン で 助詞,格助詞,一般,*,*,*,で,デ,デ は 助詞,係助詞,*,*,*,*,は,ハ,ワ * 1 2D 1/2 2.274324 システム 名詞,一般,*,*,*,*,システム,システム,システム アベイラビリティ 名詞,一般,*,*,*,*,アベイラビリティ,アベイラビリティ,アベイラビリティ を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ * 2 3D 2/2 1.882897 最大 名詞,一般,*,*,*,*,最大,サイダイ,サイダイ 化 名詞,接尾,サ変接続,*,*,*,化,カ,カ する 動詞,自立,*,*,サ変・スル,基本形,する,スル,スル * 3 5D 4/5 1.303629 最適 名詞,一般,*,*,*,*,最適,サイテキ,サイテキ ソフトウェア 名詞,一般,*,*,*,*,ソフトウェア,ソフトウェア,ソフトウェア 若 名詞,一般,*,*,*,*,若,ワカ,ワカ 化 名詞,接尾,サ変接続,*,*,*,化,カ,カ スケジュール 名詞,一般,*,*,*,*,スケジュール,スケジュール,スケジュール を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ * 4 5D 1/2 2.109265 適応 名詞,サ変接続,*,*,*,*,適応,テキオウ,テキオー 的 名詞,接尾,形容動詞語幹,*,*,*,的,テキ,テキ に 助詞,副詞化,*,*,*,*,に,ニ,ニ * 5 6D 1/1 1.484273 導出 名詞,サ変接続,*,*,*,*,導出,ドウシュツ,ドーシュツ する 動詞,自立,*,*,サ変・スル,基本形,する,スル,スル * 6 7D 0/1 3.580149 アプローチ 名詞,サ変接続,*,*,*,*,アプローチ,アプローチ,アプローチ を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ * 7 14D 1/1 2.268678 提案 名詞,サ変接続,*,*,*,*,提案,テイアン,テイアン する 動詞,自立,*,*,サ変・スル,基本形,する,スル,スル 。 記号,句点,*,*,*,*,。,。,。 * 8 14D 0/2 1.332075 具体的 名詞,固有名詞,一般,*,*,*,具体的,グタイテキ,グタイテキ に 助詞,格助詞,一般,*,*,*,に,ニ,ニ は 助詞,係助詞,*,*,*,*,は,ハ,ワ * 9 10D 1/2 1.333740 n 名詞,固有名詞,組織,*,*,*,* 個 名詞,一般,*,*,*,*,個,コ,コ の 助詞,連体化,*,*,*,*,の,ノ,ノ * 10 14D 3/4 2.309502 障害 名詞,一般,*,*,*,*,障害,ショウガイ,ショーガイ 発生 名詞,サ変接続,*,*,*,*,発生,ハッセイ,ハッセイ 時間 名詞,副詞可能,*,*,*,*,時間,ジカン,ジカン データ 名詞,一般,*,*,*,*,データ,データ,データ から 助詞,格助詞,一般,*,*,*,から,カラ,カラ * 11 14D 3/4 2.466074 ノン 接頭詞,名詞接続,*,*,*,*,ノン,ノン,ノン パラメトリック 名詞,固有名詞,一般,*,*,*,パラメトリック,パラメトリック,パラメトリック 予測 名詞,サ変接続,*,*,*,*,予測,ヨソク,ヨソク 推論 名詞,サ変接続,*,*,*,*,推論,スイロン,スイロン に 助詞,格助詞,一般,*,*,*,に,ニ,ニ * 12 13D 3/4 1.736117 基づき 動詞,自立,*,*,五段・カ行イ音便,連用形,基づく,モトヅキ,モトズキ , 記号,一般,*,*,*,*,* 信頼度 名詞,固有名詞,一般,*,*,*,信頼度,シンライド,シンライド 関数 名詞,一般,*,*,*,*,関数,カンスウ,カンスー の 助詞,連体化,*,*,*,*,の,ノ,ノ * 13 14D 1/2 3.246175 上下 名詞,サ変接続,*,*,*,*,上下,ジョウゲ,ジョーゲ 限 名詞,接尾,一般,*,*,*,限,ゲン,ゲン を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ * 14 26D 2/2 1.630560 定式 名詞,一般,*,*,*,*,定式,テイシキ,テイシキ 化 名詞,接尾,サ変接続,*,*,*,化,カ,カ する 動詞,自立,*,*,サ変・スル,基本形,する,スル,スル 。 記号,句点,*,*,*,*,。,。,。 * 15 18D 0/0 1.206832 次に 副詞,一般,*,*,*,*,次に,ツギニ,ツギニ * 16 17D 2/3 1.828548 , 記号,一般,*,*,*,*,* 信頼度 名詞,固有名詞,一般,*,*,*,信頼度,シンライド,シンライド 関数 名詞,一般,*,*,*,*,関数,カンスウ,カンスー の 助詞,連体化,*,*,*,*,の,ノ,ノ * 17 18D 1/2 2.029559 上下 名詞,サ変接続,*,*,*,*,上下,ジョウゲ,ジョーゲ 限 名詞,接尾,一般,*,*,*,限,ゲン,ゲン を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ * 18 24D 0/1 0.976441 用い 動詞,自立,*,*,一段,連用形,用いる,モチイ,モチイ て 助詞,接続助詞,*,*,*,*,て,テ,テ * 19 20D 1/2 2.100285 システム 名詞,一般,*,*,*,*,システム,システム,システム アベイラビリティ 名詞,一般,*,*,*,*,アベイラビリティ,アベイラビリティ,アベイラビリティ の 助詞,連体化,*,*,*,*,の,ノ,ノ * 20 24D 1/2 0.325360 上下 名詞,サ変接続,*,*,*,*,上下,ジョウゲ,ジョーゲ 限 名詞,接尾,一般,*,*,*,限,ゲン,ゲン を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ * 21 22D 7/8 1.898785 定式 名詞,一般,*,*,*,*,定式,テイシキ,テイシキ 化 名詞,接尾,サ変接続,*,*,*,化,カ,カ し 動詞,自立,*,*,サ変・スル,連用形,する,シ,シ , 記号,一般,*,*,*,*,* n 名詞,固有名詞,組織,*,*,*,* + 記号,一般,*,*,*,*,* 1番 名詞,固有名詞,一般,*,*,*,1番,イチバン,イチバン 目 名詞,接尾,一般,*,*,*,目,メ,メ の 助詞,連体化,*,*,*,*,の,ノ,ノ * 22 24D 0/1 0.852684 障害 名詞,一般,*,*,*,*,障害,ショウガイ,ショーガイ に対して 助詞,格助詞,連語,*,*,*,に対して,ニタイシテ,ニタイシテ * 23 24D 0/1 1.930482 これら 名詞,代名詞,一般,*,*,*,これら,コレラ,コレラ を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ * 24 25D 2/2 1.417459 最大 名詞,一般,*,*,*,*,最大,サイダイ,サイダイ 化 名詞,接尾,サ変接続,*,*,*,化,カ,カ する 動詞,自立,*,*,サ変・スル,基本形,する,スル,スル * 25 26D 4/5 2.991441 最適 名詞,一般,*,*,*,*,最適,サイテキ,サイテキ ソフトウェア 名詞,一般,*,*,*,*,ソフトウェア,ソフトウェア,ソフトウェア 若 名詞,一般,*,*,*,*,若,ワカ,ワカ 化 名詞,接尾,サ変接続,*,*,*,化,カ,カ スケジュール 名詞,一般,*,*,*,*,スケジュール,スケジュール,スケジュール を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ * 26 32D 1/1 1.974833 導出 名詞,サ変接続,*,*,*,*,導出,ドウシュツ,ドーシュツ する 動詞,自立,*,*,サ変・スル,基本形,する,スル,スル 。 記号,句点,*,*,*,*,。,。,。 * 27 32D 0/0 2.279492 更に 副詞,助詞類接続,*,*,*,*,更に,サラニ,サラニ * 28 29D 4/5 1.928752 , 記号,一般,*,*,*,*,* n 名詞,固有名詞,組織,*,*,*,* + 記号,一般,*,*,*,*,* 2番 名詞,固有名詞,一般,*,*,*,2番,ニバン,ニバン 目 名詞,接尾,一般,*,*,*,目,メ,メ の 助詞,連体化,*,*,*,*,の,ノ,ノ * 29 32D 0/2 2.004942 障害 名詞,一般,*,*,*,*,障害,ショウガイ,ショーガイ に対して 助詞,格助詞,連語,*,*,*,に対して,ニタイシテ,ニタイシテ は 助詞,係助詞,*,*,*,*,は,ハ,ワ * 30 32D 1/2 3.172817 適応 名詞,サ変接続,*,*,*,*,適応,テキオウ,テキオー 的 名詞,接尾,形容動詞語幹,*,*,*,的,テキ,テキ に 助詞,副詞化,*,*,*,*,に,ニ,ニ * 31 32D 4/5 3.652001 最適 名詞,一般,*,*,*,*,最適,サイテキ,サイテキ ソフトウェア 名詞,一般,*,*,*,*,ソフトウェア,ソフトウェア,ソフトウェア 若 名詞,一般,*,*,*,*,若,ワカ,ワカ 化 名詞,接尾,サ変接続,*,*,*,化,カ,カ スケジュール 名詞,一般,*,*,*,*,スケジュール,スケジュール,スケジュール を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ * 32 36D 1/1 -0.847292 導出 名詞,サ変接続,*,*,*,*,導出,ドウシュツ,ドーシュツ する 動詞,自立,*,*,サ変・スル,基本形,する,スル,スル 。 記号,句点,*,*,*,*,。,。,。 * 33 36D 1/2 -0.847292 シミュレーション 名詞,サ変接続,*,*,*,*,シミュレーション,シミュレーション,シミュレーション 実験 名詞,サ変接続,*,*,*,*,実験,ジッケン,ジッケン を通して 助詞,格助詞,連語,*,*,*,を通して,ヲトオシテ,ヲトーシテ * 34 35D 1/2 2.068991 提案 名詞,サ変接続,*,*,*,*,提案,テイアン,テイアン 手法 名詞,一般,*,*,*,*,手法,シュホウ,シュホー の 助詞,連体化,*,*,*,*,の,ノ,ノ * 35 36D 1/2 -0.847292 有効 名詞,形容動詞語幹,*,*,*,*,有効,ユウコウ,ユーコー 性 名詞,接尾,一般,*,*,*,性,セイ,セイ を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ * 36 -1D 1/1 0.000000 検証 名詞,サ変接続,*,*,*,*,検証,ケンショウ,ケンショー する 動詞,自立,*,*,サ変・スル,基本形,する,スル,スル 。 記号,句点,*,*,*,*,。,。,。 EOS vagrant@ubuntu2204 corpora $
解析結果をファイルに書き出すには > 出力ファイル名
によるリダイレクトを使うと良いでしょう.例えば解析結果を result.txt
に書き出します.
vagrant@ubuntu2204 corpora $ cabocha -d /usr/lib/x86_64-linux-gnu/mecab/dic/mecab-ipadic-neologd ja_abs_5.txt -f1 > result.txt ⏎ vagrant@ubuntu2204 corpora $ ls ⏎ en_abs_1.txt en_abs_4.txt ja_abs_3.txt result.txt sample_3.txt en_abs_2.txt ja_abs_1.txt ja_abs_4.txt sample_1.txt sample_4.txt en_abs_3.txt ja_abs_2.txt ja_abs_5.txt sample_2.txt sample_5.txt vagrant@ubuntu2204 corpora $ cat result.txt ⏎ * 0 7D 1/3 1.635588 本 接頭詞,名詞接続,*,*,*,*,本,ホン,ホン 論文 名詞,一般,*,*,*,*,論文,ロンブン,ロンブン で 助詞,格助詞,一般,*,*,*,で,デ,デ は 助詞,係助詞,*,*,*,*,は,ハ,ワ * 1 2D 1/2 2.274324 システム 名詞,一般,*,*,*,*,システム,システム,システム アベイラビリティ 名詞,一般,*,*,*,*,アベイラビリティ,アベイラビリティ,アベイラビリティ を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ * 2 3D 2/2 1.882897 最大 名詞,一般,*,*,*,*,最大,サイダイ,サイダイ 化 名詞,接尾,サ変接続,*,*,*,化,カ,カ する 動詞,自立,*,*,サ変・スル,基本形,する,スル,スル * 3 5D 4/5 1.303629 最適 名詞,一般,*,*,*,*,最適,サイテキ,サイテキ ソフトウェア 名詞,一般,*,*,*,*,ソフトウェア,ソフトウェア,ソフトウェア 若 名詞,一般,*,*,*,*,若,ワカ,ワカ 化 名詞,接尾,サ変接続,*,*,*,化,カ,カ スケジュール 名詞,一般,*,*,*,*,スケジュール,スケジュール,スケジュール を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ * 4 5D 1/2 2.109265 適応 名詞,サ変接続,*,*,*,*,適応,テキオウ,テキオー 的 名詞,接尾,形容動詞語幹,*,*,*,的,テキ,テキ に 助詞,副詞化,*,*,*,*,に,ニ,ニ * 5 6D 1/1 1.484273 導出 名詞,サ変接続,*,*,*,*,導出,ドウシュツ,ドーシュツ する 動詞,自立,*,*,サ変・スル,基本形,する,スル,スル * 6 7D 0/1 3.580149 アプローチ 名詞,サ変接続,*,*,*,*,アプローチ,アプローチ,アプローチ を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ * 7 14D 1/1 2.268678 提案 名詞,サ変接続,*,*,*,*,提案,テイアン,テイアン する 動詞,自立,*,*,サ変・スル,基本形,する,スル,スル 。 記号,句点,*,*,*,*,。,。,。 * 8 14D 0/2 1.332075 具体的 名詞,固有名詞,一般,*,*,*,具体的,グタイテキ,グタイテキ に 助詞,格助詞,一般,*,*,*,に,ニ,ニ は 助詞,係助詞,*,*,*,*,は,ハ,ワ * 9 10D 1/2 1.333740 n 名詞,固有名詞,組織,*,*,*,* 個 名詞,一般,*,*,*,*,個,コ,コ の 助詞,連体化,*,*,*,*,の,ノ,ノ * 10 14D 3/4 2.309502 障害 名詞,一般,*,*,*,*,障害,ショウガイ,ショーガイ 発生 名詞,サ変接続,*,*,*,*,発生,ハッセイ,ハッセイ 時間 名詞,副詞可能,*,*,*,*,時間,ジカン,ジカン データ 名詞,一般,*,*,*,*,データ,データ,データ から 助詞,格助詞,一般,*,*,*,から,カラ,カラ * 11 14D 3/4 2.466074 ノン 接頭詞,名詞接続,*,*,*,*,ノン,ノン,ノン パラメトリック 名詞,固有名詞,一般,*,*,*,パラメトリック,パラメトリック,パラメトリック 予測 名詞,サ変接続,*,*,*,*,予測,ヨソク,ヨソク 推論 名詞,サ変接続,*,*,*,*,推論,スイロン,スイロン に 助詞,格助詞,一般,*,*,*,に,ニ,ニ * 12 13D 3/4 1.736117 基づき 動詞,自立,*,*,五段・カ行イ音便,連用形,基づく,モトヅキ,モトズキ , 記号,一般,*,*,*,*,* 信頼度 名詞,固有名詞,一般,*,*,*,信頼度,シンライド,シンライド 関数 名詞,一般,*,*,*,*,関数,カンスウ,カンスー の 助詞,連体化,*,*,*,*,の,ノ,ノ * 13 14D 1/2 3.246175 上下 名詞,サ変接続,*,*,*,*,上下,ジョウゲ,ジョーゲ 限 名詞,接尾,一般,*,*,*,限,ゲン,ゲン を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ * 14 26D 2/2 1.630560 定式 名詞,一般,*,*,*,*,定式,テイシキ,テイシキ 化 名詞,接尾,サ変接続,*,*,*,化,カ,カ する 動詞,自立,*,*,サ変・スル,基本形,する,スル,スル 。 記号,句点,*,*,*,*,。,。,。 * 15 18D 0/0 1.206832 次に 副詞,一般,*,*,*,*,次に,ツギニ,ツギニ * 16 17D 2/3 1.828548 , 記号,一般,*,*,*,*,* 信頼度 名詞,固有名詞,一般,*,*,*,信頼度,シンライド,シンライド 関数 名詞,一般,*,*,*,*,関数,カンスウ,カンスー の 助詞,連体化,*,*,*,*,の,ノ,ノ * 17 18D 1/2 2.029559 上下 名詞,サ変接続,*,*,*,*,上下,ジョウゲ,ジョーゲ 限 名詞,接尾,一般,*,*,*,限,ゲン,ゲン を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ * 18 24D 0/1 0.976441 用い 動詞,自立,*,*,一段,連用形,用いる,モチイ,モチイ て 助詞,接続助詞,*,*,*,*,て,テ,テ * 19 20D 1/2 2.100285 システム 名詞,一般,*,*,*,*,システム,システム,システム アベイラビリティ 名詞,一般,*,*,*,*,アベイラビリティ,アベイラビリティ,アベイラビリティ の 助詞,連体化,*,*,*,*,の,ノ,ノ * 20 24D 1/2 0.325360 上下 名詞,サ変接続,*,*,*,*,上下,ジョウゲ,ジョーゲ 限 名詞,接尾,一般,*,*,*,限,ゲン,ゲン を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ * 21 22D 7/8 1.898785 定式 名詞,一般,*,*,*,*,定式,テイシキ,テイシキ 化 名詞,接尾,サ変接続,*,*,*,化,カ,カ し 動詞,自立,*,*,サ変・スル,連用形,する,シ,シ , 記号,一般,*,*,*,*,* n 名詞,固有名詞,組織,*,*,*,* + 記号,一般,*,*,*,*,* 1番 名詞,固有名詞,一般,*,*,*,1番,イチバン,イチバン 目 名詞,接尾,一般,*,*,*,目,メ,メ の 助詞,連体化,*,*,*,*,の,ノ,ノ * 22 24D 0/1 0.852684 障害 名詞,一般,*,*,*,*,障害,ショウガイ,ショーガイ に対して 助詞,格助詞,連語,*,*,*,に対して,ニタイシテ,ニタイシテ * 23 24D 0/1 1.930482 これら 名詞,代名詞,一般,*,*,*,これら,コレラ,コレラ を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ * 24 25D 2/2 1.417459 最大 名詞,一般,*,*,*,*,最大,サイダイ,サイダイ 化 名詞,接尾,サ変接続,*,*,*,化,カ,カ する 動詞,自立,*,*,サ変・スル,基本形,する,スル,スル * 25 26D 4/5 2.991441 最適 名詞,一般,*,*,*,*,最適,サイテキ,サイテキ ソフトウェア 名詞,一般,*,*,*,*,ソフトウェア,ソフトウェア,ソフトウェア 若 名詞,一般,*,*,*,*,若,ワカ,ワカ 化 名詞,接尾,サ変接続,*,*,*,化,カ,カ スケジュール 名詞,一般,*,*,*,*,スケジュール,スケジュール,スケジュール を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ * 26 32D 1/1 1.974833 導出 名詞,サ変接続,*,*,*,*,導出,ドウシュツ,ドーシュツ する 動詞,自立,*,*,サ変・スル,基本形,する,スル,スル 。 記号,句点,*,*,*,*,。,。,。 * 27 32D 0/0 2.279492 更に 副詞,助詞類接続,*,*,*,*,更に,サラニ,サラニ * 28 29D 4/5 1.928752 , 記号,一般,*,*,*,*,* n 名詞,固有名詞,組織,*,*,*,* + 記号,一般,*,*,*,*,* 2番 名詞,固有名詞,一般,*,*,*,2番,ニバン,ニバン 目 名詞,接尾,一般,*,*,*,目,メ,メ の 助詞,連体化,*,*,*,*,の,ノ,ノ * 29 32D 0/2 2.004942 障害 名詞,一般,*,*,*,*,障害,ショウガイ,ショーガイ に対して 助詞,格助詞,連語,*,*,*,に対して,ニタイシテ,ニタイシテ は 助詞,係助詞,*,*,*,*,は,ハ,ワ * 30 32D 1/2 3.172817 適応 名詞,サ変接続,*,*,*,*,適応,テキオウ,テキオー 的 名詞,接尾,形容動詞語幹,*,*,*,的,テキ,テキ に 助詞,副詞化,*,*,*,*,に,ニ,ニ * 31 32D 4/5 3.652001 最適 名詞,一般,*,*,*,*,最適,サイテキ,サイテキ ソフトウェア 名詞,一般,*,*,*,*,ソフトウェア,ソフトウェア,ソフトウェア 若 名詞,一般,*,*,*,*,若,ワカ,ワカ 化 名詞,接尾,サ変接続,*,*,*,化,カ,カ スケジュール 名詞,一般,*,*,*,*,スケジュール,スケジュール,スケジュール を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ * 32 36D 1/1 -0.847292 導出 名詞,サ変接続,*,*,*,*,導出,ドウシュツ,ドーシュツ する 動詞,自立,*,*,サ変・スル,基本形,する,スル,スル 。 記号,句点,*,*,*,*,。,。,。 * 33 36D 1/2 -0.847292 シミュレーション 名詞,サ変接続,*,*,*,*,シミュレーション,シミュレーション,シミュレーション 実験 名詞,サ変接続,*,*,*,*,実験,ジッケン,ジッケン を通して 助詞,格助詞,連語,*,*,*,を通して,ヲトオシテ,ヲトーシテ * 34 35D 1/2 2.068991 提案 名詞,サ変接続,*,*,*,*,提案,テイアン,テイアン 手法 名詞,一般,*,*,*,*,手法,シュホウ,シュホー の 助詞,連体化,*,*,*,*,の,ノ,ノ * 35 36D 1/2 -0.847292 有効 名詞,形容動詞語幹,*,*,*,*,有効,ユウコウ,ユーコー 性 名詞,接尾,一般,*,*,*,性,セイ,セイ を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ * 36 -1D 1/1 0.000000 検証 名詞,サ変接続,*,*,*,*,検証,ケンショウ,ケンショー する 動詞,自立,*,*,サ変・スル,基本形,する,スル,スル 。 記号,句点,*,*,*,*,。,。,。 EOS vagrant@ubuntu2204 corpora $