30 likes | 250 Views
1. Seed 辞書の準備. 辞書 , コーパス. Seed 辞書 (csv). 設定ファイル 中間ファイル. プログラム . 2. 設定ファイルの準備. 6. 配布辞書作成. 4. 学習用バイナリ辞書作成. 設定ファイル char.def unk.def rewrite.def feature.def dicrc. mecab-dict-gen. mecab-dict-index -l. 学習用 バイナリ辞書. 配布用辞書 (csv). 7. 解析用辞書作成. CRF パラメータ. mecab-cost-train.
E N D
1. Seed 辞書の準備 辞書, コーパス Seed 辞書 (csv) 設定ファイル 中間ファイル プログラム 2. 設定ファイルの準備 6. 配布辞書作成 4. 学習用バイナリ辞書作成 設定ファイル char.def unk.def rewrite.def feature.def dicrc mecab-dict-gen mecab-dict-index -l 学習用 バイナリ辞書 配布用辞書 (csv) 7. 解析用辞書作成 CRF パラメータ mecab-cost-train mecab-dict-index 5. CRFパラメタの学習 学習コーパス MeCab の出力と 同一フォーマット 配布用 バイナリ辞書 エンドユーザが行う部分 3. 学習コーパスの準備
表層レベル 表層レベル 美しい 形容詞,自立,*,*,形容詞・イ段,基本形,美しい, ウツクシイ,ウツクシイ 川 名詞,一般,*,*,*,*,川,カワ,カワ Unigram素性 Unigram素性 形容詞,自立,*,*,形容詞・イ段, 基本形,美しい 名詞,一般,*,*,*,*,川 左文脈 形容詞,自立,*,*, 形容詞・イ段 右文脈 名詞,一般 連接