210 likes | 319 Views
自然語言期末報告. 授課教師: 顏國郎 組員: 黃炯育 許偉德. 大綱. 簡介 注音輸入介面探討 利用手機按鈕的注音符號的配置,在無預選字 下,計算某文章輸入次數。 計算文章的 Bigram and Trigram MLE Perplexity 設計手機預選字,並計算文章輸入次數 MLE 結論. 簡介 (1). 手機介面 Nokia 6108. 簡介 (2). 輸入方式. 第一題 利用手機按鈕的注音符號的配置,在無預選字下計算某文章輸入次數. 注音輸入介面探討 (1/11).
E N D
自然語言期末報告 授課教師: 顏國郎 組員: 黃炯育 許偉德
大綱 • 簡介 • 注音輸入介面探討 • 利用手機按鈕的注音符號的配置,在無預選字 下,計算某文章輸入次數。 • 計算文章的Bigram and Trigram • MLE • Perplexity • 設計手機預選字,並計算文章輸入次數 • MLE • 結論
簡介(1) • 手機介面 • Nokia 6108
簡介(2) • 輸入方式
第一題 利用手機按鈕的注音符號的配置,在無預選字下計算某文章輸入次數
注音輸入介面探討(1/11) • 利用手機按鈕的注音符號的配置,在無預選字下,計算某文章輸入次數 • 文章類別:體育類 • 文章字數:604 • 文章來源:中時電子報 • 無預選字次數:2814
注音輸入介面探討(2/11) • 程式介面
第二題 (1)計算 Bigram 下的 MLE
注音輸入介面探討(3/11) • 計算 Bigram 下的 MLE 統計同一類別每個字 在文章出現的機率 EX:我想(0.5)、 我們(0.5) 統計所有文章 單字出現次數 以及機率
注音輸入介面探討(4/11) • 計算 Bigram 下的 MLE • 文章總數量:約80 篇 • 文章總字數:27729 個字
注音輸入介面探討(5/11) • 程式介面
第二題 (2)計算 Bigram 下的 Perplexity
注音輸入介面探討(6/11) • 計算 Bigram 下的 Perplexity • Perplexity • If the language is nice (p(x)=1)
注音輸入介面探討(7/11) 計算 Bigram 下的 Perplexity 計算所有類別 的Entropy 並取其平均值 統計所有文章 單字出現次數 以及機率 統計同一類別每個 字在文章出現的機率
注音輸入介面探討(8/11) • 計算 Bigram 下的 Perplexity • 文章總數量:約80篇 • 文章總字數:27729 個字 • Perplexity : 2.2647
注音輸入介面探討(9/11) 程式介面 entropy table 類別次數
第三題 設計手機預選字,並計算文章輸入次數
注音輸入介面探討(10/11) • 設計手機預選字,並計算文章輸入次數
注音輸入介面探討(11/11) • 程式介面
結論 • 市面上手機若無預選字效率差 • 若無有效將預選字效能提升依然無法提升輸入效率 • 運用Bigram 和 Trigram 能明顯挑選出合理的預選字提升手機輸入效率 • 若訓練資料不足,將導致無法建立完整模型