1 / 21

自然語言期末報告

自然語言期末報告. 授課教師: 顏國郎 組員: 黃炯育 許偉德. 大綱. 簡介 注音輸入介面探討 利用手機按鈕的注音符號的配置,在無預選字 下,計算某文章輸入次數。 計算文章的 Bigram and Trigram MLE Perplexity 設計手機預選字,並計算文章輸入次數 MLE 結論. 簡介 (1). 手機介面 Nokia 6108. 簡介 (2). 輸入方式. 第一題 利用手機按鈕的注音符號的配置,在無預選字下計算某文章輸入次數. 注音輸入介面探討 (1/11).

Download Presentation

自然語言期末報告

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 自然語言期末報告 授課教師: 顏國郎 組員: 黃炯育 許偉德

  2. 大綱 • 簡介 • 注音輸入介面探討 • 利用手機按鈕的注音符號的配置,在無預選字 下,計算某文章輸入次數。 • 計算文章的Bigram and Trigram • MLE • Perplexity • 設計手機預選字,並計算文章輸入次數 • MLE • 結論

  3. 簡介(1) • 手機介面 • Nokia 6108

  4. 簡介(2) • 輸入方式

  5. 第一題 利用手機按鈕的注音符號的配置,在無預選字下計算某文章輸入次數

  6. 注音輸入介面探討(1/11) • 利用手機按鈕的注音符號的配置,在無預選字下,計算某文章輸入次數 • 文章類別:體育類 • 文章字數:604 • 文章來源:中時電子報 • 無預選字次數:2814

  7. 注音輸入介面探討(2/11) • 程式介面

  8. 第二題 (1)計算 Bigram 下的 MLE

  9. 注音輸入介面探討(3/11) • 計算 Bigram 下的 MLE 統計同一類別每個字 在文章出現的機率 EX:我想(0.5)、 我們(0.5) 統計所有文章 單字出現次數 以及機率

  10. 注音輸入介面探討(4/11) • 計算 Bigram 下的 MLE • 文章總數量:約80 篇 • 文章總字數:27729 個字

  11. 注音輸入介面探討(5/11) • 程式介面

  12. 第二題 (2)計算 Bigram 下的 Perplexity

  13. 注音輸入介面探討(6/11) • 計算 Bigram 下的 Perplexity • Perplexity • If the language is nice (p(x)=1)

  14. 注音輸入介面探討(7/11) 計算 Bigram 下的 Perplexity 計算所有類別 的Entropy 並取其平均值 統計所有文章 單字出現次數 以及機率 統計同一類別每個 字在文章出現的機率

  15. 注音輸入介面探討(8/11) • 計算 Bigram 下的 Perplexity • 文章總數量:約80篇 • 文章總字數:27729 個字 • Perplexity : 2.2647

  16. 注音輸入介面探討(9/11) 程式介面 entropy table 類別次數

  17. 第三題 設計手機預選字,並計算文章輸入次數

  18. 注音輸入介面探討(10/11) • 設計手機預選字,並計算文章輸入次數

  19. 注音輸入介面探討(11/11) • 程式介面

  20. 結論 • 市面上手機若無預選字效率差 • 若無有效將預選字效能提升依然無法提升輸入效率 • 運用Bigram 和 Trigram 能明顯挑選出合理的預選字提升手機輸入效率 • 若訓練資料不足,將導致無法建立完整模型

  21. ~THANK YOU~

More Related