1 / 70

The Next-Generation Knowledge Management for Multilingual Agricultural Information

The Next-Generation Knowledge Management for Multilingual Agricultural Information. Asanee Kawtrakul, Mukda Suktarachan , Aurawan Imsombut , Chaveewan Petchsiri, Chalermpon Sirigayon, Thana Sukvaree, Trakul Permpool, Prachaya Boonkhuan, Worapoj Peerawit, Intiraporn Mulasastra

oberon
Download Presentation

The Next-Generation Knowledge Management for Multilingual Agricultural Information

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. The Next-Generation Knowledge Management for Multilingual Agricultural Information Asanee Kawtrakul, Mukda Suktarachan, Aurawan Imsombut, Chaveewan Petchsiri, Chalermpon Sirigayon, Thana Sukvaree, Trakul Permpool, Prachaya Boonkhuan, Worapoj Peerawit, Intiraporn Mulasastra The Specialty Research Unit of Natural Language Processing and Intelligent Information System Technology Department of Computer Engineering, Kasetsart University, Bangkok, Thailand ak@vivaldi.cpe.ku.ac.th Fifth Agricultural Ontology Service (AOS) Workshop 29 April 2004, Beijing, China

  2. Acknowledgement • NECTEC • I-Know(Information Extraction and Knowledge Discovery) Project • AFITA 2002 (First, work for Fun , then get the Fund)

  3. Motivation System Architecture: Knowledge Management Automatic Ontology Construction and Maintenance Ontology-based Knowledge Management Information Extraction Sumarization Knowledge Discovery Knowledge Tracking Agenda

  4. Motivation • Information Overload, especially, unstructured electronic articles and reports • Language barriers • Thailand is the Agriculture-based Country Knowledge Management for Multilingual Agricultural Information Management

  5. What is KM? • Knowledge Acquisition • Knowledge Processing : • Knowledge Discovery • Best Practice • Knowledge Service • Knowledge Tracking

  6. Agricultural Information Knowledge Management Related Projects • Multilingual Dictionary • Ontology Construction and Maintenance System • Knowledge Portal • Information Extraction • Summarization • Knowledge Discovery • Knowledge Tracking • Machine translation

  7. Real-World Ontology Task Oriented Ontology Ontology Diseases&How to protect? etc. How to plant in the winter? Rice Follow up the price Yield WWW System Architecture Unstructured, Semi-structured, Structured Document Meta DataAnnotation tools Thai AGRIS Corpus Knowledge Structure Knowledge Portal Processing Agricultural Information Bases Intelligent Search Engine Multilingual Dictionary MT KT

  8. Ontology Construction and Maintenance System

  9. Introduction to Ontology Two essential aspects of Ontologies • Real-world Ontology • For IR, IE and Semantic Web • Task-Oriented Ontology • For IE, Knowledge Tracking

  10. Introduction to Ontology Real World Plants Taxonomy Ontology taxonomy family genus concepts species plants IS-A relation plant reproductive organs plant vegetative organs . . . Part-of relation fruit seeds flower Acalypha instances

  11. Introduction to Ontology Task Oriented ontology disease control concepts specific relations(e.g. Cause, hasSymptom) Treatment cause Plant Diseases symptom IS-A relation . . . . . . cause from pathogen cause from environment Blight Scorch instances

  12. Why needs Automatic Ontology construction and maintenance system? • Enhance performance of Information processing system such as IR, IE, Knowledge Tracking, etc. • Creating ontology by the expert is an expensive task and it is endless task for ontology maintenance, especially new instance.

  13. Unstructured Corpus Structured Corpus Dictionary Raw Text AGROVOC Thesaurus Morphological Analysis Structure Analysis Database Conversion Thesaurus Recycling Term Extraction Heuristic Rules Semantic RelationIdentification Organizing System VerificationSystem Automatic Ontology Construction System Architecture

  14. Automatic Ontology Construction • Sources • Thesaurus • Dictionary of Agriculture • Technical paper, Published document, Encyclopedia • Differentiation of 3 sources.

  15. Ontology from AGROVOC Thesaurus • Technique: • Convert BT/NT to IS-A Relation • Problem: • Not all BT/NT could define to IS-A Relation Their semantic could defined as Ingredient of and other. For example. MILK NT: Milk Fat (Ingredient of) • Solutions: • NLP Technique: NP Analysis

  16. Author Name Formal Name Specific epithet Family/Subfamily Genus • Acalypha EUPHORBIACEAE • brachystachya Hornem. HตำแยดอยใบบางTamyae doi bai bang • ( General ). • chinensis Roxb. = A. indica L. • delpyana Gagnep. USขางปอยตัวเมีย Khang poi tua mia (Central). • evrardii Gagnep. = A.siamensis Oliv. ex Gage • hispida Burm. f. ExSเกี้ยวเกล้า Kiao klao,ไหมพรม Mai phrom (Northern); • หางกระรอกแดง Hang krarok daeng (Bangkok); หางแมว Hang maeo • (Central) หูปลาช่อน Hu pla chon (Ratchaburi); chenille plant, Red hot • cat's tail. Habit Local Name Ontology from Dictionary • Applied Plants Name Dictionary for adding Formal Name, Local Name which familiar to users in retrieving and machine translating.

  17. Ontology from Plant Names Dictionary • Technique: • Applied task oriented parser to extract relation terms. • Converted terms by alphabet characteristic and position of terms to relational database • Limitation: • Dictionary has only plant names

  18. Ontology from Text • Problems: • Concept Identification • Variety Concept • Concept Boundary identification • Many Candidate Terms • Clue Word Ambiguity • Implicit Expression

  19. Problem • Concept Identification • Variety Concept • งา เป็นพืชไร่น้ำมัน • Saseme isfield-oil crops. Concept => Field Crop, Oil Crop, Field-Oil Crop • Concept Boundary identification • ผงไหมใช้ทำเป็นฟิล์มเคลือบรักษาความสดในอุตสาหกรรมประมง • Silk powder used asfilm for maintain freshness in seafood industry.Concept => film, film for maintain freshness, film for maintain freshness in seafood industry • Many Candidate Terms • สมุนไพรหลายชนิดมีสรรพคุณเป็นยารักษาโรค และมีการนำมาผลิตในระดับอุตสาหกรรมแล้ว เช่นกระเทียม ใบแปะก๊วย • Many herbscan be used as medicineand some of them are manufactured in the industrylevel, such asgarlic, ginkgo biloba. Candidate Terms => herbs, medicine, industry

  20. Problem • Clue Word Ambiguity • ทานตะวันเป็นพืชน้ำมัน • Sun-flowerisoil crop. => HYPONYM (Sun-flower, Oil Crop) • ดอกตัวผู้มีลักษณะช่อเป็นพุ่มสีเขียวอ่อน • Staminate is a green bush. => PROPERTIES (Flower, Color) • Implicit Expression (No Clue-word) • Phrase level “Jasmine Rice” => HYPONYM (Jasmine Rice, Rice)

  21. Solutions

  22. Forest Ontology Organizing • Use AGROVOC Ontology to be core tree • Merge forest ontology from dictionary and text to core ontology by NLP Technique such as Phrase Analysis, Term Matching

  23. Plant Products Plant Products Fruit + Fruit Fruit Watermelons Tamarind Watermelons Tamarind (a) Field Crops Cereals Field Crops Cereals Maize Maize + Maize Maize Maize Dent Maize Dent Maize Dent Maize (b) Crops Crops Crops Oil Crops + Sesame Oil Crops Sesame Oil Palms Oil Palms (c) Crops Crops Crops Oil Crops + Oil Crops Oil Palms Oil Palms Oil Palms (d) Forest Ontology Organizing

  24. Predicate : โรคถอดฝักดาบ disease control Bakanae plant diseases IS-A IS-A IS-A Bacterial leaf blightBacterial leaf spotBlack spotBrown spotCrack stemFusarium yellowGummosis Mosaic Peanut mottle Existing Concept : Blight Fungal diseases Wilts IS-A IS-A IS-A IS-A Smuts Mildews Rusts Anthracnosis term and relation adding Bakanae Preview Tree Add Verification Tools • For the expert to verify output and add additional related word pairs

  25. Ontology-based Knowledge Management • Information Extraction • Summarization • Knowledge Discovery • Knowledge Tracking

  26. Ontology Ontology Knowledge Processing Architecture Annotated Corpus Template Construction Template Document Text Extraction Summarization Knowledge Structure Knowledge Discovery Knowledge Summary

  27. Information Extraction

  28. Has plant name in title Describe in paragraph Has topic sentence Describe in numbering Corpus Style ผักกาดหอม ผักกาดหอมเป็นผักที่ใช้บริโภคส่วนใบ เป็นผักจำพวกผักสลัดที่มีคุณค่าทางอาหารสูง นิยมบริโภคกันแพร่หลายที่สุดในบรรดาผักสลัดด้วยกัน โดยส่วนใหญ่นิยมรับประทานสดแบะนำมาประกอบอาหารหลายชนิด คนไทยนิยมใช้ . . . โรคเน่าเละ สาเหตุเกิดจากเชื้อแบคทีเรีย Erwinia sp. เป็นโรคที่เกิดขึ้นอย่างกว้างขวาง ทำให้ผลผลิตผักกาดหอมเสียหายอย่างมาก เป็นได้ทั้งในแปลงปลูกและโรงเก็บ นอกจากนั้นยังสามารถเกิดโรคได้ในขณะวางตลาดและเมื่อผู้บริโภคซื้อไปแล้วก็อาจเกิดโรคนี้ได้เช่นกัน ลักษณะอาการ อาการทั่วไปที่เกิดกับผักกาดหอมห่อเริ่มจากแผลรอยช้ำเล็กๆ เป็นจุดฉ่ำน้ำ เมื่อสิ่งแวดล้อมเหมาะสมแผลจะขยายตัวทุกทิศทางทั้งด้านยาว กว้างและลึก เนื้อเยื่อของพืชส่วนนั้นจะอ่อนยุบตัวลงและเน่าอย่างรวดเร็ว ทำให้ส่วนนั้นเปื่อยและเป็นน้ำภายในเวลาอันรวดเร็ว มีเมือกเยิ้ม มีกลิ่นแรงมาก กลิ่นนี้จะเป็นกลิ่นเฉพาะของโรคนี้ หลังจากนั้นผักจะเน่ายุบตายไปทั้งต้น ซึ่งอาจแห้งเป็นสีน้ำตาลอยู่บนผิวดิน อาการเน่ามักจะเริ่มที่โคนก้านไปหรือตรงกลางลำต้นก่อน การป้องกันกำจัด ควรปฏิบัติดังนี้ 1. ในการเก็บเกี่ยวควรใช้มีดคมๆ ตัดให้ขาดเพียงครั้งเดียว เพื่อไม่ให้เกิดรอยแผลซ้ำ เพื่อป้องกันการเกิดแผลซึ่งจะเป็นทางเข้าทำลายของเชื้อ 2. หลังจาการเก็บเกี่ยวควรผึ่งผักไว้ในที่โปร่ง อากาศถ่ายเทได้ดี เพื่อให้แผลตรงรอยตัดแห้ง และทาปูนแดงที่แผลด้วย . . . Semi-Structure/one plant per document

  29. Types of information • Entity information (has reference to entity in knowledge structure) *may has a reference problem because surface form of the term • Plant • Disease • Cause • Explanation information • Symptom • Treatment Entity information extracted by Name-entity recognition Explanation information extracted by paragraph classification and summarization

  30. Information representation • Frame of Knowledge • Reference to source of information • One frame per document • One document can has many frames • Each frame represent one disease of the plant includes cause, symptom and treatment Plant-Disease: <DOC_ID=“404200001”> plant : กะหล่ำปลี <PLANT_ID=“000123”> disease : โรคเน่าเละ <DISEASE_ID=“000456”> cause : เชื้อรทีเรีย <PATHOGEN_ID=“000789”> symptom : โรคนี้ด้เกือบทุกระยะติบโตแต่พบมากในระยะที่ treatment : ระมัดอย่าให้เกิดแผลทั้งขณะเก็บเกี่ยวและขนส่ง <DOC id=“AGRIS0404200001”> การปลูกกะหล่ำปลี ... โรคและแมลงศัตรูที่สำคัญ โรคที่สำคัญของกะหล่ำปลีได้แก่ 1. โรคเน่าเละของกะหล่ำปลี สาเหตุเกิดจากเชื้อราแบคทีเรีย ลักษณะอาการโรคนี้พบได้เกือบทุกระยะการเจริญเติบโตแต่พบมากในระยะที่กะหล่ำปลีห่อหัวโดยในระยะแรกพบเป็นจุดหรือบริเวณมีลักษณะฉ่ำน้ำคล้ายรอยช้ำต่อมาแผลจะขยายลุกลามออกไปทำให้เกิดการเน่าเละเป็นเมือกเยิ้มมีกลิ่นเหม็นจัดเมื่ออาการรุนแรงจะทำให้กะหล่ำปลีเน่าเละทั้งหัวและหักพับลง การป้องกันกำจัด 1. ระมัดระวังอย่าให้เกิดแผลหรือรอยช้ำทั้งขณะเก็บเกี่ยวและขนส่ง 2. ฉีดพ่นสารกำจัดแมลงปากกัดหรือแมลงวันในแปลงปลูก 3. กำจัดเศษวัชพืชออกจากแปลงอย่าไถกลบ 4. ในแปลงปลูกควรมีการระบายน้ำดี 5. หลังจากเก็บเกี่ยวแล้วให้เก็บผักไว้ในที่อุณหภูมิต่ำประมาณ10 องศาเซลเซียส ... </DOC> Plant-Disease: <DOC_ID=“404200001”> plant : กะหล่ำปลี <PLANT_ID=“000124”> disease : โรคเน่าเละ <DISEASE_ID=“000457”> cause : เชื้อรทีเรีย <PATHOGEN_ID=“000790”> symptom : โรคนี้ด้เกือบทุกระยะติบโตแต่พบมากในระยะที่ treatment : ระมัดอย่าให้เกิดแผลทั้งขณะเก็บเกี่ยวและขนส่ง Plant-Disease: <DOC_ID=“404200001”> plant : กะหล่ำปลี <PLANT_ID=“000125”> disease : โรคเน่าเละ <DISEASE_ID=“000458”> cause : เชื้อรทีเรีย <PATHOGEN_ID=“000791”> symptom : โรคนี้ด้เกือบทุกระยะติบโตแต่พบมากในระยะที่ treatment : ระมัดอย่าให้เกิดแผลทั้งขณะเก็บเกี่ยวและขนส่ง

  31. Plant Disease Cause Symptom Treatment Overview processes <DOC id=“AGRIS0404200001”> การปลูก<plant plant_id=“000123”>กะหล่ำปลี</plant> ... โรคและแมลงศัตรูที่สำคัญ โรคที่สำคัญของกะหล่ำปลีได้แก่ 1. <disease disease_id=“000456” plant_id=“000123” grp_id=“1”>โรคเน่าเละของกะหล่ำปลี</disease> สาเหตุเกิดจาก<cause pathogen_id=“000789” plant_id=“000123” grp_id=“1”>เชื้อราแบคทีเรีย</cause> <symptom plant_id=“000123” grp_id=“1”>ลักษณะอาการโรคนี้พบได้เกือบทุกระยะการเจริญเติบโตแต่พบมากในระยะที่กะหล่ำปลีห่อหัวโดยในระยะแรกพบเป็นจุดหรือบริเวณมีลักษณะฉ่ำน้ำคล้ายรอยช้ำต่อมาแผลจะขยายลุกลามออกไปทำให้เกิดการเน่าเละเป็นเมือกเยิ้มมีกลิ่นเหม็นจัดเมื่ออาการรุนแรงจะทำให้กะหล่ำปลีเน่าเละทั้งหัวและหักพับลง</symptom> การป้องกันกำจัด <treatment plant_id=“000123” grp_id=“1”>1. ระมัดระวังอย่าให้เกิดแผลหรือรอยช้ำทั้งขณะเก็บเกี่ยวและขนส่ง 2. ฉีดพ่นสารกำจัดแมลงปากกัดหรือแมลงวันในแปลงปลูก 3. กำจัดเศษวัชพืชออกจากแปลงอย่าไถกลบ 4. ในแปลงปลูกควรมีการระบายน้ำดี 5. หลังจากเก็บเกี่ยวแล้วให้เก็บผักไว้ในที่อุณหภูมิต่ำประมาณ10 องศาเซลเซียส</treatment> ... </DOC> <DOC id=“AGRIS0404200001”> การปลูกกะหล่ำปลี ... โรคและแมลงศัตรูที่สำคัญ โรคที่สำคัญของกะหล่ำปลีได้แก่ 1. โรคเน่าเละของกะหล่ำปลี สาเหตุเกิดจากเชื้อราแบคทีเรีย ลักษณะอาการโรคนี้พบได้เกือบทุกระยะการเจริญเติบโตแต่พบมากในระยะที่กะหล่ำปลีห่อหัวโดยในระยะแรกพบเป็นจุดหรือบริเวณมีลักษณะฉ่ำน้ำคล้ายรอยช้ำต่อมาแผลจะขยายลุกลามออกไปทำให้เกิดการเน่าเละเป็นเมือกเยิ้มมีกลิ่นเหม็นจัดเมื่ออาการรุนแรงจะทำให้กะหล่ำปลีเน่าเละทั้งหัวและหักพับลง การป้องกันกำจัด 1. ระมัดระวังอย่าให้เกิดแผลหรือรอยช้ำทั้งขณะเก็บเกี่ยวและขนส่ง 2. ฉีดพ่นสารกำจัดแมลงปากกัดหรือแมลงวันในแปลงปลูก 3. กำจัดเศษวัชพืชออกจากแปลงอย่าไถกลบ 4. ในแปลงปลูกควรมีการระบายน้ำดี 5. หลังจากเก็บเกี่ยวแล้วให้เก็บผักไว้ในที่อุณหภูมิต่ำประมาณ10 องศาเซลเซียส ... </DOC> Plant-Disease : <DOC_ID=“AGRIS0404200001”> plant : กะหล่ำปลี <PLANT_ID=“000123”> disease : โรคเน่าเละ <DISEASE_ID=“000456”> cause : เชื้อราแบคทีเรีย <PATHOGEN_ID=“000789”> symptom : โรคนี้พบได้เกือบทุกระยะการเจริญเติบโตแต่พบมากในระยะที่กะหล่ำปลีห่อหัว โดยในระยะแรกพบเป็นจุดหรือบริเวณมีลักษณะฉ่ำน้ำคล้ายรอยช้ำ ต่อมาแผลจะขยายลุกลามออกไป ทำให้เกิดการเน่าเละเป็นเมือกเยิ้มมีกลิ่นเหม็นจัด เมื่ออาการรุนแรงจะทำให้กะหล่ำปลีเน่าเละทั้งหัวและหักพับลง treatment : 1. ระมัดระวังอย่าให้เกิดแผลหรือรอยช้ำทั้งขณะเก็บเกี่ยวและขนส่ง 2. ฉีดพ่นสารกำจัดแมลงปากกัดหรือแมลงวันในแปลงปลูก 3. กำจัดเศษวัชพืชออกจากแปลง อย่าไถกลบ 4. ในแปลงปลูกควรมีการระบายน้ำดี 5. หลังจากเก็บเกี่ยวแล้วให้เก็บผักไว้ในที่อุณหภูมิต่ำประมาณ 10 องศาเซลเซียส Template <Template Name> { TE: <Element-Name>([Constraint],…); … } Constraint:=NE-class | clue Template Plant-Disease { TE: plant (NE-class=“Plant”); TE: disease (NE-class=“Disease”); TE: cause (NE-class=“Pathogen”); TE: symptom (clue=“อาการ”, “ผิดปกติ”); TE: treatment (clue=“ป้องกัน”, “กำจัด”); } Knowledge Structure Summarization

  32. Ontology Problems from document Knowledge Structure Text Extraction Document Template • Problems • Multiple topics in one paragraph • Incomplete information • Dispersed information

  33. Ontology Text Extraction Architecture Knowledge Structure Text Extraction Document Template New entity Reference id Name-Entity recognition Retrieve reference id Relevant paragraphs selection Explanation information Marker (by paragraph classification) Summarization Frame elements composition

  34. Summarization

  35. Text Extraction from IE Frame Structure DiscourseStructure Theory Knowledge Summarization Knowledge Summarization Knowledge Summary

  36. Knowledge Interesting • Agricultural Domain ( Thai Agri corpus ) • Cause – Symptom – Treatment of Plant’s disease • Knowledge integrations : ( Template + Discourse Structure) • Frame-based summarization (specific information ,Min-Yen Kan,1999)

  37. Discourse Structure • Model the global structure of the text and its relations to communicative goals • Each relations compose 2 parts • Nucleus : represent the essential piece of information • Satellite : indicate supporting or background information • Represent relation of textual unit with Tree structure

  38. Discourse relation Discourse relation Cause nucleus nucleus nucleus nucleus satellite nucleus nucleus satellite Text Extraction from IE Symptom A D B Treatment A B D Slots Information A D E DiscourseSummarizer B C Text Selected Text Summary Frame-based Frame-based Discourse Summarization

  39. How to Symptom Extraction from IE Symptom Symptom <symptom ref="1" grp="1">ลักษณะอาการ อาการทั่วไปที่เกิดกับผักกาดหอมห่อเริ่มจากแผลรอยช้ำเล็กๆ เป็นจุดฉ่ำน้ำ เมื่อสิ่งแวดล้อมเหมาะสมแผลจะขยายตัวทุกทิศทางทั้งด้านยาว กว้างและลึก เนื้อเยื่อของพืชส่วนนั้นจะอ่อนยุบตัวลงและเน่าอย่างรวดเร็ว ทำให้ส่วนนั้นเปื่อยและเป็นน้ำภายในเวลาอันรวดเร็ว มีเมือกเยิ้ม มีกลิ่นแรงมาก กลิ่นนี้จะเป็นกลิ่นเฉพาะของโรคนี้ หลังจากนั้นผักจะเน่ายุบตายไปทั้งต้น ซึ่งอาจแห้งเป็นสีน้ำตาลอยู่บนผิวดิน อาการเน่ามักจะเริ่มที่โคนก้านไปหรือตรงกลางลำต้นก่อน</symptom> Text Summary Template representation Cause : Symptom : อาการทั่วไปที่เกิดกับผักกาดหอมห่อเริ่มจากแผลรอยช้ำเล็กๆ เป็นจุดฉ่ำน้ำ เมื่อสิ่งแวดล้อมเหมาะสมแผลจะขยายตัวทุกทิศทางทั้งด้านยาว กว้างและลึก เนื้อเยื่อของพืชส่วนนั้นจะอ่อนยุบตัวลงและเน่าอย่างรวดเร็ว ทำให้ส่วนนั้นเปื่อยและเป็นน้ำภายในเวลาอันรวดเร็ว มีเมือกเยิ้ม มีกลิ่นแรงมาก Treatment :

  40. Symptom Annotated from IE <symptom ref="1" grp="1">ลักษณะอาการ อาการทั่วไปที่เกิดกับผักกาดหอมห่อเริ่มจากแผลรอยช้ำเล็กๆ เป็นจุดฉ่ำน้ำ เมื่อสิ่งแวดล้อมเหมาะสมแผลจะขยายตัวทุกทิศทางทั้งด้านยาว กว้างและลึก เนื้อเยื่อของพืชส่วนนั้นจะอ่อนยุบตัวลงและเน่าอย่างรวดเร็ว ทำให้ส่วนนั้นเปื่อยและเป็นน้ำภายในเวลาอันรวดเร็ว มีเมือกเยิ้ม มีกลิ่นแรงมาก กลิ่นนี้จะเป็นกลิ่นเฉพาะของโรคนี้ หลังจากนั้นผักจะเน่ายุบตายไปทั้งต้น ซึ่งอาจแห้งเป็นสีน้ำตาลอยู่บนผิวดิน อาการเน่ามักจะเริ่มที่โคนก้านไปหรือตรงกลางลำต้นก่อน</symptom> Disease :โรคเน่าดำของผักกาดหอม Elaboration Consequence Cause-Result Elaboration Elaboration [A]ลักษณะอาการ อาการทั่วไปที่เกิดกับผักกาดหอมห่อเริ่มจากแผลรอยช้ำเล็กๆ เป็นจุดฉ่ำน้ำ [B]เมื่อสิ่งแวดล้อมเหมาะสมแผลจะขยายตัวทุกทิศทางทั้งด้านยาว กว้างและลึก [C]เนื้อเยื่อของพืชส่วนนั้นจะอ่อนยุบตัวลงและเน่าอย่างรวดเร็ว ทำให้ส่วนนั้นเปื่อยและเป็นน้ำภายในเวลาอันรวดเร็ว มีเมือกเยิ้ม มีกลิ่นแรงมาก [D]กลิ่นนี้จะเป็นกลิ่นเฉพาะของโรคนี้ [E]หลังจากนั้นผักจะเน่ายุบตายไปทั้งต้น ซึ่งอาจแห้งเป็นสีน้ำตาลอยู่บนผิวดิน [F]อาการเน่ามักจะเริ่มที่โคนก้านไปหรือตรงกลางลำต้นก่อน Text Summary

  41. ผักกาดหอม Disease : โรคเน่าดำ Cause : เชื้อแบคทีเรีย อาการทั่วไปที่เกิดกับผักกาดหอมห่อเริ่มจากแผลรอยช้ำเล็กๆ เป็นจุดฉ่ำน้ำ เมื่อสิ่งแวดล้อมเหมาะสมแผลจะขยายตัวทุกทิศทางทั้งด้านยาว กว้างและลึก เนื้อเยื่อของพืชส่วนนั้นจะอ่อนยุบตัวลงและเน่าอย่างรวดเร็ว ทำให้ส่วนนั้นเปื่อยและเป็นน้ำภายในเวลาอันรวดเร็ว มีเมือกเยิ้ม มีกลิ่นแรงมาก Symptom : Treatment: ในการเก็บเกี่ยวควรใช้มีดคมๆ ตัดให้ขาดเพียงครั้งเดียว เพื่อไม่ให้เกิดรอยแผลซ้ำหลังจาการเก็บเกี่ยวควรผึ่งผักไว้ในที่โปร่ง อากาศถ่ายเทได้ดี Frame Representation

  42. Discourse Summarization Procedure • To generating text segmentation (EDU: Elementary Discourse Unit ) • To Build discourse tree structure from EDUs in step 1. • Select leaf nodes as Knowledge Summary(salient unit) .

  43. Knowledge Discovery

  44. Knowledge Processing Architecture Annotated Corpus Template Construction Template Document Text Extraction Summarization Knowledge Summary Knowledge Structure Ontology Knowledge Extraction Ontology Generalization rules Knowledge Discovery

  45. Knowledge structure • Knowledge structure consists of • Plant growing method • Variety selection • Soil preparation • Seedling preparation • Cultural practice • Plant disease and insect control • Cause and symptom • Treatment / killing • Protection

  46. Knowledge extraction • Relation to be extracted • Cause relation • e.g. Pyricularia grisea Causes of Blast disease in rice • Effect relation • e.g. The Blast symptoms caused by Pyricularia grisea are big brown spots like eye shape on leaf and…….. • Consequence relation

  47. Generalization of Cause/Result Relations • Need processes • Knowledge representation • Induction reasoning • Need ontology to define the supper set of insect and micro organism: e.g Louse = {เพลี้ยไฟพริก, เพลี้ยไก่แจ้, เพลี้ยจั๊กจั่นฝอย, เพลี้ยจั๊กจั่น ….}

  48. Knowledge Discovery • Generalized Rules  x Disease(x, เพลี้ยฯ)Symptom(x, ใบ, ใบหงิกงอ ) x Disease(x, Disease fromLouse)Symptom(x,leaf, curve ) x Disease(x, โรคใบไหม้/โรคไหม้)Symptom(x, ใบ, แผลสีเทา) x Disease(x, Leaf blight/Blast)Symptom(x, leaf, grey blot)

  49. Knowledge Discovery • Generalized Rules for symptom • All louses cause of curve leaf symptom in fruit • All Blast and Blight leaf diseases in plant have grey blots/spots

  50. From Generalized Symptoms Matrix to Inductive Prediction • By using ID3 technique X3:leaf,curve Y N Disease caused by louse X7:leaf, grey blot Y Leaf blight/Blast Disease

More Related