700 likes | 856 Views
The Next-Generation Knowledge Management for Multilingual Agricultural Information. Asanee Kawtrakul, Mukda Suktarachan , Aurawan Imsombut , Chaveewan Petchsiri, Chalermpon Sirigayon, Thana Sukvaree, Trakul Permpool, Prachaya Boonkhuan, Worapoj Peerawit, Intiraporn Mulasastra
E N D
The Next-Generation Knowledge Management for Multilingual Agricultural Information Asanee Kawtrakul, Mukda Suktarachan, Aurawan Imsombut, Chaveewan Petchsiri, Chalermpon Sirigayon, Thana Sukvaree, Trakul Permpool, Prachaya Boonkhuan, Worapoj Peerawit, Intiraporn Mulasastra The Specialty Research Unit of Natural Language Processing and Intelligent Information System Technology Department of Computer Engineering, Kasetsart University, Bangkok, Thailand ak@vivaldi.cpe.ku.ac.th Fifth Agricultural Ontology Service (AOS) Workshop 29 April 2004, Beijing, China
Acknowledgement • NECTEC • I-Know(Information Extraction and Knowledge Discovery) Project • AFITA 2002 (First, work for Fun , then get the Fund)
Motivation System Architecture: Knowledge Management Automatic Ontology Construction and Maintenance Ontology-based Knowledge Management Information Extraction Sumarization Knowledge Discovery Knowledge Tracking Agenda
Motivation • Information Overload, especially, unstructured electronic articles and reports • Language barriers • Thailand is the Agriculture-based Country Knowledge Management for Multilingual Agricultural Information Management
What is KM? • Knowledge Acquisition • Knowledge Processing : • Knowledge Discovery • Best Practice • Knowledge Service • Knowledge Tracking
Agricultural Information Knowledge Management Related Projects • Multilingual Dictionary • Ontology Construction and Maintenance System • Knowledge Portal • Information Extraction • Summarization • Knowledge Discovery • Knowledge Tracking • Machine translation
Real-World Ontology Task Oriented Ontology Ontology Diseases&How to protect? etc. How to plant in the winter? Rice Follow up the price Yield WWW System Architecture Unstructured, Semi-structured, Structured Document Meta DataAnnotation tools Thai AGRIS Corpus Knowledge Structure Knowledge Portal Processing Agricultural Information Bases Intelligent Search Engine Multilingual Dictionary MT KT
Introduction to Ontology Two essential aspects of Ontologies • Real-world Ontology • For IR, IE and Semantic Web • Task-Oriented Ontology • For IE, Knowledge Tracking
Introduction to Ontology Real World Plants Taxonomy Ontology taxonomy family genus concepts species plants IS-A relation plant reproductive organs plant vegetative organs . . . Part-of relation fruit seeds flower Acalypha instances
Introduction to Ontology Task Oriented ontology disease control concepts specific relations(e.g. Cause, hasSymptom) Treatment cause Plant Diseases symptom IS-A relation . . . . . . cause from pathogen cause from environment Blight Scorch instances
Why needs Automatic Ontology construction and maintenance system? • Enhance performance of Information processing system such as IR, IE, Knowledge Tracking, etc. • Creating ontology by the expert is an expensive task and it is endless task for ontology maintenance, especially new instance.
Unstructured Corpus Structured Corpus Dictionary Raw Text AGROVOC Thesaurus Morphological Analysis Structure Analysis Database Conversion Thesaurus Recycling Term Extraction Heuristic Rules Semantic RelationIdentification Organizing System VerificationSystem Automatic Ontology Construction System Architecture
Automatic Ontology Construction • Sources • Thesaurus • Dictionary of Agriculture • Technical paper, Published document, Encyclopedia • Differentiation of 3 sources.
Ontology from AGROVOC Thesaurus • Technique: • Convert BT/NT to IS-A Relation • Problem: • Not all BT/NT could define to IS-A Relation Their semantic could defined as Ingredient of and other. For example. MILK NT: Milk Fat (Ingredient of) • Solutions: • NLP Technique: NP Analysis
Author Name Formal Name Specific epithet Family/Subfamily Genus • Acalypha EUPHORBIACEAE • brachystachya Hornem. HตำแยดอยใบบางTamyae doi bai bang • ( General ). • chinensis Roxb. = A. indica L. • delpyana Gagnep. USขางปอยตัวเมีย Khang poi tua mia (Central). • evrardii Gagnep. = A.siamensis Oliv. ex Gage • hispida Burm. f. ExSเกี้ยวเกล้า Kiao klao,ไหมพรม Mai phrom (Northern); • หางกระรอกแดง Hang krarok daeng (Bangkok); หางแมว Hang maeo • (Central) หูปลาช่อน Hu pla chon (Ratchaburi); chenille plant, Red hot • cat's tail. Habit Local Name Ontology from Dictionary • Applied Plants Name Dictionary for adding Formal Name, Local Name which familiar to users in retrieving and machine translating.
Ontology from Plant Names Dictionary • Technique: • Applied task oriented parser to extract relation terms. • Converted terms by alphabet characteristic and position of terms to relational database • Limitation: • Dictionary has only plant names
Ontology from Text • Problems: • Concept Identification • Variety Concept • Concept Boundary identification • Many Candidate Terms • Clue Word Ambiguity • Implicit Expression
Problem • Concept Identification • Variety Concept • งา เป็นพืชไร่น้ำมัน • Saseme isfield-oil crops. Concept => Field Crop, Oil Crop, Field-Oil Crop • Concept Boundary identification • ผงไหมใช้ทำเป็นฟิล์มเคลือบรักษาความสดในอุตสาหกรรมประมง • Silk powder used asfilm for maintain freshness in seafood industry.Concept => film, film for maintain freshness, film for maintain freshness in seafood industry • Many Candidate Terms • สมุนไพรหลายชนิดมีสรรพคุณเป็นยารักษาโรค และมีการนำมาผลิตในระดับอุตสาหกรรมแล้ว เช่นกระเทียม ใบแปะก๊วย • Many herbscan be used as medicineand some of them are manufactured in the industrylevel, such asgarlic, ginkgo biloba. Candidate Terms => herbs, medicine, industry
Problem • Clue Word Ambiguity • ทานตะวันเป็นพืชน้ำมัน • Sun-flowerisoil crop. => HYPONYM (Sun-flower, Oil Crop) • ดอกตัวผู้มีลักษณะช่อเป็นพุ่มสีเขียวอ่อน • Staminate is a green bush. => PROPERTIES (Flower, Color) • Implicit Expression (No Clue-word) • Phrase level “Jasmine Rice” => HYPONYM (Jasmine Rice, Rice)
Forest Ontology Organizing • Use AGROVOC Ontology to be core tree • Merge forest ontology from dictionary and text to core ontology by NLP Technique such as Phrase Analysis, Term Matching
Plant Products Plant Products Fruit + Fruit Fruit Watermelons Tamarind Watermelons Tamarind (a) Field Crops Cereals Field Crops Cereals Maize Maize + Maize Maize Maize Dent Maize Dent Maize Dent Maize (b) Crops Crops Crops Oil Crops + Sesame Oil Crops Sesame Oil Palms Oil Palms (c) Crops Crops Crops Oil Crops + Oil Crops Oil Palms Oil Palms Oil Palms (d) Forest Ontology Organizing
Predicate : โรคถอดฝักดาบ disease control Bakanae plant diseases IS-A IS-A IS-A Bacterial leaf blightBacterial leaf spotBlack spotBrown spotCrack stemFusarium yellowGummosis Mosaic Peanut mottle Existing Concept : Blight Fungal diseases Wilts IS-A IS-A IS-A IS-A Smuts Mildews Rusts Anthracnosis term and relation adding Bakanae Preview Tree Add Verification Tools • For the expert to verify output and add additional related word pairs
Ontology-based Knowledge Management • Information Extraction • Summarization • Knowledge Discovery • Knowledge Tracking
Ontology Ontology Knowledge Processing Architecture Annotated Corpus Template Construction Template Document Text Extraction Summarization Knowledge Structure Knowledge Discovery Knowledge Summary
Has plant name in title Describe in paragraph Has topic sentence Describe in numbering Corpus Style ผักกาดหอม ผักกาดหอมเป็นผักที่ใช้บริโภคส่วนใบ เป็นผักจำพวกผักสลัดที่มีคุณค่าทางอาหารสูง นิยมบริโภคกันแพร่หลายที่สุดในบรรดาผักสลัดด้วยกัน โดยส่วนใหญ่นิยมรับประทานสดแบะนำมาประกอบอาหารหลายชนิด คนไทยนิยมใช้ . . . โรคเน่าเละ สาเหตุเกิดจากเชื้อแบคทีเรีย Erwinia sp. เป็นโรคที่เกิดขึ้นอย่างกว้างขวาง ทำให้ผลผลิตผักกาดหอมเสียหายอย่างมาก เป็นได้ทั้งในแปลงปลูกและโรงเก็บ นอกจากนั้นยังสามารถเกิดโรคได้ในขณะวางตลาดและเมื่อผู้บริโภคซื้อไปแล้วก็อาจเกิดโรคนี้ได้เช่นกัน ลักษณะอาการ อาการทั่วไปที่เกิดกับผักกาดหอมห่อเริ่มจากแผลรอยช้ำเล็กๆ เป็นจุดฉ่ำน้ำ เมื่อสิ่งแวดล้อมเหมาะสมแผลจะขยายตัวทุกทิศทางทั้งด้านยาว กว้างและลึก เนื้อเยื่อของพืชส่วนนั้นจะอ่อนยุบตัวลงและเน่าอย่างรวดเร็ว ทำให้ส่วนนั้นเปื่อยและเป็นน้ำภายในเวลาอันรวดเร็ว มีเมือกเยิ้ม มีกลิ่นแรงมาก กลิ่นนี้จะเป็นกลิ่นเฉพาะของโรคนี้ หลังจากนั้นผักจะเน่ายุบตายไปทั้งต้น ซึ่งอาจแห้งเป็นสีน้ำตาลอยู่บนผิวดิน อาการเน่ามักจะเริ่มที่โคนก้านไปหรือตรงกลางลำต้นก่อน การป้องกันกำจัด ควรปฏิบัติดังนี้ 1. ในการเก็บเกี่ยวควรใช้มีดคมๆ ตัดให้ขาดเพียงครั้งเดียว เพื่อไม่ให้เกิดรอยแผลซ้ำ เพื่อป้องกันการเกิดแผลซึ่งจะเป็นทางเข้าทำลายของเชื้อ 2. หลังจาการเก็บเกี่ยวควรผึ่งผักไว้ในที่โปร่ง อากาศถ่ายเทได้ดี เพื่อให้แผลตรงรอยตัดแห้ง และทาปูนแดงที่แผลด้วย . . . Semi-Structure/one plant per document
Types of information • Entity information (has reference to entity in knowledge structure) *may has a reference problem because surface form of the term • Plant • Disease • Cause • Explanation information • Symptom • Treatment Entity information extracted by Name-entity recognition Explanation information extracted by paragraph classification and summarization
Information representation • Frame of Knowledge • Reference to source of information • One frame per document • One document can has many frames • Each frame represent one disease of the plant includes cause, symptom and treatment Plant-Disease: <DOC_ID=“404200001”> plant : กะหล่ำปลี <PLANT_ID=“000123”> disease : โรคเน่าเละ <DISEASE_ID=“000456”> cause : เชื้อรทีเรีย <PATHOGEN_ID=“000789”> symptom : โรคนี้ด้เกือบทุกระยะติบโตแต่พบมากในระยะที่ treatment : ระมัดอย่าให้เกิดแผลทั้งขณะเก็บเกี่ยวและขนส่ง <DOC id=“AGRIS0404200001”> การปลูกกะหล่ำปลี ... โรคและแมลงศัตรูที่สำคัญ โรคที่สำคัญของกะหล่ำปลีได้แก่ 1. โรคเน่าเละของกะหล่ำปลี สาเหตุเกิดจากเชื้อราแบคทีเรีย ลักษณะอาการโรคนี้พบได้เกือบทุกระยะการเจริญเติบโตแต่พบมากในระยะที่กะหล่ำปลีห่อหัวโดยในระยะแรกพบเป็นจุดหรือบริเวณมีลักษณะฉ่ำน้ำคล้ายรอยช้ำต่อมาแผลจะขยายลุกลามออกไปทำให้เกิดการเน่าเละเป็นเมือกเยิ้มมีกลิ่นเหม็นจัดเมื่ออาการรุนแรงจะทำให้กะหล่ำปลีเน่าเละทั้งหัวและหักพับลง การป้องกันกำจัด 1. ระมัดระวังอย่าให้เกิดแผลหรือรอยช้ำทั้งขณะเก็บเกี่ยวและขนส่ง 2. ฉีดพ่นสารกำจัดแมลงปากกัดหรือแมลงวันในแปลงปลูก 3. กำจัดเศษวัชพืชออกจากแปลงอย่าไถกลบ 4. ในแปลงปลูกควรมีการระบายน้ำดี 5. หลังจากเก็บเกี่ยวแล้วให้เก็บผักไว้ในที่อุณหภูมิต่ำประมาณ10 องศาเซลเซียส ... </DOC> Plant-Disease: <DOC_ID=“404200001”> plant : กะหล่ำปลี <PLANT_ID=“000124”> disease : โรคเน่าเละ <DISEASE_ID=“000457”> cause : เชื้อรทีเรีย <PATHOGEN_ID=“000790”> symptom : โรคนี้ด้เกือบทุกระยะติบโตแต่พบมากในระยะที่ treatment : ระมัดอย่าให้เกิดแผลทั้งขณะเก็บเกี่ยวและขนส่ง Plant-Disease: <DOC_ID=“404200001”> plant : กะหล่ำปลี <PLANT_ID=“000125”> disease : โรคเน่าเละ <DISEASE_ID=“000458”> cause : เชื้อรทีเรีย <PATHOGEN_ID=“000791”> symptom : โรคนี้ด้เกือบทุกระยะติบโตแต่พบมากในระยะที่ treatment : ระมัดอย่าให้เกิดแผลทั้งขณะเก็บเกี่ยวและขนส่ง
Plant Disease Cause Symptom Treatment Overview processes <DOC id=“AGRIS0404200001”> การปลูก<plant plant_id=“000123”>กะหล่ำปลี</plant> ... โรคและแมลงศัตรูที่สำคัญ โรคที่สำคัญของกะหล่ำปลีได้แก่ 1. <disease disease_id=“000456” plant_id=“000123” grp_id=“1”>โรคเน่าเละของกะหล่ำปลี</disease> สาเหตุเกิดจาก<cause pathogen_id=“000789” plant_id=“000123” grp_id=“1”>เชื้อราแบคทีเรีย</cause> <symptom plant_id=“000123” grp_id=“1”>ลักษณะอาการโรคนี้พบได้เกือบทุกระยะการเจริญเติบโตแต่พบมากในระยะที่กะหล่ำปลีห่อหัวโดยในระยะแรกพบเป็นจุดหรือบริเวณมีลักษณะฉ่ำน้ำคล้ายรอยช้ำต่อมาแผลจะขยายลุกลามออกไปทำให้เกิดการเน่าเละเป็นเมือกเยิ้มมีกลิ่นเหม็นจัดเมื่ออาการรุนแรงจะทำให้กะหล่ำปลีเน่าเละทั้งหัวและหักพับลง</symptom> การป้องกันกำจัด <treatment plant_id=“000123” grp_id=“1”>1. ระมัดระวังอย่าให้เกิดแผลหรือรอยช้ำทั้งขณะเก็บเกี่ยวและขนส่ง 2. ฉีดพ่นสารกำจัดแมลงปากกัดหรือแมลงวันในแปลงปลูก 3. กำจัดเศษวัชพืชออกจากแปลงอย่าไถกลบ 4. ในแปลงปลูกควรมีการระบายน้ำดี 5. หลังจากเก็บเกี่ยวแล้วให้เก็บผักไว้ในที่อุณหภูมิต่ำประมาณ10 องศาเซลเซียส</treatment> ... </DOC> <DOC id=“AGRIS0404200001”> การปลูกกะหล่ำปลี ... โรคและแมลงศัตรูที่สำคัญ โรคที่สำคัญของกะหล่ำปลีได้แก่ 1. โรคเน่าเละของกะหล่ำปลี สาเหตุเกิดจากเชื้อราแบคทีเรีย ลักษณะอาการโรคนี้พบได้เกือบทุกระยะการเจริญเติบโตแต่พบมากในระยะที่กะหล่ำปลีห่อหัวโดยในระยะแรกพบเป็นจุดหรือบริเวณมีลักษณะฉ่ำน้ำคล้ายรอยช้ำต่อมาแผลจะขยายลุกลามออกไปทำให้เกิดการเน่าเละเป็นเมือกเยิ้มมีกลิ่นเหม็นจัดเมื่ออาการรุนแรงจะทำให้กะหล่ำปลีเน่าเละทั้งหัวและหักพับลง การป้องกันกำจัด 1. ระมัดระวังอย่าให้เกิดแผลหรือรอยช้ำทั้งขณะเก็บเกี่ยวและขนส่ง 2. ฉีดพ่นสารกำจัดแมลงปากกัดหรือแมลงวันในแปลงปลูก 3. กำจัดเศษวัชพืชออกจากแปลงอย่าไถกลบ 4. ในแปลงปลูกควรมีการระบายน้ำดี 5. หลังจากเก็บเกี่ยวแล้วให้เก็บผักไว้ในที่อุณหภูมิต่ำประมาณ10 องศาเซลเซียส ... </DOC> Plant-Disease : <DOC_ID=“AGRIS0404200001”> plant : กะหล่ำปลี <PLANT_ID=“000123”> disease : โรคเน่าเละ <DISEASE_ID=“000456”> cause : เชื้อราแบคทีเรีย <PATHOGEN_ID=“000789”> symptom : โรคนี้พบได้เกือบทุกระยะการเจริญเติบโตแต่พบมากในระยะที่กะหล่ำปลีห่อหัว โดยในระยะแรกพบเป็นจุดหรือบริเวณมีลักษณะฉ่ำน้ำคล้ายรอยช้ำ ต่อมาแผลจะขยายลุกลามออกไป ทำให้เกิดการเน่าเละเป็นเมือกเยิ้มมีกลิ่นเหม็นจัด เมื่ออาการรุนแรงจะทำให้กะหล่ำปลีเน่าเละทั้งหัวและหักพับลง treatment : 1. ระมัดระวังอย่าให้เกิดแผลหรือรอยช้ำทั้งขณะเก็บเกี่ยวและขนส่ง 2. ฉีดพ่นสารกำจัดแมลงปากกัดหรือแมลงวันในแปลงปลูก 3. กำจัดเศษวัชพืชออกจากแปลง อย่าไถกลบ 4. ในแปลงปลูกควรมีการระบายน้ำดี 5. หลังจากเก็บเกี่ยวแล้วให้เก็บผักไว้ในที่อุณหภูมิต่ำประมาณ 10 องศาเซลเซียส Template <Template Name> { TE: <Element-Name>([Constraint],…); … } Constraint:=NE-class | clue Template Plant-Disease { TE: plant (NE-class=“Plant”); TE: disease (NE-class=“Disease”); TE: cause (NE-class=“Pathogen”); TE: symptom (clue=“อาการ”, “ผิดปกติ”); TE: treatment (clue=“ป้องกัน”, “กำจัด”); } Knowledge Structure Summarization
Ontology Problems from document Knowledge Structure Text Extraction Document Template • Problems • Multiple topics in one paragraph • Incomplete information • Dispersed information
Ontology Text Extraction Architecture Knowledge Structure Text Extraction Document Template New entity Reference id Name-Entity recognition Retrieve reference id Relevant paragraphs selection Explanation information Marker (by paragraph classification) Summarization Frame elements composition
Text Extraction from IE Frame Structure DiscourseStructure Theory Knowledge Summarization Knowledge Summarization Knowledge Summary
Knowledge Interesting • Agricultural Domain ( Thai Agri corpus ) • Cause – Symptom – Treatment of Plant’s disease • Knowledge integrations : ( Template + Discourse Structure) • Frame-based summarization (specific information ,Min-Yen Kan,1999)
Discourse Structure • Model the global structure of the text and its relations to communicative goals • Each relations compose 2 parts • Nucleus : represent the essential piece of information • Satellite : indicate supporting or background information • Represent relation of textual unit with Tree structure
Discourse relation Discourse relation Cause nucleus nucleus nucleus nucleus satellite nucleus nucleus satellite Text Extraction from IE Symptom A D B Treatment A B D Slots Information A D E DiscourseSummarizer B C Text Selected Text Summary Frame-based Frame-based Discourse Summarization
How to Symptom Extraction from IE Symptom Symptom <symptom ref="1" grp="1">ลักษณะอาการ อาการทั่วไปที่เกิดกับผักกาดหอมห่อเริ่มจากแผลรอยช้ำเล็กๆ เป็นจุดฉ่ำน้ำ เมื่อสิ่งแวดล้อมเหมาะสมแผลจะขยายตัวทุกทิศทางทั้งด้านยาว กว้างและลึก เนื้อเยื่อของพืชส่วนนั้นจะอ่อนยุบตัวลงและเน่าอย่างรวดเร็ว ทำให้ส่วนนั้นเปื่อยและเป็นน้ำภายในเวลาอันรวดเร็ว มีเมือกเยิ้ม มีกลิ่นแรงมาก กลิ่นนี้จะเป็นกลิ่นเฉพาะของโรคนี้ หลังจากนั้นผักจะเน่ายุบตายไปทั้งต้น ซึ่งอาจแห้งเป็นสีน้ำตาลอยู่บนผิวดิน อาการเน่ามักจะเริ่มที่โคนก้านไปหรือตรงกลางลำต้นก่อน</symptom> Text Summary Template representation Cause : Symptom : อาการทั่วไปที่เกิดกับผักกาดหอมห่อเริ่มจากแผลรอยช้ำเล็กๆ เป็นจุดฉ่ำน้ำ เมื่อสิ่งแวดล้อมเหมาะสมแผลจะขยายตัวทุกทิศทางทั้งด้านยาว กว้างและลึก เนื้อเยื่อของพืชส่วนนั้นจะอ่อนยุบตัวลงและเน่าอย่างรวดเร็ว ทำให้ส่วนนั้นเปื่อยและเป็นน้ำภายในเวลาอันรวดเร็ว มีเมือกเยิ้ม มีกลิ่นแรงมาก Treatment :
Symptom Annotated from IE <symptom ref="1" grp="1">ลักษณะอาการ อาการทั่วไปที่เกิดกับผักกาดหอมห่อเริ่มจากแผลรอยช้ำเล็กๆ เป็นจุดฉ่ำน้ำ เมื่อสิ่งแวดล้อมเหมาะสมแผลจะขยายตัวทุกทิศทางทั้งด้านยาว กว้างและลึก เนื้อเยื่อของพืชส่วนนั้นจะอ่อนยุบตัวลงและเน่าอย่างรวดเร็ว ทำให้ส่วนนั้นเปื่อยและเป็นน้ำภายในเวลาอันรวดเร็ว มีเมือกเยิ้ม มีกลิ่นแรงมาก กลิ่นนี้จะเป็นกลิ่นเฉพาะของโรคนี้ หลังจากนั้นผักจะเน่ายุบตายไปทั้งต้น ซึ่งอาจแห้งเป็นสีน้ำตาลอยู่บนผิวดิน อาการเน่ามักจะเริ่มที่โคนก้านไปหรือตรงกลางลำต้นก่อน</symptom> Disease :โรคเน่าดำของผักกาดหอม Elaboration Consequence Cause-Result Elaboration Elaboration [A]ลักษณะอาการ อาการทั่วไปที่เกิดกับผักกาดหอมห่อเริ่มจากแผลรอยช้ำเล็กๆ เป็นจุดฉ่ำน้ำ [B]เมื่อสิ่งแวดล้อมเหมาะสมแผลจะขยายตัวทุกทิศทางทั้งด้านยาว กว้างและลึก [C]เนื้อเยื่อของพืชส่วนนั้นจะอ่อนยุบตัวลงและเน่าอย่างรวดเร็ว ทำให้ส่วนนั้นเปื่อยและเป็นน้ำภายในเวลาอันรวดเร็ว มีเมือกเยิ้ม มีกลิ่นแรงมาก [D]กลิ่นนี้จะเป็นกลิ่นเฉพาะของโรคนี้ [E]หลังจากนั้นผักจะเน่ายุบตายไปทั้งต้น ซึ่งอาจแห้งเป็นสีน้ำตาลอยู่บนผิวดิน [F]อาการเน่ามักจะเริ่มที่โคนก้านไปหรือตรงกลางลำต้นก่อน Text Summary
ผักกาดหอม Disease : โรคเน่าดำ Cause : เชื้อแบคทีเรีย อาการทั่วไปที่เกิดกับผักกาดหอมห่อเริ่มจากแผลรอยช้ำเล็กๆ เป็นจุดฉ่ำน้ำ เมื่อสิ่งแวดล้อมเหมาะสมแผลจะขยายตัวทุกทิศทางทั้งด้านยาว กว้างและลึก เนื้อเยื่อของพืชส่วนนั้นจะอ่อนยุบตัวลงและเน่าอย่างรวดเร็ว ทำให้ส่วนนั้นเปื่อยและเป็นน้ำภายในเวลาอันรวดเร็ว มีเมือกเยิ้ม มีกลิ่นแรงมาก Symptom : Treatment: ในการเก็บเกี่ยวควรใช้มีดคมๆ ตัดให้ขาดเพียงครั้งเดียว เพื่อไม่ให้เกิดรอยแผลซ้ำหลังจาการเก็บเกี่ยวควรผึ่งผักไว้ในที่โปร่ง อากาศถ่ายเทได้ดี Frame Representation
Discourse Summarization Procedure • To generating text segmentation (EDU: Elementary Discourse Unit ) • To Build discourse tree structure from EDUs in step 1. • Select leaf nodes as Knowledge Summary(salient unit) .
Knowledge Processing Architecture Annotated Corpus Template Construction Template Document Text Extraction Summarization Knowledge Summary Knowledge Structure Ontology Knowledge Extraction Ontology Generalization rules Knowledge Discovery
Knowledge structure • Knowledge structure consists of • Plant growing method • Variety selection • Soil preparation • Seedling preparation • Cultural practice • Plant disease and insect control • Cause and symptom • Treatment / killing • Protection
Knowledge extraction • Relation to be extracted • Cause relation • e.g. Pyricularia grisea Causes of Blast disease in rice • Effect relation • e.g. The Blast symptoms caused by Pyricularia grisea are big brown spots like eye shape on leaf and…….. • Consequence relation
Generalization of Cause/Result Relations • Need processes • Knowledge representation • Induction reasoning • Need ontology to define the supper set of insect and micro organism: e.g Louse = {เพลี้ยไฟพริก, เพลี้ยไก่แจ้, เพลี้ยจั๊กจั่นฝอย, เพลี้ยจั๊กจั่น ….}
Knowledge Discovery • Generalized Rules x Disease(x, เพลี้ยฯ)Symptom(x, ใบ, ใบหงิกงอ ) x Disease(x, Disease fromLouse)Symptom(x,leaf, curve ) x Disease(x, โรคใบไหม้/โรคไหม้)Symptom(x, ใบ, แผลสีเทา) x Disease(x, Leaf blight/Blast)Symptom(x, leaf, grey blot)
Knowledge Discovery • Generalized Rules for symptom • All louses cause of curve leaf symptom in fruit • All Blast and Blight leaf diseases in plant have grey blots/spots
From Generalized Symptoms Matrix to Inductive Prediction • By using ID3 technique X3:leaf,curve Y N Disease caused by louse X7:leaf, grey blot Y Leaf blight/Blast Disease