420 likes | 1.76k Views
Natural Language Processing (NLP). รายชื่อสมาชิก นางมาสิริ สุขสุวรรณ รหัส 5510421006 นางสาวมาริษา อัมราช รหัส 5510421015. Natural Language Processing (NLP).
E N D
Natural Language Processing (NLP) รายชื่อสมาชิก • นางมาสิริ สุขสุวรรณ รหัส 5510421006 • นางสาวมาริษา อัมราช รหัส 5510421015
Natural Language Processing (NLP) การประมวลผลภาษาธรรมชาติเป็นวิธีการใช้คอมพิวเตอร์เพื่อการวิเคราะห์ข้อความ โดยขึ้นอยู่กับชุดของทฤษฎีและชุดของเทคโนโลยี โดยมีการทำวิจัยและพัฒนาซึ่งไม่ได้ถูกกำหนดเพียงคนใดคนหนึ่งแต่เป็นการตกลงร่วมกันของทุกๆ คน โดยมีคำนิยามที่เสนอคือ ความหมาย: การประมวลผลภาษาธรรมชาติมาจากทฤษฎีทางเทคนิคการคำนวณสำหรับการวิเคราะห์และเป็นตัวแทนของธรรมชาติที่เกิดขึ้นกับหนึ่งข้อความหรือมากกว่า ขึ้นอยู่กับระดับของการวิเคราะห์ภาษา โดยมีวัตถุประสงค์เพื่อการประมวลผลเหมือนภาษามนุษย์ สำหรับใช้งานบางส่วนหรือใช้ในการทำงาน
Natural Language Processing (NLP) “ เทคนิคการคำนวณ ” มีหลายวิธีหรือเทคนิคที่จะเลือกใช้ เพื่อให้การวิเคราะห์ภาษาประสบผลสำเร็จ “ ธรรมชาติข้อความ ” ความสามารถของภาษาใด ๆ แบบ, ประเภทฯลฯ ข้อความเป็นได้ทั้งคำพูดหรือลายลักษณ์อักษร ซึ่งข้อกำหนดในการใช้ภาษาของมนุษย์ก็คือ ใช้ในการสื่อสารกับคนอื่น นอกจากนี้ยังมีข้อความที่ไม่สามารถวิเคราะห์ได้ แต่ว่าข้อความเหล่านี้ถูกนำมาใช้งานจริง
Natural Language Processing (NLP) “ ระดับการวิเคราะห์ภาษา ”การประมวลผลของภาษาที่มาจากมนุษย์เป็นผู้สร้างขึ้นหรือเข้าใจภาษา คือมนุษย์ในแต่ละระดับมีความแตกต่างกันบอกถึงแต่ละความหมาย แต่ระบบ NLP ต่างๆ ที่ใช้ในระดับการวิเคราะห์ที่แตกต่างกัน อาจจะนำไปสู่ความสับสนอย่างมากในส่วนที่ไม่ใช่ผู้เชี่ยวชาญในระบบ NLP จริงๆ “ การประมวลผลเสมือนภาษามนุษย์ ” ระบบ NLP ถือว่าส่วนหนึ่งของปัญญาประดิษฐ์ (AI) มุ่งมั่นการทำงานเสมือนมนุษย์เพื่อประสิทธิภาพการทำงาน
Natural Language Processing (NLP) “ การใช้งานบางส่วน “ ระบบ NLP ถือว่าไม่เป็นเป้าหมายเพื่อนำมาใช้งานทั่วไป เป็นวิธีการที่ใช้เฉพาะงาน ต้องการที่ค้นข้อมูลจากระบบ NLP เช่น ระบบแปลภาษา (MT), ระบบคำถาม-คำตอบ และระบบอื่น ๆ
Natural Language Processing (NLP) เป้าหมายของ ระบบ NLP เพื่อใช้ในการประมวลผลภาษาเสมือนมนุษย์ เลือกคำ ‘Processing’ เดิมอ้างอิงคำ ‘Understanding’ ความเข้าใจรอบคอบ มาจากการเข้าใจภาษาธรรมชาติ (NLU) ‘Natural Language Understanding’ โดยระบบ NLU ที่สมบูรณ์นั้นมีความสามารถ: 1. แปลข้อความ 2.แปลข้อความเป็นภาษาอื่น 3. ตอบคำถามเกี่ยวกับเนื้อหาของข้อความ 4.สรุปจากข้อความได้
Natural Language Processing (NLP) ซึ่งเป้าหมาย NLP นี้ยังไม่ประสบความสำเร็จ โดยไม่สามารถสรุปข้อความได้ โดย NLU ยังคงเป็นเป้าหมายของ NLP เป้าหมาย NLP ที่นำมาประยุกต์ใช้ คือ ความถูกต้องแม่นยำของข้อมูลในการตอบสนองต่อข้อมูลที่แท้จริงตามที่ผู้ใช้ต้องการ, การแสดงความหมายที่แท้จริงและความตั้งใจที่จะค้นหาข้อมูลจากผู้ใช้ซึ่งสามารถแสดงได้อย่างเป็นธรรมชาติของภาษาที่ใช้ในชีวิตประจำวัน, เนื้อหาของเอกสารที่ถูกค้นหาจะถูกแสดงในทุกระดับของความหมายเพื่อให้ตรงกับความต้องการที่แท้จริงระหว่างความต้องการและการตอบสนอง
Natural Language Processing (NLP) ต้นกำเนิด NLP เป็นสาขาวิชาที่รวมหลายสิ่งหลายอย่างเข้าด้วยกัน มีส่วนเกี่ยวข้องกับ NLP คือ ภาษาศาสตร์ – โดยภาษาศาสตร์จะมุ่งเน้นรูปแบบโครงสร้างของภาษา, ภาษาสากล – เรียกว่าภาษาศาสตร์,วิทยาการคอมพิวเตอร์ – เกี่ยวกับการพัฒนาข้อมูลและการประมวลผลที่มีประสิทธิภาพของโครงสร้าง,จิตวิทยาปัญญา - เป็นกระบวนการทางความคิดของมนุษย์และมีเป้าหมายในการสร้างแบบจำลองการใช้ภาษาในทางที่เป็นไปได้ในทางจิตวิทยา
Natural Language Processing (NLP) การจำแนก หมวดหมู่ NLPมีขอบเขตของข้อมูลที่แตกต่างกันคือ - การประมวลผลภาษาธรรมชาติเทียบเท่ากับบทบาทของ ผู้อ่าน/ผู้ฟัง • การสร้างภาษาธรรมชาติเป็นส่วนของ ผู้เขียน/ผู้พูด คือระบบการผลิตต้องมีการวางแผนหรือรูปแบบของเป้าหมายของการทำงานร่วมกันที่จะตัดสินใจเลือกสิ่งที่ระบบควรสร้างในแต่ละจุดให้สัมพันธ์ เชื่อมโยงกัน • ความเข้าใจภาษา เป็นรูปแบบของคลื่นเสียงที่ใช้ไวยากรณ์และคำพูด • ความเข้าใจในการพูดเป็นส่วนของเสียงที่ภาษาเลือกใช้
Natural Language Processing (NLP) ประวัติโดยย่อของ NLP การวิจัยการประมวลผลภาษาธรรมชาติได้เกิดขึ้นมาตั้งแต่ปลายปี 1940 มีเครื่องแปลภาษา (MT) ‘Machine translation’ เป็นโปรแกรมคอมพิวเตอร์ที่ใช้ครั้งแรก ในปี 1946 Weaver and Booth เริ่มต้นหนึ่งของโครงการ MT จากเครื่องคอมพิวเตอร์แปลภาษาโดยมีความเชี่ยวชาญในถอดรหัสศัตรูในระหว่างสงครามโลกครั้งที่สอง ในปี 1949 นำความคิดของWeaver ของเครื่อง MT โดยใช้ความคิดจากการเข้ารหัสข้อมูลและทฤษฎีสำหรับการแปลภาษา เริ่มการวิจัยที่สถาบันการวิจัยต่างๆในสหรัฐอเมริกาภายในไม่กี่ปี
Natural Language Processing (NLP) ประวัติโดยย่อของ NLP ในมุมมองแบบง่ายๆ ของ MT คือ การนำคำศัพท์และคำสั่ง จากพจนานุกรมค้นหาคำที่เหมาะสมสำหรับการแปลและทวนคำสั่ง โดยไม่ต้องคำนึงถึงความหมายกำกวมที่อยู่ในคำศัพท์ตามภาษาธรรมชาติ ทำให้ผลลัพธ์ที่ได้ล้มเหลว ในปี 1957 Chomsky เสนอโครงสร้างความสัมพันธ์แนะนำความคิดของไวยากรณ์ ซึ่งทำให้เข้าใจข้อมูลได้ดีขึ้นหรือวิธีหลักภาษาศาสตร์มาช่วย MT เช่นการใช้งาน NLP จำเสียงพูด ในปี 1950 ระบบการแปลที่มีคุณภาพสูงให้ผลลัพธ์ที่แตกต่างจากที่นักแปลของมนุษย์ แต่ยังเป็นไปได้แค่หลักการ
Natural Language Processing (NLP) ประวัติโดยย่อของ NLP ในปี 1966 ALPAC รายงานสรุปว่า MT ก็ไม่สามารถประสบความสำเร็จในทันทีและไม่ได้รับการสนับสนุนการใช้งานของ NLP ยังน้อยในสหรัฐอเมริกาปัญหาที่เกิดขึ้นในการสร้างระบบต้นแบบ ในปี 1960 - ปี 1970 มุ่งเน้นวิธีการที่จะเป็นตัวแทนของความหมายและแนวทางการพัฒนาที่เป็นไปได้ให้ง่ายกว่าทฤษฎีของไวยากรณ์ พัฒนาทฤษฎีระบบต้นแบบ ในปี 1970 ให้ความสนใจกับปัญหาการเปลี่ยนความหมายของคำพูดและเป้าหมายการสื่อสารและแผนดำเนินการ ทฤษฎีการแบ่งคำพูดเป็นหน่วย ความสัมพันธ์ระหว่างโครงสร้างของบทสนทนา รูปแบบข้อความสั้นๆ ตอบสนองกันแบบออนไลน์ เป็นความสำเร็จที่สำคัญ ฯลฯ
Natural Language Processing (NLP) ประวัติโดยย่อของ NLP ในปี 1980 แสดงวิธีการของสัญลักษณ์ ช่วยให้ระบบสมบูรณ์ขึ้น ในช่วงหลายสิบปีที่ผ่านมา สายงานนี้ได้เติบโตอย่างรวดเร็ว ประกอบด้วย 1) ความพร้อมใช้งานที่เพิ่มขึ้นของข้อความอิเล็กทรอนิกส์จำนวนมาก 2) ความพร้อมของเครื่องคอมพิวเตอร์ที่มีความเร็วและหน่วยความจำที่เพิ่มขึ้น 3) การกำเนิดของอินเทอร์เน็ต คำที่แสดงความรู้สึก จัดการข้อความทั่วไป ความหมายกำกวมของภาษาได้ดีขึ้น ฯลฯ ได้กลายเป็นมาตรฐานทั่วไปของ NPL
Natural Language Processing (NLP) ระดับของ NLP ระดับของการประมวลผลภาษามนุษย์ที่ปฏิบัติ ระดับความสามารถในการโต้ตอบ การใช้ข้อมูลที่ได้รับจากความคิดเป็นระดับที่สูงขึ้นของการประมวลผลช่วยในการลดระดับของการวิเคราะห์ เช่น การถูกแบ่งคำ หลายๆ คำ ตามความรู้สึก ระดับเสียงพูด (Phonology) การตีความหมายของเสียงภายในคำและข้ามคำ มีกฎ 3 ประการที่ใช้ในการวิเคราะห์เสียงคือ : 1) กฎการออกเสียง -เสียงภายในคำ 2) หน่วยของเสียง - รูปแบบของการออกเสียง3) จังหวะของเสียง - ความเครียดและน้ำเสียงในประโยค NLPนำข้อมูลคำพูดในแบบการวิเคราะห์คลื่นเสียงและการเข้ารหัสเป็นสัญญาณดิจิทัล ตีความหมายตามกฎ เปรียบเทียบกับรูปแบบภาษาโดยเฉพาะ
Natural Language Processing (NLP) ระดับของ NLP ระดับหน่วยคำ (Morphology)เกี่ยวกับองค์ประกอบของคำหน่วยที่เล็กที่สุดของคำ เช่น คำ คำนำหน้า (Prefix), ราก (Root) และคำต่อท้าย(Suffix)ความหมายของคำยังเหมือนเดิม แต่มนุษย์นำหน่วยคำที่เล็กที่ไม่มีความหมายมาประกอบกันเพื่อที่จะเข้าใจความหมายของคำ หรือ การเพิ่ม-edต่อท้าย ให้กลายเป็นคำกริยาบอกการกระทำที่เกิดขึ้นในอดีต ระดับคำศัพท์ (Lexical)ที่กำหนดในข้อความตีความความหมายของคำแต่ละคำ การประมวลผลหลายอย่าง ความเป็นไปได้ของคำรวมกัน มีความหมายในคำพูดและ การผลิต การตีความที่ซับซ้อนมาก เช่นเดียวกับที่มนุษย์ทำ
Natural Language Processing (NLP) ระดับของ NLP ระดับประโยค (Syntactic)วิเคราะห์คำในประโยค โครงสร้างไวยากรณ์ของประโยค ความสัมพันธ์ระหว่างโครงสร้างระหว่างคำ ที่มีไวยากรณ์ต่างๆ เช่น ‘สุนัขไล่แมว‘ และ 'แมวไล่สุนัข‘ แตกต่างกันในแง่ของไวยากรณ์ยังถ่ายทอดความหมายที่แตกต่างกันมาก ระดับความหมาย (Semantic) กำหนดความหมายที่เป็นไปได้ของประโยคที่มีความสัมพันธ์ระหว่าง คำ ข้อความ ประโยค นำไปสู่ระดับการประมวลผลที่หลากหลาย การใช้งาน สิ่งที่น่าสนใจ ความรู้สึก เช่น ประโยค ‘file' หมายถึง โฟลเดอร์สำหรับการจัดเก็บ หรือเครื่องมือ หรือคิวของข้อมูล
Natural Language Processing (NLP) ระดับของ NLP ระดับสนทนา (Discourse) มุ่งเน้นที่คุณสมบัติของข้อความ ที่สื่อความหมาย การเชื่อมต่อระหว่างประโยค องค์ประกอบ หลายประเภท ความละเอียด การรับรู้ ความคาดหวัง ฯลฯ ระดับทางปฏิบัติ (Pragmatic) เกี่ยวกับการใช้ของภาษาในสถานการณ์การใช้เนื้อหาของข้อความ คือต้องอธิบายความหมายเป็นพิเศษ ต้องใช้ความรู้ภายในโลกมารวมกันถึงเข้าใจ เช่น “สมาชิกสภาเมืองปฏิเสธการประท้วงใบอนุญาตเพราะพวกเขากลัวความรุนแรง” และ “สมาชิกสภาเมืองปฏิเสธการประท้วงใบอนุญาตเพราะพวกเขาสนับสนุนการปฏิวัติ”
Natural Language Processing (NLP) สรุปของระดับ NLP ระบบ NLP ในปัจจุบันมีแนวโน้มดำเนินการประมวลผลส่วนใหญ่แค่ระดับล่าง ด้วยเหตุผลคือ 1. ยังไม่จำเป็นต้องมีการตีความในระดับที่สูงขึ้น 2. ระดับล่างยังได้รับการวิจัยอย่างละเอียดและดำเนินการอยู่ 3. ระดับล่างจัดการกับหน่วยงานขนาดเล็ก เช่น คำ ประโยค ถ้าเป็นกฎการปกครองจะเทียบกับระดับที่สูงขึ้นของการประมวลผลภาษาที่จัดการกับข้อความและความรู้ภายในโลก ในขณะที่วิธีการเชิงสัญลักษณ์ได้กระทำกับทุกระดับ อย่างไรก็ตามยังบ้างระบบที่ทำงานในระดับสูง
Natural Language Processing (NLP) APPROACHES TO NATURAL LANGUAGE PROCESSING การประมวลผลของ Natural Language แบ่งออกเป็น 4 ประเภทคือ 1. Symbolic 2. Statistical 3. Connectionist 4. Hybrid
Natural Language Processing (NLP) ส่วนนี้แต่ละวิธีการตรวจสอบในแง่เทคนิคทั่วไปความแตกต่าง ในการประมวลผลและความเหมาะสมสำหรับงานต่างๆ แสดงให้เห็น ประโยชน์ของ Neural Networks in NLP ดังนี้ 1. Symbolic Approach วิธีการวิเคราะห์สัญลักษณ์ ปรากฏการณ์ภาษาขึ้นอยู่กับการเป็นตัวแทนที่ชัดเจนของข้อเท็จจริงผ่านความรู้ความเข้าใจ และขั้นตอนวิธีการที่เกี่ยวข้อง คำอธิบายของระดับของการวิเคราะห์ภาษาในส่วนก่อนหน้านี้จะได้รับจากมุมมองที่เป็นสัญลักษณ์ แหล่งที่มาหลักของพยานหลักฐานในระบบสัญลักษณ์มาจากกฎระเบียบของมนุษย์และการพัฒนาคำศัพท์
Natural Language Processing (NLP) ตัวอย่างที่ดีของวิธีการที่ถูกมองว่าเป็นสัญลักษณ์ในตรรกะหรือระบบ ตามกฎ ใน Logicbasedระบบโครงสร้างเชิงสัญลักษณ์โดยปกติจะเป็นในรูปแบบของตรรกะ โครงสร้างดังกล่าวจะกำหนด โดยวิธีการอนุมานที่มีทั่วไป ความจริงระบบที่ใช้มักจะประกอบด้วยชุดของกฎอนุมานและ ในการทำงาน ความรู้จะแสดงเป็นข้อเท็จจริงหรือกฎระเบียบใน กฎฐาน การอนุมานซ้ำ การเลือกกฎที่มีสภาพเป็นที่พอใจและการดำเนินการตาม กฎ
Natural Language Processing (NLP) ตัวอย่างของวิธีการที่เป็นสัญลักษณ์อีกอย่างหนึ่งคือเครือข่ายความหมาย แรกที่เสนอโดย Quillianหน่วยความจำแบบเชื่อมโยงในด้านจิตวิทยาความหมายเป็นตัวแทนของเครือข่าย ความรู้ผ่านชุดของโหนดที่เป็นตัวแทนของวัตถุหรือแนวความคิดและการเชื่อมโยงที่แสดงถึงความสัมพันธ์ระหว่างโหนดรูปแบบของการเชื่อมที่สะท้อนให้เห็นถึงความหมายขององค์กร แนวความคิดที่เกี่ยวข้องขั้นสูงมีการเชื่อมโยงโดยตรงในขณะที่ แนวคิดปานกลางหรือที่เกี่ยวข้องมีการเชื่อมโยงผ่านการแทรกแซง แนวคิดเครือข่ายความหมายที่มีการใช้กันอย่างแพร่หลายเพื่อเป็นตัวแทน ของความรู้ที่มีโครงสร้างและมี Connectionist มากที่สุดของรูปแบบสัญลักษณ์
Natural Language Processing (NLP) 2. Statistical Approach วิธีการ ทางสถิติ ใช้เทคนิค ทาง คณิตศาสตร์ ที่หลากหลายและมักจะใช้ตัวอักษรขนาดใหญ่ Corpora พัฒนารูปแบบ ทั่วไป การประมาณของปรากฏการณ์ ทางภาษาศาสตร์ ตัวอย่าง ของปรากฏการณ์ เหล่านี้ โดย Corporaไม่ต้องเพิ่มความรู้ ภาษา ของโลก ในทางตรงกันข้ามกับแนวทางสัญลักษณ์ ทางสถิติวิธีการใช้ ข้อมูลที่สังเกตได้ว่าเป็นแหล่งที่มาของ หลักฐานแบบจำลองทางสถิติ ที่ใช้ บ่อยคือ Hidden Markov Model (HMM) แม้ว่าผลจะสามารถมองเห็น ระบุตัวเองไม่ได้โดยตรง จากการสังเกตการณ์ภายนอก อย่างใดอย่างหนึ่งด้วยความ น่าจะเป็นบางอย่าง วิธีการทางสถิติ ที่ได้รับมักจะใช้ในงานต่างๆเช่นการรู้จำ อื่น ๆ
Natural Language Processing (NLP) 3. Connectionist Approach คล้ายกับวิธีการทางสถิติ วิธีการ Connectionist ยังพัฒนารุ่นต่อๆ มา ตัวอย่าง ของปรากฏการณ์ทาง ภาษาศาสตร์ สิ่งที่แยกจาก Connectionism วิธีการทางสถิติ อื่น ๆ รูปแบบ การเรียนรู้ การรวม สถิติ ด้วยทฤษฎีต่างๆ ของการแสดง การเปลี่ยนแปลง การอนุมาน และการจัดการ สูตร ตรรกะ นอกจากนี้ในระบบ Connectionistภาษา ยากที่จะสังเกตเนื่องจากความจริงที่ว่า สถาปัตยกรรม Connectionist มีข้อจำกัดน้อย
Natural Language Processing (NLP) บางรุ่นของ Connectionist จะเรียกว่า รุ่น Localist สมมติว่า แต่ ละหน่วย แสดงให้เห็นถึงแนวคิดโดยเฉพาะ ตัวอย่างเช่น หน่วยหนึ่ง อาจ เป็นตัวแทนของ แนวคิด " เลี้ยงลูกด้วยนม " ในขณะที่หน่วยอื่น อาจเป็น ตัวแทนของ แนวคิด " ปลาวาฬ " ความสัมพันธ์ระหว่างแนวความคิด เป็น การเข้ารหัสโดย ดูน้ำหนักของการเชื่อมระหว่างแนวความคิดเหล่านั้น ความรู้ดังกล่าวรูปแบบที่จะถูกกระจายไปทั่วทั้งเครือข่าย และการ เชื่อมต่อ ระหว่างหน่วยงาน สะท้อนให้เห็นถึงความสัมพันธ์ของโครงสร้าง
Natural Language Processing (NLP) Comparison Among Approaches เปรียบเทียบระหว่างแนวทาง ส่วนข้างต้นเห็นได้ว่ามีความคล้ายคลึงกัน และความแตกต่างที่มีอยู่ ระหว่างวิธีการในแง่ของสมมติฐาน รากฐาน ปรัชญาและแหล่งที่มาของหลักฐาน นอกเหนือจากการที่คล้ายคลึงและ แตกต่าง นอกจากนี้ยังสามารถสะท้อนให้เห็นใน กระบวนการแต่ละวิธี ดังต่อไปนี้ รวมทั้งในด้านระบบความทนทาน ยืดหยุ่น และเหมาะสมใน แนวทาง
Natural Language Processing (NLP) 1.Process (กระบวนการ) การวิจัยใช้วิธีการที่แตกต่างกัน ดังต่อไปนี้คือ การเก็บรวบรวมข้อมูล การสร้าง การวิเคราะห์ข้อมูล / รูปแบบกฎ / ข้อมูลและการประยุกต์ใช้ กฎระเบียบ / ข้อมูลที่อยู่ใน ระบบ ขั้นตอนการเก็บรวบรวมข้อมูลที่มีความสำคัญทั้งสามวิธี แต่วิธีการทางสถิติ และ connectionist มักจะต้องมีข้อมูลมากขึ้น มากกว่าวิธีสัญลักษณ์ ในการวิเคราะห์ ข้อมูล / รุ่น ขั้นตอนการสร้าง วิธี สัญลักษณ์ พึ่งพาการ วิเคราะห์ ของมนุษย์ ของข้อมูล เพื่อสร้างทฤษฎี ในขณะที่สถิติมีวิธีการ ด้วยตนเอง กำหนดแบบจำลองทางสถิติ ที่มีลักษณะทั่วไปโดยประมาณ ของการเก็บรวบรวม
Natural Language Processing (NLP) 2.System aspectsด้านระบบ โดยลักษณะของระบบหมายถึง แหล่งที่มาของข้อมูลทฤษฎีหรือแบบจำลองที่เกิดขึ้น จากการวิเคราะห์ ข้อมูลกฎระเบียบและเป็นพื้นฐานสำหรับการประเมินผล - ข้อมูล: วิธีการใช้ข้อมูลสัญลักษณ์ครุ่นคิดมนุษย์ซึ่ง มักจะไม่เห็น ได้โดยตรง วิธีการทางสถิติและ Connectionist จะถูกสร้างขึ้นบนพื้นฐาน ของแง่มุมที่สังเกตได้ของข้อมูลที่มักจะมาจาก Corpora ข้อความ - ทฤษฎี : หรือแบบจำลองจากการวิเคราะห์ข้อมูลเป็นผลของการ วิเคราะห์ข้อมูลที่เป็นทฤษฎี สร้างขึ้นมาเพื่อเป็นสัญลักษณ์ในขณะที่วิธีการ แบบตัวแปรจะเกิดขึ้นกับสถิติ วิธีการและรูปแบบ connectionist จะเกิด ขึ้นกับวิธีการ Connectionist
Natural Language Processing (NLP) - กฎ: สำหรับวิธีสัญลักษณ์ขั้นตอนการก่อสร้างกฎมักจะส่งผลให้ กฎระเบียบด้วยเงื่อนไขรายละเอียดของการประยุกต์ใช้กฎ สำหรับวิธีการ ทางสถิติเกณฑ์ของกฎการประยุกต์ใช้มักจะอยู่ในระดับพื้นผิว หรือระบุ สำหรับ Connectionist วิธีการกฎระเบียบของแต่ละบุคคลโดยทั่วไปจะไม่ ได้รับการยอมรับ - เกณฑ์ในการประเมินผล: การประเมินผลของระบบสัญลักษณ์ เป็นไปตามปกติในการใช้งานง่าย การตัดสินอาจใช้มาตรการระบบภายใน ของการเจริญเติบโต เป็นจำนวนของกฎระเบียบใหม่ ในทางตรงกันข้าม เป็นพื้นฐานสำหรับการประเมินผลทางสถิติ และ ระบบ
Natural Language Processing (NLP) Connectionist มักจะอยู่ในรูปแบบของการคำนวณคะแนนจากการ ประเมินบางฟังก์ชัน แต่ถ้าวิธีการทั้งหมดจะถูกนำมาใช้สำหรับงาน เดียวกันแล้วผลของงานสามารถประเมินทั้งเชิงปริมาณและเชิงคุณภาพ - ทนทาน: ระบบสัญลักษณ์อาจจะเปราะบางเมื่อนำเสนอด้วย ความผิดปกติ อินพุต ที่จะจัดการกับความผิดปกติโดยการทำไวยากรณ์ มากขึ้นที่จะรองรับเมื่อเทียบกับระบบสัญลักษณ์ ระบบสถิติที่อาจจะมี ประสิทธิภาพมากขึ้นกับการป้อนข้อมูลที่ไม่คาดคิดให้ได้เพียงพอ ซึ่ง อาจจะเป็นเรื่องยากที่จะมั่นใจได้ว่า ระบบ Connectionist ก็อาจจะ
Natural Language Processing (NLP) แข็งแกร่งและความผิดพลาดเพราะความรู้ในระบบดังกล่าวจะถูกเก็บไว้ใน เครือข่ายเมื่อนำเสนอด้วยการป้อนข้อมูลที่ค่อยๆ ลด - ความยืดหยุ่น :ตั้งแต่รูปแบบสัญลักษณ์ที่สร้างขึ้นโดยการ วิเคราะห์ของมนุษย์ที่มีสูตร ตัวอย่างระบบสัญลักษณ์อาจขาดความ ยืดหยุ่นในการปรับตัวเข้ากับแบบไดนามิกในทางตรงกันข้ามระบบสถิติที่ ช่วยให้พื้นที่กว้างและอาจจะดีกว่าสามารถที่จะจัดการกับข้อความที่ไม่ จำกัด สำหรับการจัดการที่มีประสิทธิภาพมากขึ้นของงานในมือ Connectionist ระบบแสดงความยืดหยุ่นแบบไดนามิกโดยการแสวงหา
Natural Language Processing (NLP) พฤติกรรมที่เหมาะสมขึ้นอยู่กับให้ใส่ตัวอย่าง เช่น น้ำหนักของเครือข่าย Connectionist สามารถนำมาปรับในเรียลไทม์ เพื่อปรับปรุงประสิทธิภาพ แต่ระบบดังกล่าวอาจมีปัญหากับการเป็นตัวแทนของโครงสร้างที่จำเป็นใน การจัดการกับความสัมพันธ์ที่เป็นนามธรรมที่ซับซ้อนจึงจำกัด ความสามารถที่จะจัดการในระดับสูง งานที่เหมาะสม : วิธีสัญลักษณ์ดูเหมือนจะเหมาะกับ ปรากฏการณ์ที่แสดง พฤติกรรมของภาษาที่สามารถระบุตัวตน สามารถใช้ ในการจำลองปรากฏการณ์ต่างๆ ระดับภาษาที่อธิบายไว้ในส่วนก่อนหน้านี้ วิธีการทางสถิติได้พิสูจน์แล้วว่ามีประสิทธิภาพในการสร้างแบบจำลอง
Natural Language Processing (NLP) ปรากฏการณ์ภาษาขึ้นอยู่กับการใช้งานบ่อยภาษาที่สะท้อนให้เห็น ใน Corpora ข้อความ หรือปรากฏการณ์ภาษาที่ไม่เข้าใจหรือไม่แสดงความ ชัดเจน วิธีการทางสถิติ วิธีการ Connectionist ยังสามารถจัดการกับ ปรากฏการณ์ทางภาษาที่ไม่ดี ดังนั้นจะมีประโยชน์สำหรับระดับต่ำ NLP เพื่อสรุปสัญลักษณ์วิธีการทางสถิติและ Connectionist ได้แสดง ลักษณะที่แตกต่างกันจึงเกิดปัญหาบางอย่างอาจจะจัดการได้ดีขึ้นด้วย วิธีการอย่างใดอย่างหนึ่ง ในบางกรณีสำหรับงานเฉพาะบางอย่างวิธีการ อย่างใดอย่างหนึ่ง อาจพิสูจน์ที่เพียงพอในขณะที่ในกรณีอื่น ๆ งานที่จะ ได้รับความซับซ้อนเพื่อที่ว่ามันอาจจะไม่เป็นไปได้ที่จะ
Natural Language Processing (NLP) ไม่มี "สถิติอย่างหมดจด" วิธีการ ใช้สถิติทุกอย่าง จะขึ้นอยู่กับรูปแบบ สัญลักษณ์และสถิติเพียงอย่างเดียวไม่เพียงพอ สิ้นสุดวิธีการทางสถิติ ที่จะไม่ขัดแย้งกับแนวทางสัญลักษณ์ ในความเป็นจริงค่อนข้างสมบูรณ์ เป็นผลให้นักวิจัยได้เริ่มพัฒนาเทคนิคไฮบริด ที่ใช้จุดแข็งของแต่ละวิธีการ ในความพยายามที่จะแก้ไขปัญหา NLP เพิ่มเติม ได้อย่างมีประสิทธิภาพ และในลักษณะที่มีความยืดหยุ่นมากขึ้น
Natural Language Processing (NLP) NATURAL LANGUAGE PROCESSING APPLICATIONS การประมวลผลภาษาธรรมชาติมีทั้งทฤษฎี และการใช้งาน สำหรับช่วงของการใช้งาน ในความเป็นจริงการประยุกต์ใช้มากที่สุด การใช้งานบ่อย การใช้ NLP ต่อไปนี้• ดึงข้อมูล - กำหนดความหมายของข้อความในโปรแกรมนี้ก็ คือ มีไม่กี่ วิธีการทางสถิติ NLPใช้ประโยชน์มากขึ้น แต่มีไม่กี่ระบบอื่นนอกเหนือจาก ที่ ลิดดี้ส์ และ Strzalkowskiได้มีการพัฒนาระบบอย่างมีนัยสำคัญ ขึ้นอยู่ กับ NLP
Natural Language Processing (NLP) .• การสกัด ข้อมูล (IE ) - การใช้พื้นที่มากขึ้น IE มุ่งเน้นไปที่การรับรู้ การติดแท็ก และการสกัด เป็นตัวแทนของโครงสร้างที่สำคัญบางอย่าง องค์ประกอบของ ข้อมูล เช่น คน บริษัท สถานที่ องค์กร จากที่มีขนาดใหญ่ คอลเลกชันของข้อความสกัดเหล่านี้ สามารถนำมาใช้งานรวมทั้ง ตอบ คำถาม , การแสดง และ การทำเหมืองข้อมูล• คำถาม ตอบ - ในทางตรงกันข้ามกับการสืบค้น ซึ่งมีรายชื่อของ เอกสารที่เกี่ยวข้องที่อาจเกิดขึ้นในการตอบสนองต่อ แบบสอบถาม ตอบ ของผู้ใช้
Natural Language Processing (NLP) • Summarization -ระดับที่สูงขึ้น ของ NLP โดยเฉพาะอย่างยิ่งใน ระดับวาทกรรมสามารถช่วยให้การดำเนินงานที่ลดลงในข้อความที่มี ขนาดใหญ่สั้นยังการแสดง การเล่าเรื่อง ย่อ ของเอกสารต้นฉบับ• เครื่อง แปล - บางทีที่เก่าแก่ที่สุดของทุกการใช้งาน NLP , ระดับ ต่างๆ ของNLP ได้ถูกนำมาใช้ในระบบตั้งแต่วิธีการ คำที่ใช้ในการใช้งาน ที่มีระดับที่สูงขึ้นของการวิเคราะห์• ระบบ สนทนา - บางทีโปรแกรมอยู่ทั่วไปทุกหนทุกแห่งของอนาคต ในระบบจินตนาการ โดยผู้ให้บริการ การใช้งาน ระบบการสนทนา ที่ มักจะมุ่งเน้นไปที่การใช้งานที่กำหนดไว้ (เช่น เสียง หรือ ตู้เย็นที่บ้าน
Natural Language Processing (NLP) ใช้ระบบเสียง ) ปัจจุบันใช้ระดับออกเสียงและ คำศัพท์ของภาษา มัน เป็นการใช้ประโยชน์จากทุกระดับของการประมวลผลภาษาที่มีศักยภาพ สำหรับระบบการสนทนา อย่างแท้จริง
Natural Language Processing (NLP) สรุป ในขณะที่ NLP เป็นสิ่งที่ค่อนข้างใหม่ของการวิจัยและการ ประยุกต์ใช้เมื่อเทียบกับวิธีของระบบเทคโนโลยีสารสนเทศอื่นๆ การแสดงให้เห็นว่า NLP ประสบความสำเร็จในวันนี้คือการเทคโนโลยีใน การเข้าถึงข้อมูล และเป็นสิ่งสำคัญของการวิจัยและพัฒนาระบบ สารสนเทศนี้ต่อไปในอนาคต ขอขอบคุณข้อมูลคุณ Xiaoyong Liu นักศึกษาปริญญาเอก และผู้ช่วยวิจัยในศูนย์การประมวลผล ภาษาธรรมชาติ ของ Syracuse University “ หากผิดพลาดประการใดขอ อภัยมา ณ โอกาสนี้ คณะผู้จัดทำ ”
Natural Language Processing (NLP) Thank You