190 likes | 322 Views
VN-KIM SEARCH TIẾNG ANH VỚI TRUY VẤN CÓ LIÊN TỪ LUẬN LÝ, TÍNH TỪ & LƯỢNG TỪ. GVHD : - PGS.TS Cao Hoàng Trụ SV : - Nguyễn Trần Đăng Khoa (50601130) - Tạ Tất Tài (50602084). Nội Dung. Mục tiêu & Phạm vi & Kết quả. 2. Xây dựng CG & SeRQL. 3. Tổng kết. Nội Dung.
E N D
VN-KIM SEARCH TIẾNG ANH VỚI TRUY VẤN CÓ LIÊN TỪ LUẬN LÝ, TÍNH TỪ & LƯỢNG TỪ GVHD: - PGS.TS Cao Hoàng Trụ SV: - Nguyễn Trần Đăng Khoa (50601130) - Tạ Tất Tài (50602084)
Nội Dung • Mục tiêu & Phạm vi & Kết quả 2. Xây dựng CG & SeRQL 3. Tổng kết
Nội Dung • Mục tiêu - Phạm vi - Kết quả 2. Xây dựng CG & SeRQL 3. Tổng kết
1. Mục tiêu – Phạm vi – Kết qủa • VN-KIM Search: Truy vấn tiếng Anh Xây dựng CG, SeRQL Tìm kiếm & Gom cụm tài liệu CG & SeRQL Tài liệu thỏa truy vấn Tìm kiếm thực thể CG: Đồ thị ý niệm SeRQL: Sesame RDF Query Language Thực thể thỏa yêu cầu
1. Mục tiêu – Phạm vi – Kết quả • Mục tiêu - phạm vi: • Khả năng hiện tại: Thực thể, từ quan hệ • Khả năng mở rộng: • Liên từ luận lý: Who was biographer and Samuel Johnsons's friend? • Tính từ: What are the old university in the US? What famous model was married to Billy Joel? What is the highest dam in the U.S.? • Lượng từ: How many films did Ingmar Bergman make? Truy vấn tiếng Anh Xây dựng CG, SeRQL CG & SeRQL ●●●
1. Mục tiêu – Phạm vi – Kết quả • Kết quả: • Xử lý thành công các dạng câu đã nêu • Tỉ lệ CG chính xác sinh ra trên tập TREC 2002: 85.91 % • Cải tiến và mở rộng: • Tách câu nguyên tử • So sánh hơn của tính từ định lượng • Xây dựng SeRQL từ CG (chính xác 100 % cho các CG chính xác)
Nội Dung • Mục tiêu & Phạm vi 2. Xây dựng CG & SeRQL 3. Tổng kết
2. Xây dựng CG & SeRQL (1) • Chú giải NE, UE, RW, CONJ, ADJ • KIM Ontology: • Open domain • >250 lớp thực thể • >40 000 thực thể • >100 quan hệ Truy vấn tiếng Anh KIM Ontology & ANNIE (Information Extraction system) Chú giải NE, UE, RW Chú giải CONJ, ADJ • ANNIE: • file.lst: liệt kê các từ thuộc 1 nhóm muốn nhận diện. VD: "and", "or", "not" (CONJ.lst) Buffer các item ANNIE
2. Xây dựng CG & SeRQL (2) • Tổng quát quá trình tiếp theo Tách câu AQ từ câu có liên từ luận lý Cuối danh sách Xây dựng CG mở rộng & SeRQL chung Buffer AQ AQ: atomic query Buffer AQ: chứa các item được nhận diện của 1 AQ Xây dựng CG và SeRQL cho mỗi AQ
2. Xây dựng CG & SeRQL (3) • Tách câu AQ từ câu có liên từ
2. Xây dựng CG & SeRQL (4) • Xây dựng CG và SeRQL cho mỗi AQ Xác định lớp của thực thể Xác định quan hệ giữa QLA & thực thể Gom thực thể Xác định quan hệ giữa QTA & thực thể Xác định quan hệ ẩn Xây dựng SeRQL Xác định quan hệ giữa các thực thể Xóa bỏ các quan hệ không thích hợp với ngữ cảnh QLA: quanlitative adjective QTA: quantitative adjective
2. Xây dựng CG & SeRQL (5) • Xây dựng CG và SeRQL cho mỗi AQ • Xác định quan hệ giữa tính từ & thực thể:
2. Xây dựng CG & SeRQL (6) • Xây dựng CG và SeRQL cho mỗi AQ • Xác định quan hệ giữa QTA & thực thể:khi có so sánh hơn
2. Xây dựng CG & SeRQL (7) • Biến đổi thành CG & SeRQL: • Xây dựng CG và SeRQL cho mỗi AQ • Xây dựng SeRQL
2. Xây dựng CG & SeRQL (8) • Biến đổi thành CG & SeRQL: • Xây dựng CG mở rộng và SeRQL chung
Nội Dung • Mục tiêu – Phạm vi – Kết quả 2. Xây dựng CG & SeRQL 3. Tổng kết
3. Tổng kết • Áp dụng được kết quả nghiên cứu [] cho VN-KIM Search • Có những cải tiến, bổ sung của riêng nhóm • Bảng thống kê hiệu suất