280 likes | 388 Views
Un sistema de diàleg per accedir a la web en diferents llengües Marta Gatius Centre de Recerca TALP, UPC. INDEX. · Els grans reptes que presenta la web · Comunicació en llenguatge natural · Integració d’ontologies i tecnologies del llenguatge · Conclusions.
E N D
Un sistema de diàleg per accedir a la web en diferents llengües Marta Gatius Centre de Recerca TALP, UPC
INDEX ·Els grans reptes que presenta la web ·Comunicació en llenguatge natural ·Integració d’ontologies i tecnologies del llenguatge · Conclusions
ELS PROBLEMES PRINCIPALS QUE PRESENTA LA WEB ·Documents heterogenis Llenguatges diferents Formats diferents Diferents representacions semàntiques Diferents formes d’accés ·Dissenyat per a ser utilitzat per persones · Canvis freqüents
·L’usuari necessita ser guiat - per fer la consulta - per entendre la informació resultant · Assistents virtuals · Sistemes adaptatius
COMUNICACIÓ EN LLENGUAGENATURAL ·Avantatges - Fàcil i amistós - Es poden fer consultes complexes - Es poden fer referències a altres entitas ·Inconvenients - Ambigüitat - Poca eficiència - Elevat cost ·Apropiat per usuaris ocasionals i per expressar operacions complexes en dominis restringits
COMUNICACIÓ PER VEU ·Avantatges - Fàcil i amistós - No és necessari utilitzar les mans - Petits aparells, aplicacions mòbils, discapacitats ·Inconvenients - Problemes de reconeixement - Ambigüitat - Poca eficiència - Elevat cost ·Apropiat per expressar operacions simples en dominis restringits
COMUNICACIÓ EN LLENGUAGENATURAL ·Comunicació textual - Formularis - Menús - Pregunta/Resposta - Diàleg ·Domini restringit/obert ·Multilingualitat ·Multimodalitat
CONEIXEMENT NECESSARI PER PROCESSAR LA INTERVENCIÓ DE L’USUARI • ·Morfologia: Components de les paraules amb significat • portes és plural • ·Sintaxi: Relacions estructurals entre paraules • Una frase és una pregunta o una declaració • ·Semàntica: Significat de les paraules i com es combinen obre la porta • ·Pragmàtica: Com s’utilitza el llenguatge segons l’objectiu • per ser educat • ·Discurs: Com s’estructuren frases simples • - Obre la porta • - Ho sento, però no puc
GIWEB:Generador de interfícies per accedir a la web Interfície Usuari Gramàtica Lèxic Parser Ontologies Controlador de diàleg Wrapper1 Wrapper2 Wrappern Internet Document1 Document1 Documentn
RECURSOS DE DOMINI RESTRINGIT VERSUS RECURSOS GENERALS • · La majoria de sistemes de comunicació utilitzen • recursos de domini restringit • ·Són més eficients • · S’han de desenvolupar per cada domini/aplicació • - Difícils de reutilitzar • - Costosos de desenvolupar
EXPANSIÓ DE LA COBERTURA LINGÜÍSTICA Eficiència Cobertura Reusabilitat Templetes adaptades a tasques Bona Pobre Difícil Recursos general daptables a diferents aplicacions Bona Rica Fàcil Pobre Rica Fàcil Recursos generals
ORGANIZACIÓ CORRECTE DEL CONEIXEMENT IMPLICAT EN LA COMUNICACIÓ ·Millora l’obtenció dels recursos més apropiats per dominis específics (o serveis) ·Facilita l’ús de més de una llengua · Facilita la reusabilitat
ELS DIFERENTS TIPUS DE CONEIXEMENT IMPLICATS EN LA COMUNICACIÓ ·Coneixement conceptual: Ontologies ·Coneixementde domini ·Coneixementdediàleg · Regles de diàleg controlant la iteracció ·Coneixementlingüístic · Estructures lingüístiques expressant les tasques de comunicació
ONTOLOGIES PER A LA INTEGRACIÓ DE LA INFORMACIÓ DE DIFFERENTS PÀGINES WEB • ·Proporcionen un marc general per representar els conceptes de diferents serveis i pàgines de la web • ·Xarxa semàntica (Semantic web) • · Llenguatges estàndard per la representació de coneixement i per raonar
ONTOLOGIES PER DISSENYAR DIÀLEGS ·La informació que l’usuari necessita de l’aplicació · La informació que l’aplicaciónecessita del’usuari · Conceptes descrits per un conjunt d’atributs· La comunicació consisteix en preguntar/donar a l’usuari els valors dels atributs dels conceptes Diàlegs dirigits per l’aplicació
ONTOLOGIES PER DISSENYAR DIÀLEGS Aplicació Recollida d’objectes Informació Recollida Objecte: Adreça: Telèfon: Cancel.lació
OBTENCIÓ DELS MISSATGES DEL SISTEMA I DE LES GRAMÀTIQUES ·Es generen a partir dels atributs dels conceptes a l’ontologia · Els atributs descrivint conceptes es classifiquen segons una taxonomia sintàctico-semàntica d’atributs
LA TAXONOMIA SINTÀCTICO-SEMÀNTICA D’ATRIBUTS • ·Generalització de les relacions entre • · Coneixement del domini a les ontologies i distincions lingüístiques • · Cada classe es relaciona amb les estructures lingüístiques que expressen les operacions de consultar i omplir el valor dels atributs que pertanyen a la classe
EL PROJECTEHOPS ·HOPS és un projecte de tres anys centrat en el desenvolupament d’una plataforma pública de veu i text que permeti l’accés dels ciutadans europeus a les seves administracions públiques més properes ·HOPS:Enabling an Intelligent Natural Language Based Hub for the Deployment of Advanced Semantically Enriched Multi-channel Mass-scale Online Public Services
EL PROJECTE HOPS Tecnologies: Processament del llenguatge natural,portalsVoice XML, XarxaSemàntica Llenguatges: Anglès, Castellà, Català i Italià
VOICEXML: UN ESTÀNDARD PER DIÀLEGS DE VEU · Desenvolupament de sistemes de diàleg de veu fàcil i ràpid · Abstracció dels detalls de baix nivell · Accés fàcil a dades i serveis d’internet
AVANTATGES DE VOICEXML • · Multilingualitat • · Utilització de més d’un llenguatge en un diàleg • · Català i Castellà en una mateixa intervenció • · Per donar adreces: • Plaza “Francesc Macià”
AVANTATGES DEVOICEXML • · Reutilització • · Entre serveis • · Reutilització de subdiàlegs • Noms, Adreces, Telèfons • · Entre llenguatges • Es fàcil adaptar el diàleg d’una llengua a una altre
CONCLUSIONS • ·Una organitzacióseparada i reutilitzable dels diferents tipus de coneixement implicat en la comunicació millora • · El procés de desenvolupament del sistema • · La funcionalitat del sistema resultant
CONCLUSIONS ·La utilització d’ontologies facilita la obtenció dels recursos lingüístics més apropiats per un domini específic (o servei) en diferents llenguatges · Els lexicons i les gramàtiques per expressar els conceptes de domini en diferents llenguatges
CONCLUSIONS ·La utilització d’ontologiesproporciona un marc unificador · per processar text i/o veu en llenguatges diferents · per integrar informació de diferents documents web