120 likes | 227 Views
Esercitazione. Fabio Massimo Zanzotto. Scopo. Si vuole costruire un sistema per riempire databases a partire da documenti. In particolare, per ogni documento bisogna indicare ogni menzione di persone, date e i luoghi. Formato di uscita. Ingresso: Testo
E N D
Esercitazione Fabio Massimo Zanzotto
Scopo • Si vuole costruire un sistema per riempire databases a partire da documenti. • In particolare, per ogni documento bisogna indicare ogni menzione di persone, date e i luoghi.
Formato di uscita • Ingresso: Testo • Uscita: Testo indicato con Tag XML i vari elementi da trovare • Persona • Luogo • Data
Esempio - INGRESSO Gli anni ottanta vedono un Clapton modaiolo e alle prese più con il gossip ed il jet set che non con il blues. Nel 1988 partecipa con i Dire Straits ad un concerto in onore di Nelson Mandela. È una tappa del tour dello stesso anno che coinvolge gli amici Mark Knopfler ed Elton John. La super session di amici avrà il suo culmine nel concerto benefico di Knebworth del 30 giugno 1990.
Esempio - Uscita <D>Gli anni ottanta</D>vedono un <PER>Clapton</PER>modaiolo e alle prese più con il gossip ed il jet set che non con il blues. Nel <D>1988</D>partecipa con i <PER>Dire Straits</PER>ad un concerto in onore di <PER>Nelson Mandela</PER>. È una tappa del tour dello stesso anno che coinvolge gli amici <PER>Mark Knopfler</PER> ed <PER>Elton John<PER>. La super session di amici avrà il suo culmine nel concerto benefico di <L>Knebworth</L>del <D>30 giugno 1990</D>. 30/6/1990
Metodi di valutazione • Accuratezza • Precision • Recall • F-measure
Rappresentazione Interna • Nella valutazione la rappresentazione interna è: • Lista di tokens o nomi in cui ogni elemento o è un tokenovvero una stringa oppure un nome incapsulato in una funzione: • Tipo: per(["Clapton"]), d(["gli", "anni", "ottanta"])
Problemi della valutazione • Riconoscimento delle parole che formano un nome • Riconoscimento della categoria del nome
Come saranno valutati i compiti Lettura del documento XML testoDaXML(TestoInXML,TestoInFormatoInterno) Riconoscimento delle classi accuratezza(ORACOLO,SISTEMA,RISULTATO) precisione(ORACOLO,SISTEMA,RISULTATO) recall(ORACOLO,SISTEMA,RISULTATO) fmeasure(ORACOLO,SISTEMA,RISULTATO)
Riconoscimento delle limiti delle sottofrasi interessanti accuratezza(ORACOLO,SISTEMA,RISULTATO) precisione(ORACOLO,SISTEMA,RISULTATO) recall(ORACOLO,SISTEMA,RISULTATO) fmeasure(ORACOLO,SISTEMA,RISULTATO)
testoDaXML(XML_T,T):- daCaratteriAToken(XML_T,T_T), daTokenATestoInterno(T_T,T). daCaratteriAToken([],[]). daCaratteriAToken(LC,[T|REST]):- tag(LC,TAG,REST_LC),!, daCaratteriAToken(REST_LC,REST). daCaratteriAToken(LC,[T|REST]):- token(LC,TAG,REST_LC),!, daCaratteriAToken(REST_LC,REST).
tag_interno([‘>’|REST],[],REST):-! • tag_interno([A|REST],[A|R1],R2):- • tag_interno(REST,R1,R2). • tag([‘<’|REST],tag(RT),REST1):- !, • tag_interno(REST,RT,REST1).