240 likes | 372 Views
FONAMENTS DE PROCESSAMENT DEL LLENGUATGE NATURAL 13305 – Lingüística - UPF. nuria.bel@upf.edu Classe 7. El programa. 4. Les oracions · Sintaxi: L’estructura de l’oració x Categories, constituents i funcions. x Gramàtiques, regles lliures de context i arbres.
E N D
FONAMENTS DE PROCESSAMENT DEL LLENGUATGE NATURAL13305 – Lingüística - UPF nuria.bel@upf.edu Classe 7
El programa 4.Les oracions ·Sintaxi: L’estructura de l’oració xCategories, constituents i funcions. xGramàtiques, regles lliures de context i arbres. xAnalitzadors: algoritmes i tècniques de cerca. ·Processament d’informació sintàctica. xConcordança. Coordinació. Subcategorització. xTrets i unificació. Formalismes d’Unificació. xGramàtiques lliures de context augmentades amb unificació.
Informació sintàctica : indica les relacions entre les paraules • concordança • el prestatge de fusta trencat • la nena serveix el dinar freda • subcategorització • A Madrid la nena va • La nena depèn sense cap mena de dubte dels seus pares
Concordança • Relació que hi ha entre n paraules per la qual co-varien les seves propietats morfològiques: gènere, nombre, cas, etc. Depèn de la llengua. • Las categories i les regles gramaticals han de mirar-se com objectes que tenen propietats associades, i hem d’especificar-les i poder fer operacions amb elles, per exemple: ‘co-varien’
Tractament de la concordança? O SN SV SN Art N Art la Art el N nena SNfs Artfs Nfs SNms Artms Nms SNfp Artfp Nfp SNmp Artmp Nmp Artfs la Artms el Artfp las Artmp los Nfs nena
Informació en forma de trets (features) • Necessitem poder afegir informació a les regles d’estructura de frase: SN Art N [gen=X] [gen=X] [gen=X] • Les categories i les regles són objectes que tenen propietats associades.
propietats i operacions SNfs Artfs Nfs SNms Artms Nms SNfp Artfp Nfp SNmp Artmp Nmp • Test d’igualtat llegit com una restricció: Solament es podrà aplicar la regla SN si el valor de cada variable és el mateix SN Art N gen=X gen=X gen=X num=Y num=Y num=Y
Formalisme basat en estructures de trets • Hem de fer que el llenguatge en el que escrivim les regles (el formalisme) incorpori aquesta manera de donar informació i fer operacions amb elles • La manera més fàcil de representar-ho: estructures de trets (“feature structure”). • L’operació bàsica per treballar amb estructures de trets és la unificació
Estructures de trets • Els trets són associacions entre parells atribut valor, i poden tenir diferents notacions [atribut valor], <atribut> = valor, atribut===valor • Els atributs són un conjunt finit de símbols atòmics no analitzables (gen, num, cat). • Els valors poden ser símbols atòmics o estructures complexes • El conjunt de trets, que són propietats d’un objecte, es representa com una Matriu d’atributs/valors (AVM)
num sing gen fem cat n num sing gen fem cat n num sing conc gen fem num sing Estructures de trets Exemples de Matrius atribut – valor = Nfs estructures com a valors
cat n num sing conc gen fem conc cat num gen n sing fem Estructures de TretsNotació de graf dirigit (DAG)
conc cat num gen n sing fem Estructures de TretsCamí (path) • Un camí de trets (“feature path”) és la llista de trets que s’han de recórrer en una estructura per arribar a un valor particular Hi ha diferents notacions: <conc gen> = fem conc:gen===fem
Unificació l’operació bàsica • Intuïtivament és com la unió de dos conjunts però opera sobre les llistes de trets, les Estructures de Trets • I inclou la noció de ‘compatibilitat’ de la informació. [num sing] ⊔ [num sing] = [num sing] [num sing] ⊔ [num plu] = Ø
gen fem num sing gen fem num sing gen fem num sing Unificació (2) [num sing] ⊔ [gen fem] = [num sing] ⊔ =
⊔ [conc[gen fem]] = Ø conc num sing gen mas ⊔ = [gen fem] = conc conc num sing gen mas num sing gen mas gen fem Unificació (3) • d’estructures complexes
Unificació (4) és una única operació per combinar informació i expressar: • Restriccions d’igualtat N:conc===Det:conc • Comparació de models/patrons (pattern-matching) N:cat===n • Traspassar informació en forma de trets SN:conc === N:conc
Unificació (5) • Traspassem informació perquè podem expressar “Compartir estructura (‘Structure Sharing’)” • No estem solament passant informació. Estem dient que per trobar el valor segueixi un camí. SN:conc === N:conc • I que qualsevol canvi, en qualsevol dels sentits, representarà un canvi per a tots els nusos que apuntin
conc cat num gen n sing fem Unificació (6) Compartir estructura: SN:con===N:conc cat conc sn
Unificació (7) • Com les estructures de trets permeten: • Representar informació parcial sobre objectes • Expressar restriccions, condicions que els objectes han de complir respecte de la informació que hi tenen associada • Quan unifiquem 2 estructures en creem una d’igual o que conté informació més específica. • Diem que la menys específica subsumeix una d’igual o més específica.
cat n gen fem Unificació (8) • Subsumpció es pot llegir com tenir restriccions per a la comparació de models: • [gen fem] • [gen fem] ⊔ [cat n] =
⊑ num sing ⊑ num sing gen fem num sing gen fem pers 3 Unificació (9) • La relació de subsunció ens permet fer un ordre parcial de les Estructures de Trets ⊑ • Totes les estructures de trets estan subsumides per [], semilattice, i permet que la relació d’unificació sigui monotònica: independent de l’ordre d’aplicació
Resum Gramàtiques d’unificació: • Gramàtica basada en restriccions: les regles s’apliquen si es compleixen certes condicions • Estructures de trets: associacions entre parells atribut=valor • Unificació és l’operació que controla que les condicions es compleixen
Formalisme en PATR-like (1) regla(r3,SN ---> [D,N]):- SN:cat===sn, D:cat===d, N:cat===n, N:num===D:num. I tinguin el mateix valor per a l’atribut ‘num’
Formalisme en PATR-like (2) la informació??? al lèxic: mot(M,noia):- M:cat===n, M:conc:gen===fem, M:conc:num===sing regla(r3,SN ---> [D,N]):- SN:cat===sn, SN:conc===N:conc, D:cat===d, N:cat===n, N:conc===D:conc. I tinguin el mateix valor per a ‘conc’