1 / 24

FONAMENTS DE PROCESSAMENT DEL LLENGUATGE NATURAL 13305 – Lingüística - UPF

FONAMENTS DE PROCESSAMENT DEL LLENGUATGE NATURAL 13305 – Lingüística - UPF. nuria.bel@upf.edu Classe 7. El programa. 4. Les oracions · Sintaxi: L’estructura de l’oració x Categories, constituents i funcions. x Gramàtiques, regles lliures de context i arbres.

miller
Download Presentation

FONAMENTS DE PROCESSAMENT DEL LLENGUATGE NATURAL 13305 – Lingüística - UPF

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. FONAMENTS DE PROCESSAMENT DEL LLENGUATGE NATURAL13305 – Lingüística - UPF nuria.bel@upf.edu Classe 7

  2. El programa 4.Les oracions ·Sintaxi: L’estructura de l’oració xCategories, constituents i funcions. xGramàtiques, regles lliures de context i arbres. xAnalitzadors: algoritmes i tècniques de cerca. ·Processament d’informació sintàctica. xConcordança. Coordinació. Subcategorització. xTrets i unificació. Formalismes d’Unificació. xGramàtiques lliures de context augmentades amb unificació.

  3. Informació sintàctica : indica les relacions entre les paraules • concordança • el prestatge de fusta trencat • la nena serveix el dinar freda • subcategorització • A Madrid la nena va • La nena depèn sense cap mena de dubte dels seus pares

  4. Concordança • Relació que hi ha entre n paraules per la qual co-varien les seves propietats morfològiques: gènere, nombre, cas, etc. Depèn de la llengua. • Las categories i les regles gramaticals han de mirar-se com objectes que tenen propietats associades, i hem d’especificar-les i poder fer operacions amb elles, per exemple: ‘co-varien’

  5. Tractament de la concordança? O SN SV SN  Art N Art  la Art  el N  nena SNfs  Artfs Nfs SNms  Artms Nms SNfp  Artfp Nfp SNmp  Artmp Nmp Artfs  la Artms  el Artfp  las Artmp  los Nfs  nena

  6. Informació en forma de trets (features) • Necessitem poder afegir informació a les regles d’estructura de frase: SN Art N [gen=X] [gen=X] [gen=X] • Les categories i les regles són objectes que tenen propietats associades.

  7. propietats i operacions SNfs  Artfs Nfs SNms  Artms Nms SNfp  Artfp Nfp SNmp  Artmp Nmp • Test d’igualtat llegit com una restricció: Solament es podrà aplicar la regla SN si el valor de cada variable és el mateix SN Art N gen=X gen=X gen=X num=Y num=Y num=Y

  8. Formalisme basat en estructures de trets • Hem de fer que el llenguatge en el que escrivim les regles (el formalisme) incorpori aquesta manera de donar informació i fer operacions amb elles • La manera més fàcil de representar-ho: estructures de trets (“feature structure”). • L’operació bàsica per treballar amb estructures de trets és la unificació

  9. Estructures de trets • Els trets són associacions entre parells atribut valor, i poden tenir diferents notacions [atribut valor], <atribut> = valor, atribut===valor • Els atributs són un conjunt finit de símbols atòmics no analitzables (gen, num, cat). • Els valors poden ser símbols atòmics o estructures complexes • El conjunt de trets, que són propietats d’un objecte, es representa com una Matriu d’atributs/valors (AVM)

  10. num sing gen fem cat n num sing gen fem cat n num sing conc gen fem num sing Estructures de trets Exemples de Matrius atribut – valor = Nfs estructures com a valors

  11. cat n num sing conc gen fem conc cat num gen n sing fem Estructures de TretsNotació de graf dirigit (DAG)

  12. conc cat num gen n sing fem Estructures de TretsCamí (path) • Un camí de trets (“feature path”) és la llista de trets que s’han de recórrer en una estructura per arribar a un valor particular Hi ha diferents notacions: <conc gen> = fem conc:gen===fem

  13. Unificació l’operació bàsica • Intuïtivament és com la unió de dos conjunts però opera sobre les llistes de trets, les Estructures de Trets • I inclou la noció de ‘compatibilitat’ de la informació. [num sing] ⊔ [num sing] = [num sing] [num sing] ⊔ [num plu] = Ø

  14. gen fem num sing gen fem num sing gen fem num sing Unificació (2) [num sing] ⊔ [gen fem] = [num sing] ⊔ =

  15. ⊔ [conc[gen fem]] = Ø conc num sing gen mas ⊔ = [gen fem] = conc conc num sing gen mas num sing gen mas gen fem Unificació (3) • d’estructures complexes

  16. Unificació (4) és una única operació per combinar informació i expressar: • Restriccions d’igualtat N:conc===Det:conc • Comparació de models/patrons (pattern-matching) N:cat===n • Traspassar informació en forma de trets SN:conc === N:conc

  17. Unificació (5) • Traspassem informació perquè podem expressar “Compartir estructura (‘Structure Sharing’)” • No estem solament passant informació. Estem dient que per trobar el valor segueixi un camí. SN:conc === N:conc • I que qualsevol canvi, en qualsevol dels sentits, representarà un canvi per a tots els nusos que apuntin

  18. conc cat num gen n sing fem Unificació (6) Compartir estructura: SN:con===N:conc cat conc sn

  19. Unificació (7) • Com les estructures de trets permeten: • Representar informació parcial sobre objectes • Expressar restriccions, condicions que els objectes han de complir respecte de la informació que hi tenen associada • Quan unifiquem 2 estructures en creem una d’igual o que conté informació més específica. • Diem que la menys específica subsumeix una d’igual o més específica.

  20. cat n gen fem Unificació (8) • Subsumpció es pot llegir com tenir restriccions per a la comparació de models: • [gen fem] • [gen fem] ⊔ [cat n] =

  21. num sing ⊑ num sing gen fem num sing gen fem pers 3 Unificació (9) • La relació de subsunció ens permet fer un ordre parcial de les Estructures de Trets ⊑ • Totes les estructures de trets estan subsumides per [], semilattice, i permet que la relació d’unificació sigui monotònica: independent de l’ordre d’aplicació

  22. Resum Gramàtiques d’unificació: • Gramàtica basada en restriccions: les regles s’apliquen si es compleixen certes condicions • Estructures de trets: associacions entre parells atribut=valor • Unificació és l’operació que controla que les condicions es compleixen

  23. Formalisme en PATR-like (1) regla(r3,SN ---> [D,N]):- SN:cat===sn, D:cat===d, N:cat===n, N:num===D:num. I tinguin el mateix valor per a l’atribut ‘num’

  24. Formalisme en PATR-like (2) la informació??? al lèxic: mot(M,noia):- M:cat===n, M:conc:gen===fem, M:conc:num===sing regla(r3,SN ---> [D,N]):- SN:cat===sn, SN:conc===N:conc, D:cat===d, N:cat===n, N:conc===D:conc. I tinguin el mateix valor per a ‘conc’

More Related