1 / 30

Modelos

Modelos Alternativos (1) M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción http://www.inf.udec.cl/~andrea. Algebraic. Set Theoretic. Generalized Vector Lat. Semantic Index Neural Networks. Structured Models. Fuzzy Extended Boolean. Non-Overlapping Lists Proximal Nodes.

dyan
Download Presentation

Modelos

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Modelos Alternativos (1)M.Andrea Rodríguez TastetsDIIC - Universidad de Concepciónhttp://www.inf.udec.cl/~andrea

  2. Algebraic Set Theoretic Generalized Vector Lat. Semantic Index Neural Networks Structured Models Fuzzy Extended Boolean Non-Overlapping Lists Proximal Nodes Classic Models Probabilistic boolean vector probabilistic Inference Network Belief Network Browsing Flat Structure Guided Hypertext Modelos U s e r T a s k Retrieval: Adhoc Filtering Browsing

  3. Ejemplo: Boolean q = k1 (k2 k3) Qdnf = (1,1,1) (1,1,0) (1,0,0)

  4. Ejemplo: Vector (1) q = ka (kb kc) Qdnf = (1,1,1) (1,1,0) (1,0,0)

  5. Ejemplo: Vector (2) q = k1 (k2 k3) Qdnf = (1,1,1) (1,1,0) (1,0,0)

  6. Ejemplo: Vector (3) q = k1 (k2 k3) Qdnf = (1,1,1) (1,1,0) (1,0,0)

  7. Modelos Basados en Teoría de Conjuntos

  8. Modelos Basados en Teoría de Conjuntos • El modelo Booelan impone un criterio binario para determinar relevancia. • La pregunta es entonces cómo extender el modelo Boolean para acomodar la correspondencia parcial. • Dos estrategias son: • Modelo de conjuntos difusos (fuzzy set) • Modelo Boolean extendido

  9. Conjuntos Difusos • Consultas y documentos representados por conjuntos de téminos índices. • La vaguedad es modelada como un conjunto difuso: • cada término es asociado con un conjunto difuso • cada documento tiene un grado de membresía en este conjunto difuso • Esta interpretación da el fundamento para muchos modelos de IR basados en teoría difusa. • Aquí se presenta el modelo de Ogawa, Morita, and Kobayashi (1991)

  10. Conjuntos Difusos • La teoría difusa modela clases cuyos límites no están bien definidos. • La idea clave es introducir la noción de grado de membresía asociado con los elementos de un conjunto. • Este grado de membresía varía entre 0 y 1 y permite modelar la noción de membresía marginal. • Así, membresía es ahora una noción gradual, contraria a la noción binaria del modelo Boolean clásico.

  11. Teoría de Conjuntos Difusos • Definición • Un conjunto difuso A de U es caracterizado por una función de membresía (A,u) : U  [0,1], la cual asocia a cada elemento u de U un número (u) en el intervalo [0,1] • Definición • Sean A y B dos conjuntos difusos de U. También, sea ¬A el complemento A. Entonces, • (¬A,u) = 1 - (A,u) • (AB,u) = max((A,u), (B,u)) • (AB,u) = min((A,u), (B,u))

  12. Recuperación de Información Difusa • Conjuntos difusos son modelados basados en un tesaurus • Este tesaurus es construido como sigue: • Sea vec(c) una matriz de correlación term-term • Sea c(i,l) un factor normalizado de correlación para (ki,kl): c(i,l) = n(i,l) ni + nl - n(i,l) • ni: número de docs que contienen a ki • nl: número de docs que contienen a kl • n(i,l): número de docs que contienen a ki y kl • Nosotros ahora tenemos la noción de proximity entre términos índices.

  13. Recuperación de Información Difusa • El factor de correlación c(i,l) puede ser usado para definir membresía de conjuntos difusos para un documento dj como sigue: (i,j) = 1 -  (1 - c(i,l)) kl  dj • (i,j) : membresía de dj en el conjunto difuso asociado a ki • La expresión anterior computa una suma algebraica sobre todos los términos en el documento dj • Un documento dj pertenece al conjunto difuso para ki, si sus términos están asociados con ki

  14. Recuperación de Información Difusa • (i,j) = 1 - (1 - c(i,l)) kl  dj • (i,j) : membresía de documento dj en subconjunto difuso asociado con ki • Si documento dj contiene un término kl que está estrechamente relacionado con ki, entonces • c(i,l) ~ 1 • (i,j) ~ 1 • índice ki es un buen índice difuso para el documento doc

  15. Ka Kb cc2 cc3 cc1 Kc Ejemplo • q = ka  (kb  kc) • vec(qdnf) = (1,1,1) + (1,1,0) + (1,0,0) = vec(cc1) + vec(cc2) + vec(cc3) • (q,dj) = (cc1+cc2+cc3,j) = 1 - (1 - (a,j) (b,j) (c,j)) * (1 - (a,j) (b,j) (1-(c,j))) * (1 - (a,j) (1-(b,j)) (1-(c,j)))

  16. Ejemplo: q = k1 (k2 k3) Qdnf = (1,1,1) (1,1,0) (1,0,0)

  17. Ejemplo: q = k1 (k2 k3) Qdnf = (1,1,1) (1,1,0) (1,0,0) (q,dj) = (cc1+cc2+cc3,j)= 1 - (1 - (k1,j) (k2,j) (k3,j)) (1 - (k1,j) (k2,j) (1-(k3,j))) *(1 - (k1,j) (1-(k2,j)) (1-(k3,j)))

  18. Ejemplo: q = k1 (k2 k3) Qdnf = (1,1,1) (1,1,0) (1,0,0) (q,dj) = (cc1+cc2+cc3,j)= 1 - (1 - (k1,j) (k2,j) (k3,j)) (1 - (k1,j) (k2,j) (1-(k3,j))) *(1 - (k1,j) (1-(k2,j)) (1-(k3,j))) (k1,dj) = 1, (k2,dj) = 1-(1-c(k2,k1))*(1-c(k2,k3))=0.57, (k3,dj) =1

  19. Recuperación de Información Difusa • Modelos difusos IR han sido discutidos en la literatura de teoría difusa • Experimentos con datos de colecciones de pruebas no son disponibles • Entonces,no es posible compararlos.

  20. Modelo Boolean Extendido • Recuperación Booelan es simple y elegante • Pero, no tiene ranking • Cómo extender el modelo? • interpretar conjunciones y disyunciones en términos de distancias Euclidiana

  21. Modelo Boolean Extendido • Como con el modelo difuso, un ranking puede obtenerse al relajar la condición de membresía de conjunto. • Se extiende el modelo Boolean con nociones de correspondencia parcial (partial matching) y peso de términos • Combina características del modelo Vector con propiedades de algebra Boolean

  22. Idea • El modelo Boolean extendido (Salton, Fox, and Wu, 1983) está basado en una crítica de la premisa básica en algebra Boolean • Sea, • q = kx  ky • wxj = fxj * idf(x) asociado con [kx,dj] maxi(idf(i))

  23. 2 2 sim(qand,dj) = 1 - sqrt( (1-x) + (1-y) ) 2 qand = kx ky; wxj = x and wyj = y (1,1) ky dj+1 AND y = wyj dj (0,0) x = wxj kx

  24. 2 2 sim(qor,dj) = sqrt( x + y ) 2 qor = kx ky; wxj = x and wyj = y (1,1) ky dj+1 OR dj y = wyj (0,0) x = wxj kx

  25. p p p    p p p    Generalizando la idea • Podemos extender la idea anterior para un espacio Euclideano t-dimensional • Esto puede ser hecho usando p-norms ,la cual extiende la noción de distancia a p-distancia, donde 1  p  es un nuevo parámetro • Una consulta conjuntiva generalizada está dada por qor = k1 k2 . . . kt • Una consulta disyuntiva generaliza está dada por qand = k1 k2 . . . kt

  26. 1 1 p p Idea Generalizada p p p • sim(qor,dj) = (x1 + x2 + . . . + xm ) m p p p • sim(qand,dj) = 1 - ((1-x1) + (1-x2) + . . . + (1-xm) ) m

  27. 1 p Propiedades p p p • sim(qor,dj) = (x1 + x2 + . . . + xm ) m • Si p = 1 entonces (como Vector) • sim(qor,dj) = sim(qand,dj) = x1 + . . . + xm m • Si p =  entonces (como Fuzzy) • sim(qor,dj) = max (wxj) • sim(qand,dj) = min (wxj)

  28. 2    Propiedades • Variando p, podemos hacer que el modelo se comporte como un vector, como difuso o como un modelo intermedio. • Esto es bastante poderoso • (k1 k2) k3 • k1 y k2 pueden ser usados como en una recuperación vectorial mientras que la presencia de k3 es requerida.

  29. 2    1 1 p p Propiedades • q = (k1 k2) k3 • sim(q,dj) = ( (1 - ( (1-x1) + (1-x2) ) ) + x3 ) 2 2 p p p p

  30. Conclusiones • Modelo poderoso • Propiedades interesantes y útiles • Computación compleja • Operación distributiva no se cumple para computación de ranking: • q1 = (k1  k2)  k3 • q2 = (k1  k3)  (k2  k3) • sim(q1,dj)  sim(q2,dj)

More Related