1 / 45

B ú squeda por contenido

Recuperaci ó n Basada en Contenido M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción http://www.inf.udec.cl/~andrea. B ú squeda por contenido.

sona
Download Presentation

B ú squeda por contenido

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Recuperación Basada en ContenidoM.Andrea Rodríguez TastetsDIIC - Universidad de Concepciónhttp://www.inf.udec.cl/~andrea

  2. Búsqueda por contenido • Es una metodología de recuperación de información basada en el contenido con respecto al dominio de aplicación del proceso de recuperación. Usa un análisis y procesamiento digital para general descriptores (meta-data) a partir de los datos. Los méritos principales de sistemas basados en el contenido son: • Soporta el procesamiento de consultas visuales (o audio) • La consulta es intuitiva y amistosa al usuario • La generación de los descriptores es automática, siendo objetiva y consistente.

  3. Media • Definición: Media se refiera a todo medio de comunicación. Multimedia entonces, se refiere a la combinación de medios de comunicación, tales como imágenes, video, gráficos, señales de audio, texto, símbolos, etc. Desde una perspectiva de computación, información multimedial puede ser representada usando estructuras de datos o clases de objetos.

  4. CBR • CBR puede ser clasificada en tres categorias, correspondiendo a auto-asociación, hetero-asociación, y combinación de las dos primeras. Estos tres tipos de recuperación son: búsqueda dentro de una clase de objetos, navegación entre clases de objetos, correspondencia parcial de objetos complejos.

  5. CBR versus Clasificación • Un área relacionada a CBR es el reconocimiento de patrones, clasificación de patrones ya que ambas disciplinas usan descriptores y medidas de similitud. Clasificación de patrones particiona el espacio de descriptores en subespacios, posiblemente disjuntos para clases de patrones distintos. En CBR, por otro lado, lo central en el objeto. La similaridad tiene un rol principal y no cumple sólo la función de entrenamiento que apoya la clasificación, si no que es objetivo final.

  6. CBR versus Clasificación

  7. Recuperación de Imágenes • Búsqueda por histogramas: La imagen es caracterizada por el histograma de colores. El histograma entrega la relativa cantidad de color sin considerar la localización, forma y textura de los objetos.

  8. Recuperación de Imágenes • Búsqueda por color layout: Las imágenes son divididas en bloques y el color promedio a cada bloque es almacenado. Cada búsqueda basada en color layout es sensitiva a rotación y cambio de tamaño porque las imágenes son caracterizadas por propiedades locales. La similitud entre imágenes ese basa en comparar la signatura de ellas. Textura y forma no son consideradas y está limitada a la representación de imágenes en términos de niveles de intensidad.

  9. Recuperación de Imágenes • Búsqueda basada en regiones: Los objetos en las imágenes son obtenidos a partir de un proceso de segmentación. A cada objeto se le pueden agregar color, textura, localización o una combinación de ellos.

  10. ¿Existe en la Base de Datos? Base de Datos ESPACIAL Búsqueda de Configuraciones

  11. Consulta

  12. Consulta Una consulta Q es un conjunto de n variables con un conjunto de m ≤ n(n-1)/2 restricciones.

  13. Base de Datos de Imágenes

  14. Base de Datos Espacial

  15. Satisfacción de Restricciones • Dado un conjunto de variables {x1…xn} • Un dominio discreto y finito por cada variable {D1…Dm} • Un conjunto {Rk} de restricciones definidas sobre un dominio de variables RjDi1x…Dij • Encontrar una asignación de variables tal que las restricciones sean satisfechas

  16. Restricciones: Topologías

  17. Restricciones: Métrica

  18. Restricciones: Métrica

  19. Restricciones: Métrica

  20. Restricciones: Métrica

  21. Restricciones: Orientación

  22. Problema: Comparar

  23. Descripción Contenido

  24. Caracterización MBR

  25. Caracterización de MBRs Real  Fárea (MBR) Real  Fdiagonal (MBR)

  26. Caracterización de pares de MBRs MBR  Funión (MBR, MBR) MBR  Fintersección (MBR, MBR)

  27. Caracterización de pares de MBRs Real  F d_exterior (MBR, MBR) Real  F d_interior (MBR, MBR)

  28. Indice de Contenido

  29. Indice de Contenido

  30. Indexación • Evitar la revisión exhaustiva de una base de datos. • Dado n objetos en la base de datos y m restricciones en la consulta, la revisión exhaustiva implica m permutaciones de n objetos O(nm), con n >>>> m.

  31. Indexación • Indexación espacial: • Indexación sobre objetos • Indexación sobre relaciones

  32. Condición de Búsqueda • Una restricción entre variables de una consulta R(vi,vj) será satisfecha por la restricción entre instancias en la base de datos R(ui,uj) si:

  33. Condición de Búsqueda

  34. Preprocesamiento • Eliminar restricciones • Ordenar restricciones

  35. Eliminación de Restricciones • Relaciones entre objetos cercanos • Satisfacción de consistencia basada en la composición de relaciones

  36. Composición R ; S(oi, ok) |  ojtal que (oi, oj)R y (oj, ok) S A dentro B; B dentro CA dentro C

  37. Composición

  38. Composición

  39. Composición

  40. Grafo de Consistencia

  41. Grafo de Consistencia Una relación es derivable si es el único resultado de la intersección de composiciones usando todos los caminos en el grafo de configuración

  42. Eliminación de restricciones • El grafo resultante es único • Ej: Existen ~2.245.000 consultas consistentes con 5 objetos, lo que significa 25 relaciones posibles. De ellas, se pueden derivar 16 relaciones en promedio

  43. Algoritmos de Búsqueda • Forward-Checking Strategy • Similitud:

  44. Algoritmos de Búsqueda • Determinísticos: • Basado en permutaciones • Algoritmos heurísticos: • Hill Climbing • Genéticos

More Related