290 likes | 428 Views
Etude de techniques d’intégration de base de données pour le Web. Plan. Représentation de données pour des requêtes de base de données sur le Web Modéliser et interroger le Web Intégration des données Différentes interfaces utilisées Construction de site Web.
E N D
Etude de techniques d’intégration de base de données pour le Web
Plan • Représentation de données pour des requêtes de base de données sur le Web • Modéliser et interroger le Web • Intégration des données • Différentes interfaces utilisées • Construction de site Web
Représentation de données pour des requêtes de base de données sur le Web. • Modèle de données basé sur un graphe • Modèle semi-structurés de données • Autres modèles
Modèle en graphe Page Web Etiquette 1 Etiquette 4 Page Web Page Web Etiquette 3 Etiquette 2 Page Web Page Web
Modèle semi-structuré • La schéma représentant la structure d'un site n'est pas un schéma fixe que l'on connaît à l'avance. • Caractéristiques des données : • le schéma n'est pas donné à l'avance et peut être caché dans les données. • le schéma relativement grand (la taille des données est importante) et peut changer fréquemment. • le schéma est descriptif, c'est à dire qu’il décrit l'état actuel des données, et ne tient pas compte des variations possibles.
Page Web Etiquette 1 Etiquette 4 Page Web Page Web Etiquette 3 Etiquette 2 Page Web Page Web Graphe orienté étiqueté
Autres modèles • Construction spécifique des données • Relation unaire pour identifier les pages • Relation binaire pour les liens entre les pages. • lien vers le même site (liens interne) • lien vers un autre site (lien externe)
Fonctionnalités supplémentaires • Modeler des structures de données imbriquées. • Prise en compte de contraintes (alignement, positionnement).
Modéliser et interroger le Web • Quelques langages de requêtes • Recherche documentaire • Langages de Première génération • Langages de deuxième génération
Recherche documentaire • Moteurs de recherche - Recherche par mot ou groupe de mots - Amélioration par intégration par l’exploitation de la structure des liens dans les requêtes.
Langages de Première Génération • WebSQL • W3QL • WQL
WebSQL • Navigation utilisée • d1 = > d2 • d1 - > d2, • Exemple de requête : SELECT d.url,e.url,a.label FROM Document d SUCH THAT "www. adresse" ->* d, Document e SUCH THAT d => e, Anchor a SUCH THAT a.base = d.url WHERE a.href = e.url
Langages de Première Génération • WebSQL • W3QL • WQL
Langages de deuxième génération • WebOQL : • StruQL • Interface interractive de requêtes
WebOQL (2) • Exemple de requete : select [ x.Url, x.Text ] from x in browse("root.html") via (^*[Text ~ "Next"]>)*
StruQL Exemple de requête : create RootPage() // Create a presentation for every publication x where Publications(x), xlv create PaperPresentation(x) link PaperPresentation(x) l v { // Create a page for every year where l = "year" create YearPage(v) link YearPage(v) "Year" -> v YearPage(v)"Paper"PaperPresentation(x), // Link root page to each year page RootPage() "YearPage" YearPage(v) }
Interfaces interactives • Ces langages ne sont pas facile à manipuler • Création d’interface pour en facilité l’utilisation