100 likes | 326 Views
Les bases de données biologiques au LBBE. Le système ACNUC Bases de données généralistes Bases de données développées au labo Accès aux bases de données. Journées du laboratoire 1-2 Juin 2005. Simon Penel. Le système ACNUC Système de requête sur les séquences biologiques.
E N D
Les bases de données biologiques au LBBE • Le système ACNUC • Bases de données généralistes • Bases de données développées au labo • Accès aux bases de données Journées du laboratoire 1-2 Juin 2005 Simon Penel
Le système ACNUCSystème de requête sur les séquences biologiques • Développé au laboratoire (M. Gouy) • Génération d’index à partir des annotations de séquences • Permet de retrouver les séquences à partir de mot clefs, de la bibliographie, de la taxonomie, de la date, du type de séquence, du type de molécule • Séquences « mères » et « filles » • Permet d’extraire les séquences sous différents formats, de récupérer les annotations • Accès ACNUC local : API en C • Accès ACNUC à distance, mode client serveur (sockets) , API en C
Bases de données généralistes structurées sous ACNUC maintenues au laboratoire • Mise à jour automatique: • GenBank Séquences nucléiques - 2 milions de CDS (NCBI) • EMBL Séquence nucléiques - 2 milions de CDS • Uniprot(anciennement SwissProt + TrEMBL + PIR) - 2milions de protéines • et aussi.... • Ensembl Génomes complets métazoaires • Genome Reviews Génomes complets bactériens (EBI) • Complete Protéomes (EBI) • HAMAPGénomes microbiens(SIB)
Bases de données de familles de gènes développées au labo et/ou en collaboration • Bases de données de familles de gènes • protéines ET/OU séquences nucléiques • Familles de gènes/protéines • Alignement • Arbre phylogénétique (avec évènement de spéciation et duplication) • Applications: • Evolution moléculaire • Prédiction de fonction de gène • Phylogénie des espèces • Cartographie comparée • Génétique des populations • Utilisation des ressources du centre de calcul de l’IN2P3 (P. Calvat) • parallèlisation des calculs (BLAST, CLUSTALW) : gain 20 x à 50 x
Bases de données de familles de gènes généralesFamilles de gènes homologues • Hobacgen Bactéries & levures (G. Perrière) Hogenom • HovergenVertébrés 250 000 séquences (L. Duret) • HoGenom Génomes complets 650 000 séquences (L. Duret, S. Penel) • Projet Européen Temblor/Integr8 (EBI) • Homolens Génomes complets de Ensembl 250 000 séquences
Bases de données plus spécialiséesCollaborations au sein du LBBE ou avec labos extérieurs • HoppsigenA. Khelifi (LBBE) Familles de retroélements, retropseudogènes • RTKdbJ. Grassot (LBBE/ Centre de Génétique Moléculaire et Cellulaire) Familles de Récepteurs Tyrosine Kinase • Nurebase(LBBE/ENS-Lyon) Familles de Récepteurs Nucléaires • PolymorphixE. Bazin ( Laboratoire « Génome Populations Interactions Adaptation ») Familles de séquences polymorphes • TaxoBacGenG. Devulder (LBBE) Taxonomie des génomes bactériens • EMGLibG.Perrière (LBBE) Génomes bactéries et levures, annotations corrigées • GemCoreV. Navratil, (LBBE, INRA) SNiPs, cartographie comparée • Futur : • Familles de gènes homologues de plantes • Fusion Hogenom + Homolens • Hovergen: Vertébrés Métazoaires ( x 2) • Tout Uniprot ( 2 millions de séquences, x10)
Accès au banques • query, query_win en local à partir de pbil, biomserv, pbil2 (M. Gouy) • Requêtes sur les banques • Visualisation, extraction de données • query_win en mode client-serveur sur Mac et PC (S. Delmotte, M. Gouy) • seqinR en mode client-serveur (D. Charif, S. Delmotte, J. Lobry) • Serveur Web du PBIL (S. Penel, G. Perrière) • Requêtes sur les banques • Recherche avec BLAST • Visualisation, extraction de données • FamFetch (banques de familles): application Java (G. Perrière) • Recherche et visualisation des familles • Recherche de motifs dans les arbres (J.F. Dufayard)
Accès au banques • query, query_win à partir de pbil, biomserv, pbil2
Accès au banques • Serveur Web du PBIL
Conclusions • De nombreuses banques • De nombreux outils • Grosses capacités de calcul (IN2P3) • Compétences en modélisation, conception, mise en place et maintenance des banques • Favoriser • l’utilisation des banques • le développement de nouvelles banques associées à différentes thématiques au sein du laboratoire