1.04k likes | 1.22k Views
Bioinformatics. CA García Sepúlveda MD PhD. Laboratorio de Genómica Viral y Humana Facultad de Medicina, Universidad Autónoma de San Luis Potosí. Bioinformática Origenes. En 1984 el DOE de EU planteo el Proyecto del Genoma Humano.
E N D
Bioinformatics CA García Sepúlveda MD PhD Laboratorio de Genómica Viral y HumanaFacultad de Medicina, Universidad Autónoma de San Luis Potosí
BioinformáticaOrigenes • En 1984 el DOE de EU planteo el Proyecto del Genoma Humano. • 1988-1992 National Center for Human Genome Research (NIH) a cargo de JD Watson. • 1993 – JD Watson reemplazado por F Collins. • 1997 – Centro cambia de nombre a: National Human Genome Research Institute (NHGRI)
BioinformáticaOrigenes • En 1990 el gobierno EU otorga 3 x 109 USD para proyecto. • Objetivo del proyecto: mapear la localización de los 100,000 genes humanos que en ese entonces se pensaba existían. • Esfuerzo internacional (EU, UK, Deu, Fr, Jap y China). • Primer borrador listo para el 2000, versión final lista en el 2006.
BioinformáticaOrigenes • 3x109 bases nucleotídicas. • 22,000 genes no 100,000. • 92% del genoma (telómeros y centrómeros no incluidos). • Tecnología de Biología Molecular avanzó a grandes pasos. • Pero,¿y ahora que hacer con la información generada?
BioinformáticaInformación • Había que: • Almacenarla – Crear y mantener bases de datos • Hacerla disponible al público – crear interfaces accesibles • Interpretarla • Secuencia linear del DNA • Homologías con otras secuencias de DNA • Estudios filogenéticos • Identificación de sitios específicos (ORF, STR, etc). • Análisis de transcritos, splice variants, expresión • Secuencia de proteinas codificadas • Predicción de estructura tridimensional
BioinformáticaInformación • Es decir: • Por un lado se habían logrado grandes avances en la automatización de procedimientos técnicos y mecánicos. ¿Pero que hacer respecto a la información que se había generado?
BioinformáticaInformación • Era necesario desarrollar y optimizar herramientas informáticas para facilitar el almacenamiento, procesamiento y análisis de dicha información. • Es redescubierta la importancia de la relativamente reciente disciplina de la Bioinformática o Biología Computacional.
BioinformáticaBioinformática • Definición: El empleo de técnicas matemáticas, estadísticas, informáticas, bioquímicas, computacionales e inteligencia artificial para analizar y comprender el funcionamiento y relevancia de sistemas biológicos al igual que para resolver problemas biológicos a nivel molecular. Wikipedia 2007
BioinformáticaBioinformática • Definición práctica: Herramientas computacionales que permiten manejar las enormes cantidades de información genómica y proteómica generados en años recientes para el bien de la comunidad mundial.
BioinformáticaBioinformática Utilidad inmediata: • Creación y mantenimiento de grandes bases de datos. • Creación y mantenimiento de sitios web que hicieran estas bases de datos accesibles a cualquier persona. • Creación de herramientas computacionales para organizar, comparar y analizar las secuencias de DNA. • Creación de algoritmos que permitan interpretar la relevancia biológica, funcional, clínica y médica de los hallazgos.
BioinformáticaEn perspectiva ¿Que tan grande era el problema? Dentro del núcleo de casi todas las células de nuestro cuerpo existe un manual operativo complejo de instrucciones genéticas conocido como el GENOMA HUMANO.
BioinformáticaEn perspectiva ¿Que tan grande era el problema? El genoma humano se encuentra convenientemente almacenado en 46 paquetes llamados CROMOSOMAS.
BioinformáticaEn perspectiva ¿Que tan grande era el problema? Cada cromosoma está formado por Acido Desoxiribonucleico (DNA) el cual se encuentra a su vez organizado en estructuras funcionales llamadas GENES. Como ya habiamos dicho, existen alrededor de 30,000 de estos.
BioinformáticaEn perspectiva ¿Que tan grande era el problema? Dentro de cada gen, el DNA se organiza en EXONES e INTRONES. La gran mayoría del DNA forma parte de los INTRONES. Sabemos que no codifica para ninguna parte de las proteinas pero aun no conocemos totalmente su función.
BioinformáticaEn perspectiva ¿Que tan grande era el problema? Dentro de cada gen, el DNA se organiza en EXONES e INTRONES. Un menor porcentaje del DNA forma parte de los EXONES y constiuye la parte que codifica para proteinas.
BioinformáticaEn perspectiva ¿Que tan grande era el problema? • Tanto los intrones como los exones estan constituidos por nucleótidos. • Pirimidinas: A y G • Purinas: C y T
BioinformáticaEn perspectiva ¿Que tan grande era el problema? La secuencia específica de nucleótidos es la manera en que la información genética es almacenada. y basta una diferencia de tan solo un nucleótido para dictar la calidad de vida de un organismo (o su muerte). ¿y donde está la complejidad del código genético si tan solo se trata de 4 bases? AGCTAGCTAGTTGATCGTGAATGCTCGATAGCTAGATCG Como ya habiamos dicho, existen alrededor de 3x109 bases en el genoma humano.
BioinformáticaEn perspectiva ¿Que tan grande era el problema? En realidad el código genético se lee en tripletes (CODONES), con lo que hacen falta tres nucleótidos para codificar a un solo aminoácido.
BioinformáticaEn perspectiva ¿Que tan grande era el problema? Y existen veinte aminoácidos diferentes...
BioinformáticaEn perspectiva ¿Que tan grande era el problema? Los cuales poseen diferentes propiedades biofísicas...
BioinformáticaEn perspectiva ¿Que tan grande era el problema? Cuya secuencia es característica y específica para cada proteina.
BioinformáticaEn perspectiva ¿Que tan grande era el problema? Otorgandole una estructura secundaria específica a cada proteina.
BioinformáticaEn perspectiva ¿Que tan grande era el problema? Lo que le permite a la proteina doblarse sobre sí misma de manera específica.
BioinformáticaEn perspectiva ¿Que tan grande era el problema? Y con ello asociarse a otras proteinas para formar una unidad funcional...
BioinformáticaEn perspectiva • Y esto para cada gen...de cada cromosoma... • Aqui el #21 (un cromosoma de los más pequeños) ...sin considerar otros niveles de diversidad como: Polimorfismos, haplotipos, splicing alternativos, rearreglos genéticos, recombinación genética, mutaciones, etc.
BioinformáticaHerramientas • Bases de datos • Alineamientos de secuencias • Identificación automatizada de genes • PCR electrónicas • Ensamblaje genómico • Modelaje proteico • Predicciones de estructura protéica • Análisis de la expresión génica • Prediccion de interacciones proteicas (docking) • Modelaje de procesos evolutivos
BioinformáticaBases de datos Destinadas a almacenar la información que ha sido generada. Usualmente presentan dicha información en tablas, con interfaces gráficas que facilitan la interacción con personas con poco entrenamiento en bioinformática.Son actualizadas de manera continua (MedLine) o de manera periódica (IMGT). Son de libre acceso, basadas en www y normalmente incluyen vínculos a otras ligas de interés o referencia.
BioinformáticaNCBI - PubMed • Utilidad de crear cuenta de usuario, permite: • personalizar página de búsqueda y entrega de fichas • almacenar búsquedas anteriores • almacenar portapapeles • recibir actualizaciones de búsquedas • Búsqueda sencilla (apellidos de autor, fecha, título o tema a revisar) • Búsqueda avanzada y crtierios de limite • Autor o autores Idiomas Medicamentos • Rango de tiempo Nombre publicación Procedimientos • Tipo de publicación (gratuitas) Ensayos clínicos Etc
BioinformáticaEBI / EMBL URL Nombre Quien la mantiene Resúmen de objetivos Tipo de información almacenada Homepage y criterios de búsqueda Herramientas para análisis de secuencias
BioinformáticaENSEMBL http://www.ensembl.org/index.html URL Nombre Quien la mantiene Resúmen de objetivos Tipo de información almacenada Homepage y criterios de búsqueda