1 / 34

Encontrando sentido a las secuencias de ADN

Encontrando sentido a las secuencias de ADN. ¿Como podemos saber donde están localizados los genes conociendo únicamente la información de la secuencia?. Diferencias entre genes procariotas y eucariotas. Estructura de los genes bacterianos. I. Transcripto de 1 solo gen. Promotor.

piper
Download Presentation

Encontrando sentido a las secuencias de ADN

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Encontrando sentido a las secuencias de ADN ¿Como podemos saber donde están localizados los genes conociendo únicamente la información de la secuencia?

  2. Diferencias entre genes procariotas y eucariotas

  3. Estructura de los genes bacterianos I. Transcripto de 1 solo gen Promotor Sitio de inicio de la transcripción Terminador transcripcional ATG TAA Secuencia codificante hisG Transcripto (RNAm) Sitio de unión a ribosoma (RBS) Sitio inicio de la traduccion (ATG) Fin de la traducción La orientación del promotor determina el sentido de la transcripción (y por lo tanto cuál de las 2 hebras se transcribe)

  4. + Sitio de unión a ribosoma (RBS) Sitio inicio de la traduccion (ATG) Estructura de los genes bacterianos II. Operón Policistrónico Uno por operón Terminador transcripcional Sitio de inicio de la transcripción Promotor TAA ATG ATG TAA Secuencia codificante Secuencia codificante hisG hisH Transcripto (RNAm) Fin de la traducción Uno por gen

  5. Estructura de los genes eucariotas Exon 5’ no codificante Exon 5’ no codificante ATG STOP enhancer promotor DNA Inicio transcripción intrones Exones internos Transcripción, capping en 5’ y polyadenilación Pre-mRNA Splicing (remoción de los intrones) mRNA Traducción PROTEÍNA MAR = Matrix attachement regions BE = Boundary elements (evita que el enhancer actúe en otro gen) Señal Poly-A

  6. características de los genes eucariotas: • Muestran una distribución muy amplia de tamaños • No hay grandes diferencias en el tamaño de los exones entre diferentes organismos • En general los intrones son mas largos que los exones • La distribución de los tamaños de los intrones varía desde el mismo largo que los exones (>200 pb) hasta 50-60 Kb en casos extremos • No hay una correlación entre el tamaño del gen y el tamaño de los RNAms • No hay buena una correlación entre tamaño del gen y el número de exones • Las secuencias de los exones son conservadas pero los intrones varían

  7. ¿Cómo identificar genes? Localizar los marcos abiertos de lectura ORFs, Open Reading Frames Los ORFs comienzan con un codón Start (AUG = Met, casi siempre) Finaliza con uno de los tres codones stops (UAA, UAG, UGA). La interpretación del resultado es más sencilla en procariotas que en eucariotas La búsqueda por homología de los posibles ORF sólo predice un 50% de los genes

  8. ¿Cómo identificar genes? ¿Cómo detectar ORFs? ORF Finding • Se analizan todos los marcos de lectura abiertos: total 6 (inicio en cada base de un codón y en los dos sentidos). • Busca codones de iniciación (Met=AUG o codones alternativos GUG, CUG o UUG ) • y terminación dentro de la secuencia (UAA, UAG, UGA). • El programa permite: • - Definir límite: secuencias de menos de 100 bases antes de un stop codon (33 amino acids) se excluyen. Promedio > 100 aa • Seleccionar el codon de inicio • -Seleccionar el “codon usage”

  9. http://www.ncbi.nlm.nih.gov/gorf/gorf.html

  10. Codigogenetico y uso de codones código genético no esta totalmente conservado http://www.kazusa.or.jp/codon/

  11. Codigogenetico y uso de codones

  12. Otros sitios que permiten determinar los ORFs ExPASy (Expert Protein Analysis System) Online Analysis Tools University of Guelph,CANADA EMBOSS Transeq from EBI. DNA to Protein Translation http://www.expasy.ch/tools/dna.html http://molbiol-tools.ca/Translation.htm http://www.ebi.ac.uk/Tools/emboss/transeq/index.html http://bio.lundberg.gu.se/edu/translat.html

  13. Reconocimiento de motivos • Identificar sitios dentro de un gen es una actividad que entra dentro de lo conocido como “data mining” • Reconocimiento de sitios de splicing • sitios canónicos de splicing (par GT-AG) • consenso en el sitio donante AG|GTRAGT (R=A o G) • consenso en el sitio aceptor • sitios de splicing no canónicos (GC-G, etc) • Reconocimiento de promotores • Predicción de sitios poly-A • Predicción de sitios de terminacion de la transcricion

  14. Reconocimiento de motivos Splicing (en genes eucariotas) • Los sitios de unión son muy conservados. GT-AG = 99.24% GC-AG = 0.7% AT-AC = 0.05% La secuencia altamente conservada (99%) se encuentra inmediatamente dentro del intrón en los sitios de unión La secuencia de un intrón genérico se define como GT………….AG

  15. Asumimos que : • La secuencia de ADN comienza en un exón, contiene solo un sitio de splicing 5´ y termina en un intrón. • Las secuencias de los exones, intrones y sitios de splicing deben tener diferentes propiedades estadísticas Exones: tienen una composición uniforme de bases , ATCG (25%) Intrones: ricos en A/T (40% de A, 40% de T), 10% de C y 10%G. Sitio de Splicing (SS) : es casi siempre una G (95%) y A (5%) Reconocimiento de motivos Reconocer un sitio de splicing 5’

  16. GENSCAN Métodos estadísticos y modelos probabilísticos para predicción de motivos en las secuencias. (modelos de Markov o HMM) Alineamientos basados en patrones conservados encontrados en el mismo orden en distintas secuencias. Predice estructuras genéticas completas, incluyendo exones intrones, promotores y señales de polyadenilación en secuencias genómicas. Permite búsquedas sobre genes incompletos y sobre cadenas simples o dobles.

  17. http://genes.mit.edu/GENSCAN.html http://spliceport.cs.umd.edu/

  18. Identificación de señales Promotores Características de los promotores de E. coli +1 -35 hexamero -10 hexamero espaciador intervalo TTGACA TATAAT 15 a 19 bases 5 a 9 bases RBS – Ribosome Binding Site (Shine-Dalgarno) conservadas aprox -15 upstream AUG. (en B. subtilis la RBS es AGGAGG)

  19. Identificación de señales Terminadores de la transcripción Características de los terminadores rho-independentes Loop de 3-8 bases Stem loop energia libre debajo de -7 kcal/mol Tallo de 5-10 pb con un mínimo de 60% GC 5’ UUUU 3’ At least 4 U residues Secuencia en el ADNque marca la terminación de la transcripción para la RNA polimerasa, NO CONFUNDIR con los codones terminadores de la traducción

  20. Identificación de señales • Señales de Transcripcion : • TATA box (~-30 TSS), • CAAT box (~-75 TSS), • GC box (~-90 TSS), • Señal cap, • Sitio de poli-adenilación. • Enhancers En Eucariotas TSS= translation start site: señal de Kozak (upstream ATG), GCC[A/G]CCaugG[not U] == óptimo [A/G]NNaugG[not U] == fuerte ; con ‘A’ a -3 mas fuerte que con ‘G’ Cualquier otra combinacion = débil Señales de Splicing Señales de traduccion

  21. http://molbiol-tools.ca/Promoters.htm

  22. http://www.softberry.com/berry.phtml?topic=fgenesb&group=programs&subgroup=gfindbhttp://www.softberry.com/berry.phtml?topic=fgenesb&group=programs&subgroup=gfindb

  23. http://www-bimas.cit.nih.gov/molbio/proscan/

  24. http://www.cbrc.jp/research/db/TFSEARCH.html Enhancer

  25. Búsqueda de motivos de unión a DNA http://meme.sdsc.edu/meme/ A generic approach to identify Transcription Factor-specific operator motifs; Inferences for LacI-family mediated regulation in Lactobacillus plantarum WCFS1. Francke C, Kerkhoven R, Wels M, Siezen RJ. BMC Genomics. 2008 Mar 27;9:145.

  26. http://www.ualberta.ca/~stothard/javascript/index.html

  27. Genes RNA Funcionales • genes RNA transcriptos pero no tranducidos – no hay preferencia de codones.Cómo se predicen genes de rRNA, tRNA y small RNA? • Buscar región Promotora (no es tan especifico) • Estructura secundaria RNA es importante. • Puede ser predicta usando RNA structure • Prediction tools (MFOLD tool). http://mfold.bioinfo.rpi.edu/cgi-bin/rna-form1.cgi

  28. Identificar Small RNAs Funciones regulatorias • Basados en 10 sRNA conocidos en E. coli se predicen 24 sRNAs, 14 de los cuales han sido verificados experimentalmente. • 3 estudios posteriores identifican ~ 20 mas sRNA genes en E. coli.

  29. -35 -10 Promoter +1 -35 -10 50-400 bases Promoter +1 Terminator Esquema predictivo “Empty” regions ORF A Localizar regiones “vacias” genoma E. coli ORF C ORF B buscar promoteres reconocidos s70 RNA polimerasa Identificar rho-independent terminators TTTT Rescatar secuencias donde la distancia entre promotor y terminador sea 50 a 400 bases. Buscar consenso en otras bacterias

  30. Argaman et. Al – Current Biology 2001.

More Related