600 likes | 826 Views
Desarrollo de Herramientas Moleculares e Informáticas para la Identificación de Mutaciones Asociadas a Farmacorresistencia en HIV-1. Laboratorio de Genómica Viral y Humana, UASLP. UASLP Facultad de Medicina. IBQ . Pedro G. Hernández Sánchez Director de Tesis:
E N D
Desarrollo de Herramientas Moleculares e Informáticas para la Identificación de Mutaciones Asociadas a Farmacorresistencia en HIV-1. Laboratorio de Genómica Viral y Humana, UASLP UASLP Facultad de Medicina • IBQ. Pedro G. Hernández SánchezDirector de Tesis: • Dr. Christian A. García Sepúlveda • Laboratorio de Genómica Viral y HumanaAsesores:Dra.OthirG. Galicia Cruz • Laboratorio de Farmacología Analítica • Dr. J. Flavio Martínez Morales • Laboratorio de Farmacología • Facultad de Medicina, UASLP
Taxonomía • Virus de RNA monocatenario. • Género Lentivirus, familia Retroviridae • Grupo VI clasificación de Baltimore
Taxonomía • Virus de RNA monocatenario. • Género Lentivirus, familia Retroviridae • Grupo VI clasificación de Baltimore • HIV-1 parecido al SIV cpz • Grupo M - Main • Grupo O - Outlier • Grupo N – Non-M/O • HIV-2 parecido a SIVsmm (mangabeye gris).
Impacto Mundial • Estadísticas 2008 • 33.4 (31.1-35.8) millones de infectados por HIV a nivel mundial. • 2.7 millones de nuevas infecciones. • 2 millones de defunciones asociadas.
Genómica • Genoma total de 9,719 bp. • Tres regiones génicas principales: • gag – 1502 bp (p17, p24, p7). • pol – 3011 bp (PR, RT, IN). • env – 2750 bp (gp120, gp41). • Nueve genes: gag, pol, env, tat, rev, nef, vif, vpr, y vpu. • Codificantes para 19 proteínas. • Empleando las tres fases o marcos de lectura disponibles.
Mutaciones de Resistencia 10, 11, 16, 20, 24, 30, 32, 33, 34, 36, 43, 46, 47, 48, 50, 53, 54, 58, 60, 62, 63, 64, 69, 71, 73, 74, 76, 77, 82, 83, 84, 85, 88, 89, 90, 93 Proteasa 41, 62, 65, 67, 70, 74, 75, 77, 90, 98, 100, 101,103, 106, 108, 115, 116, 138, 151, 179, 181, 184, 188, 190, 210, 215, 219, 225, 230. RT 92, 143, 148, 155 Integrasa
Proteasa Modelo cristalográfico de un dímero de proteasa de HIV-1 ilustrando los dominios en presencia de Saquinavir (SQV). PDB: 3OXC Resolution: 1.16 Å Unit Cell: Length [Å] Angles [°] a = 52.10 α = 90.00 b = 59.78 β = 90.00 c = 62.49 γ = 90.00 Flap Coro Terminal
Proteasa Mapeo de mutaciones mayores y menores descritas en última publicación (International AIDS Society 2010). PDB: 3OXC Resolution: 1.16 Å Unit Cell: Length [Å] Angles [°] a = 52.10 α = 90.00 b = 59.78 β = 90.00 c = 62.49 γ = 90.00 Mutaciones mayores, mutaciones menores.
Transcriptasa Inversa Modelo cristalográfico de una holoenzima de Transcriptasa inversa de HIV-1 ilustrando los dominios de p66, p51 y el inhibidor lervisirina. PDB: 2WON Resolution: 2.80 Å Unit Cell: Length [Å] Angles [°] a = 117.49 α = 90.00 b = 154.25 β = 90.00 c = 154.88 γ = 90.00 Dedos Lervisirina Pulgar Palma Conector RNasa H p51
Transcriptasa Inversa Mapeo de mutaciones asociadas a resistencia a NRTI’s y NNRTI’s descritas en última publicación (International AIDS Society 2010). PDB: 2WON Resolution: 2.80 Å Unit Cell: Length [Å] Angles [°] a = 117.49 α = 90.00 b = 154.25 β = 90.00 c = 154.88 γ = 90.00 Lervisirina Mutaciones de resistencia a NRTI y a NNRI.
Integrasa Modelo cristalográfico de un dímero de integrasa de HIV-1 ilustrando los dominios. PDB: 1K6Y Resolution: 2.40 Å Unit Cell: Length [Å] Angles [°] a = 102.71 α = 90.00 b = 102.71 β = 90.00 c = 280.56 γ = 90.00 N-terminal Coro catalítico
Integrasa Mapeo de mutaciones mayores y menores descritas en última publicación (International AIDS Society 2010). PDB: 1K6Y Resolution: 2.40 Å Unit Cell: Length [Å] Angles [°] a = 102.71 α = 90.00 b = 102.71 β = 90.00 c = 280.56 γ = 90.00 Mutaciones asociadas a resistencia a ARV
Frecuencia de ARVM’s • ARVM entre pacientes naïve entre 3-20% para Norteamérica 5 y 15% para Europa (Girardi, 2003). • En Argentina se ha reportado una prevalencia del 2.4%, mientras que en Brasil es de un 6.3% (Brindeiro et al., 2003; Kijak et al., 2001). • Pacientes HIV+ tratamiento naïve residentes de la ciudad de Guadalajara, México, con una prevalencia del 16% (Escoto-Delgadillo et al., 2005). • Estudios realizados en la ciudad de Monterrey, México han reportado una prevalencia de 2.8% para la región codificante para la RT (Valle-Bahena et al., 2006). • Estudios realizados en pacientes de la ciudad de Tijuana, México, reportan una prevalencia del 2.5% (Viani et al., 2007).
Propuesta • Desarrollar herramientas moleculares para la identificación de mutaciones asociadas a resistencia a anti-retrovirales y para la caracterización de su relevancia clínica.
Objetivos Generales • Desarrollo de las técnicas moleculares que permitan identificar las mutaciones asociadas a resistencia a fármacos ARV en pacientes infectados por HIV. Desarrollo e implementación de herramientas de bioinformática para evaluar la relevancia clínica de las mutaciones asociadas a ARV.
Objetivos Específicos • Desarrollo de las técnicas moleculares que permitan identificar las mutaciones asociadas a resistencia a fármacos ARV en pacientes infectados por HIV. • Técnica molecular para caracterización genómica en DNA proviral. • Técnica molecular para caracterización genómica en RNA viral. • Técnica de clonación/secuenciación de fragmentos subgenómicos región pol. • Desarrollo de herramientas de bioinformática para evaluar la relevancia clínica de las mutaciones asociadas a ARV. • Generación, edición y ensamble de contigs de región pol completa. • Mapeo molecular de ARVM ya descritas hacia estructuras cristalográficas. • Modelaje de ARVM aun no asociadas a resistencias e inferencia de relevancia.
Población de Estudio y Muestras • Sueros obtenidos como parte de nuestra colaboración en el Grupo de Trabajo en HIV de San Luis Potosí (HIV-WG) CAPASITS, LESP, HCIMP. • Mexican Genomic DNA Collection- HIV Cohort (MGDC-HIV), 270 plasmas y 419 DNA’s individuales. • Se eligieron 5 muestras con CV ≥ 70,900 cp/ml (determinada por LESP). • La extracción del RNA se realizó con el kitHighPure Viral RNA de acuerdo a las instrucciones del fabricante (Roche Diagnostics, Mannheim, Alemania).
Estrategia de Amplificación p15 RNase p51 RT p31 IN PR 2085 2253 2550 3870 4230 5096 Prot-RO Prot-FO 1st PCR: 652 bp Prot-RI Prot-FI 2nd PCR: 514 bp RT-FO2 RT-RO3 1st PCR: 1416 bp RT-FI2 RT-RI3 2nd PCR: 1058 bp RT-FO3 RT-RO2 1st PCR: 1102 bp RT-FI3 RT-RI2 2nd PCR: 986 bp • Acercamiento anidado para la amplificación de cuatro fragmentos subgenómicos que cubran el 100% de la región pol. • Longitud total de contig de 2986 bp. Int-FO 1st PCR: 1046 bp Int-RO Int-RI 2nd PCR: 994 bp Int-FI
Síntesis de cDNA y PCR • Se empleo RT- PCR en dos pasos. • RT constó de dos pasos separados de éxito probado para amplificación de AN virales. • Se optimizó la temperatura de desnaturalización de RNA (65º y 95º). • Se optmizó la temperatura de síntesis de primer cadena (38º y 42º). • Primer PCR empleo 4 µl de cDNA. • Se optimizó Tm para 1ra y 2da PCR de cada fragmento.
Estrategia de Clonación Se amplifica fragmento subgenómico de interés empleando Taq DNA Pol sin capacidad correctiva (para generar A’s terminales). El empleo de DNA Pol Pfu o Ttl eliminaría adenilación terminal y evitaría ligación. Por ello se amplificaron fragmentos pequeños versus región pol completa con Long Range PCR. Permite almacenar clonas con fragmentos subgenómicos para servir de referencia. Permite eliminar ambiguedades resultantes de la co-amplificación de cuasiespecies virales. -A-3' 5'- 3'-A- -5' pGEM-T Easy Vector (PromegaCorporation, Wisconsin EUA)
Protocolo Genérico de Clonación Incubar ½ hrs a RT seguido de 12 hrs a 4ºC Producto de ligación (3 μl) Producto de PCR Células competentes JM109 (10 μl) Baño de hielo (30 min) Choque térmico a 42°C (30 seg) Baño de hielo (2 min) 100 μl de inóculo Incubación 37°C, 1 h en medio LB (250 μl) LB bencilpenicilina (100 g/ml) IPTG (0.5 mM) X-Gal (80 g/ml) Selección fenotípica de colonias con el inserto (blancas).
Extracción del DNA y Secuenciación • Kit WizardGenomic DNA Purification (PromegaCorporation, Wisconsin EUA) utilizando el protocolo para el aislamiento de DNA genómico de bacterias Gram-negativas. • Se realizó PCR sobre el DNA extraido para verificar presencia del fragmento subgenómico insertado. • El producto restante se envió a secuenciar al Laboratorio Nacional de Genómica para la Biodiversidad del CINVESTAV Irapuato (Guanajuato, México) sin purificar. • Se solicitó secuenciación en dos direcciones y el envio de electroferogramas sin manipular o editar.
Procesamiento y Edición de Secuencias • Localmente nosotros editamos los electroferogramas con el programa 4Peaks versión 1.7.2 (A. Griekspoor & Tom Groothuis) para elminar ambigüedades y restringir a regiones de alta calidad. • Las secuencias fueron exportadas como archivos de texto simple y las correspondientes al mismo fragmento subgenómico combinadas empleando la herramienta ClustalW2 (www.ebi.ac.uk/Tools/msa/clustalw2). • El ensamblaje del contig (combinando los cuatro fragmentos subgenómicos) para cada muestra se realizó con la aplicación HIValign de Los AlamosNationalLaboratory HIV Database (www.hiv.lanl.gov/content/sequence/HMM/HmmAlign.html).
Procesamiento y Edición de Secuencias • Se utilizó la herramienta AlignmentReformatting de James Robinson para ilustrar unanimidad. Esta se encuentra hospedada en nuestro servidor local (www.genomica.uaslp.mx/Herramientas/reformat.html). • Esta misma herramienta nos permitió realizar la traducción de la secuencia nucleotídica a la aminoacídica. • Los contigs armados fueron alimentados a la herramienta Quality Control, de Los AlamosNationalLaboratory HIV Database (www.hiv.lanl.gov/content/sequence/QC/index.html). • Los contigs de la región pol completa de las cinco muestras fueron enviados a la base de datos GenBank de NCBI.
Análisis de Homología • Se basó en comparaciones filogenéticas y métodos de bootscanning de ventana deslizante empleando la herramienta REGA HIV-1 subtypingtool versión 2.0 (dbpartners.stanford.edu/RegaSubtyping/). • Para los histogramas de soporte estadístico se empleó una ventana de 400 bp con pasos de 50 bp. • El umbral para la detección de eventos recombinatoriales se fijó en 70% de soporte estadístico (bootscanconfidence).
Genotipificación de ARVM • Se utilizó la herramienta HIVdb: GenotypicResistanceInterpretationAlgorithm, de la Universidad de Stanford (sierra2.stanford.edu/sierra/servlet/JSierra). • Estaherramientanospermitió identificar la presencia de corrimientos del marco de lectura, inserciones/deleciones y la presencia de codones inusuales. • También permitió evaluar la presencia de mutaciones asociadas a resistencia a inhibidores de PR, RT (NRTI y NNRTI) e IN.
Mapeo de ARVM´s • Se utilizaron modelos cristalográficos obtenidos de Protein Data Bank para PR (3OXC), RT (2WON) e IN (1K6Y). • Difracción de rayos X de fuente de radiación sincrotrónica a 1.16, 2.8 y 2.4 Å. • Las estructuras cristalográficas fueron manipuladas y procesadas empleando MacPyMOL. • Modelos moleculares fueron generados empleando ExPASy.
RNA vsDNA Clonado • Amplicones limpios de tamaño esperado, sin productos de amplificación inespecífica de menor o mayor peso. • Rendimiento de amplicones depende de cantidad de template inicial (RNA vs DNA). • Buen rendimiento de productos largos de RNA (RTa 1058). • AmplicónProt (el menor) obtenido incluso de muestras de menor CV. PM 1 2 3 4 5 6 7 8 Prot RTa RTb Int Prot RTa RTb Int RNA DNA MX-HIV-0395
Secuenciación • Se obtuvieron electroferogramas de excelente calidad en ambas direcciones.
Ensamblaje de los Contigs • La longitud promedio después de armar el contig para cada fragmento fue de 475 para Prot, 954 para RTa, 878 para RTb y 895 bp para Int. • La longitud promedio de los contigs de la región polcompleta fue de 2950 bp. • Los contigs de la región pol completa fueron enviados para su inclusión a GenBank, bajo los siguientes números de accesión: JN157829, JN157835, JN157836, JN157837 y JN157838.
Ensamblaje de los Contigs • Primera vez que se caracteriza la genómica de regiones pol completas de aislados mexicanos. • Secuencias clonadas disponibles para distribución a otros investigadores/laboratorios. • Células competentes clonadas capaces de ser empleadas para generar vectores de expresión de las enzimas.
Cobertura • Se amplificó la región codificante completa de la región pol, parte de la región de deslizamiento ribosomal y parte de la región Vif.
Inserciones/deleciones • Inserción de tripletes identificada en la región de deslizamiento ribosomal que permite transicionar de gag a pol. • No presentes en ningún otra región. 2,198 2,199 2,220 2,240 2,241
Localización de las ARVM de PR • 19 residuos polimórficos en PR, 19.2% de los residuos totales de la proteína Flap Coro • El 52.6% (n=10) de dichas substituciones no-sinónimas se concentraron en el dominio de coro, 10.5% (n=2) en el dominio terminal y 36.8% (n=7) en el dominio del flap. Terminal
Localización de las ARVM de RT • En RT se encontraron 72 residuos polimórficos. • Esto corresponde a 12.8% de los codones totales que conforman a la proteína. Dedos Lervisirina Pulgar Palma Conector RNasa H p51 • 29.2% se concentraron en el dominio de RNasa H (n=21), 26.4% en el conector (n=19), 16.7% en el la palma (n=12), 15.3% en el pulgar (n=11) y 12.5% en el de dedos de la RT (n=9)
Localización de las ARVM de IN • Para IN se identificó la presencia de 36 residuos polimórficos (substituciones no-sinónimas). • Corresponden al 12.4% de los codones totales de la proteína. N-terminal Coro catalítico • El 50% de los residuos polimórficos se ubicaron en el coro catalítico de la IN, 27.8% y 22.2% se localizaron en los dominios Amino- y Carboxy-terminales, respectivamente.
Codones de Paro • Para PR se localizó un codón de paro en la muestra MX-HIV-0422 en la región del flap de PR (residuo 43). • En RT se localizó un codón de paro prematuro en la posición 383 de la muestra MX-HIV-0401.
Codones de Paro • En IN se detectó la presencia de dos codones de paro prematuros en la región del dominio C-terminal en las posiciones 252 y 221 de las muestras MX-HIV-0327 y MX-HIV-0422, respectivamente.
Análisis de Homología • Nuestras secuencias demostraron ser más similares a las de subtipos B en el análisis de fragmento completo (BLAST). • El análisis de homología proteica realizado para cada enzima por separado demostró una similaridad de: • 93.82% para las PR (desde 92.3% hasta 94.6%) • 94.38% para las RT (desde 93.3% hasta 95.2%) • 95.44% para las IN (desde 94.7% hasta 95.9%) • No obstante, también se demostró la presencia de zonas dentro de la región pol con menor homología para con subtipos B y más parecidas a otros subtipos.
Eventos de Recombinación • Ventajas de estrategia de ventana desplazante. • Evidencia de eventos recombinatoriales ancestrales. • Información sobre evolución de cepas nacionales. • Información de soporte estadístico. • Mapeo de regiones de acuerdo a homología.
Mutaciones de Resistencia • En los cinco aislados clínicos se detectaron 118 mutaciones, 19 en las secuencias de la PR y 99 en las de la RT. • En PR se detectaron cuatro mutaciones menores asociadas a resistencia a ARV (L10I, G48R, A71T, I84T) y 15 mutaciones no asociadas a resistencia. • En RT se encontraron 4 mutaciones asociadas a resistencia (M41L, K103N, T215D, T215A) y 95 no asociadas. • Ningún aislado clínico presentó ARVM de relevancia clínica con relación a inhibidores de IN.
Mapeo Cristalográfico de ARVM’s • G48R esunamutacióninusualparaestaposición. • A71T es un polimorfismocomún a 2-3% de las personas no tratadasperocuyafrecuencia se incrementa en pacientesquerecibeninhibidores de la proteasa. • I84T esunamutaciónmuyinusual en estaposición.
Mapeo Cristalográfico de ARVM’s • M41L concurre con T215Y y juntas confieren resistencia de nivel intermedio a nivel alto al zidovidina y stavudina al igual que resistencia de bajo nivel a didanosina, abacavir y tenofovir. • T215D son transiciones entre mutaciones Y y F y wild-type. La mayoría no reducen la susceptibilidad a NRTI’s pero su presencia pudiera sugerir la presencia concurrente de T215Y o F.
Mapeo Cristalográfico de ARVM’s • K103N ocasionaresistencia de alto nivel a nevirapina, delavirina y a efavirenz.
Modelaje Cristalográfico de ARVM’s • Además de mapear la presencia de ARVM’s ya asociadas a resistencia, el mapeo, mutagénesis in silico y modelaje molecular permiten analizar el impacto de otras mutaciones • Cambios de estructura de residuos • Cambios de propiedades físicoquímicas (polaridad, electronegatividad, fobicidad, etc). • Proximidad a sitios catalíticos, antigénicos o de relevancia funcional para la dimerización. • Proximidad a lugar de acomplamiento de inhibidores.
Reporte de las Mutaciones • Primeros reportes de ARVM ya entregados al HIV-WG de San Luis Potosí. • Información ha sido acomplada a expedientes de pacientes. • Grandes expectativas de parte de participantes, en particular de parte del CAPASITS San Luis Potosí. • Pendiente la referencia de muestras de dos pacientes de Cd. Valles en falla terapéutica con muy mal comportamiento virológico.
Reporte de las Mutaciones • Primeros reportes de ARVM ya entregados al HIV-WG de San Luis Potosí. • Información ha sido acomplada a expedientes de pacientes. • Grandes expectativas de parte de participantes, en particular de parte del CAPASITS San Luis Potosí. • Pendiente la referencia de muestras de dos pacientes de Cd. Valles en falla terapéutica con muy mal comportamiento virológico.