470 likes | 658 Views
Elmer A. Fernández (PhD, Bioing) CONICET-UCC elmer.fernandez@ucc.edu.ar http://www.uccor.edu.ar/modelo.php?param=3.8.5.15. Tópicos en Bioinformática. Fac. de Ingeniería – UNC - 2010. Pregunta?. Qué es Bioinformática.
E N D
Elmer A. Fernández (PhD, Bioing) CONICET-UCC elmer.fernandez@ucc.edu.ar http://www.uccor.edu.ar/modelo.php?param=3.8.5.15 Tópicos en Bioinformática Fac. de Ingeniería – UNC - 2010
Pregunta? Qué es Bioinformática Bioinformatics is the application of information technology to the field of molecular biology. Bioinformatics entails the creation and advancement of databases, algorithms, computational and statistical techniques, and theory to solve formal and practical problems arising from the management and analysis of biological data. …. It is the name given to these mathematical and computing approaches used to glean understanding of biological processes. Common activities in Bioinformatics include mapping and analyzing DNA and protein sequences, aligning different DNA and protein sequences to compare them and creating and viewing 3-D models of protein structures. Bioinformatics is that branch of life science,which deals with the study of application of information technology to the field of molecular biology. The primary goal of bioinformatics is to increase our understanding of biological processes. What sets it apart from other approaches, however, is its focus on developing and applying computationally intensive techniques (e.g., data mining, and machine learning algorithms) to achieve this goal. Major research efforts in the field include sequence alignment, gene finding, genome assembly, protein structure alignment, protein structure prediction, prediction of gene expression and protein-protein interactions, and the modeling of evolution.
Qué es para mi? Biología Medicina …. Agronomia Biología Molecular Bases de datos Bioingeniero Estadística Apnredizaje Automático …. Informática Sistemas de Información Tecnología Modelos Bioinformático Equipamiento …..
Un mejor modelo Biología Medicina …. Agronomia Biología Molecular …. Tecnología Modelos Bases de datos Equipamiento Estadística Apnredizaje Automático Informática Sistemas de Información …..
Bioinformático-Bioingeniero No son antagónicos sino complementarios Capacidades diferenciadas Deben actuar como nexo entre las necesidades en el ámbito de la Biología y las tecnologías asistentes.
Porqué surge la bioinformática Las planillas de MS Excel ya no alcanzan. Globalización de la información y de los recursos. Necesidades de cálculo intensivo Necesidades de modelado intensivo Contrastar por modelos lo observado en la realidad Tecnologías de alto rendimiento, un nuevo paradigma ….
ATRIBUTOS Datum Dato Data Dato congreso Archivo Laboratorio reporte Dato Calculo Imagen DATO Datos Planilla excel presentación Data Base de datos Datos datito Expresión génica DATOS Variables DATOS Perfil Atributos DATOSSSSS Servidor Proteinas DATITITO Resumiendo…
Cuál es el rol fundamental del BioIn…loquesea Instaurar un lenguaje común entre el mundo de la biología y el de la tecnología. Ejemplos IA-Estadística Proyecto Bélgica. Diseño stent US-Latin American Cancer Research Network
Cómo es el entorno de trabajo Multidisciplinar Biólogos Médicos Bioingenieros Estadísticos Físicos Matemáticos Técnicos Informáticos Etc.
Algunos títulos LIMS Chemometrics Biometrics Genomics Proteomics Technology BD Data Mining
LIMS Laboratory Information Management Systems Administrar la información Biotecnológica Proveer herramientas de comunicación Proveer herramientas de análisis y búsqueda Conectar los distintos sistemas y equipos. Proveer capacidades de seguimiento Importante para las facilities ¿Capacidades?
Chemometrics Modelado molecular Interacción de moléculas con el medio Modelos moleculares LIMS NIR Desarrollo de Drogas
Biometrics Diseño de experimentos Modelos estadísticos en biología Inferencia Técnicas estadísticas para resumen y visualización de datos. ¿Capacidades?
Genomics Secuenciamiento (Biosidus) Microarreglos de ADN (Biosidus, INTA, Leloir, UBA) (ETC international, Agilent) Ontologías Curado de bases de datos TextMining Cáncer, etc.. ¿Capacidades?
Proteomics Folding, predicción estructural Secuenciamiento Interacción con el agua Modelado 3D (Homologías) Ontologías Curado de bases de datos Vías Metabólicas M/Z Geles bidimensionales ¿Capacidades?
Tecnologías asociadas:Modelado de moléculas • Modelado
Bases de Datos No existen en Argentina bases de datos preparadas para ámbitos de biología Las bases de datos solo están pensadas con el propósito de almacenar No hay consenso en Argentina Flexibilidad insuficiente (sharing) Estructuras inadecuadas (Data Mining) Curado ¿Capacidades?
Data Mining Knowledge Discovery in Databases es el proceso no trivial de identificación de patrones sobre los datos. Estos deberán resultar ser válidos, novedosos, potencialmente útiles y entendibles.
Data Mining Knowledge Discovery Sistemas de adquisición y Monitorización Estadística Inteligencia Artificial Reconocimiento de patrones Computación avanzada Visualización Tecnologías de Bases de datos
La estrella del momento Secuenciadores de “próxima” generación • 454 Roche: Pirosecuenciador (Arg) • De novosequencing • Metagenomica • Solexa ILLUMINA • Solid ABI
Nuestro grupo Grupo de Minería de Bio-Datos (BioData Mining) Dr. Elmer Fernández, Bioing. Cristobal Fresno Universidad Católica de Córdoba CONICET Campus-Camino Alta Gracia km 7 ½ 5000 – Cba.
Con quien trabajamos? Dra.Mónica Balzarini (Dpto. Biometria-UNC) Dr. Osvaldo Podhajcer (Terapia Celular y Molecular- Inst. Leloir) Dra. Andrea Llera (Terapia Celular y Molecular- Inst. Leloir) Adivisor: Dr. Terence Speed (WHEI-Australia & UC Berkeley-USA)
Nuestro grupo en la UCC http://sites.google.com/site/biologicaldatamininggroup/Home/
Historia en la UCC • Comienzos en 2004 • 2006 post-doc visitante @ islab, Antwerp, Belgica • 2006-2008 Master en App. Stat. • 2009 candidato Doctorado
Líneas de interés en investigación • KDD en ciencias biomédicas a través de técnicas estadístico-computacionales • Aprendizaje Maquinal • Artificial Neural Networks • Support Vector Machines • Clustering • Estadística • Generalized Linear Mixed Models • Partial Least Squares • Clustering
Líneas de interés en investigación • Proceso Unificado de Análisis para DM en Bio-ciencias (PUA-DMB) • Administración de datos biológicos • Desarrollo de técnicas basadas en aprendizaje computacional para Clustering and Classificación • Desarrollo de estrategias estadísticas para análisis de datos bajo diferentes supuestos distribucionales con efectos aleatorios y estructuras de correlación • Procesamiento de señales/datos Biomédicos
Historia en la UCC • Comienzos en 2004 • 2006 post-doc visitante @ islab, Antwerp, Belgica • 2006-2008 Master en App. Stat. • 2009 candidato Doctorado
Líneas de interés en investigación • KDD en ciencias biomédicas a través de técnicas estadístico-computacionales • Aprendizaje Maquinal • Artificial Neural Networks • Support Vector Machines • Clustering • Estadística • Generalized Linear Mixed Models • Partial Least Squares • Clustering
Líneas de interés en investigación • Proceso Unificado de Análisis para DM en Bio-ciencias (PUA-DMB) • Administración de datos biológicos • Desarrollo de técnicas basadas en aprendizaje computacional para Clustering and Classificación • Desarrollo de estrategias estadísticas para análisis de datos bajo diferentes supuestos distribucionales con efectos aleatorios y estructuras de correlación • Procesamiento de señales/datos Biomédicos
Líneas de interés en investigación • Proceso Unificado de Análisis para DM en Bio-ciencias (PUA-DMB) • PUA-DMB es un entorno ordenado para el análisis de estudios biológicos Control Cardiovascular Genómica y Proteómica Funcional Hemodialisis …… PUA-DMB
Líneas de interés en investigación • PUA-DMB en Hemodialisis • Desarrollo de técnicas analíticas para monitoreo molecular-antropométrico en pacientes en tratamiento: • Diagnóstico de la eficiencia • Evaluación de biomarcadores • Caracterización de pacientes en pos de tratamientos sujeto-específico
Líneas de interés en investigación • PUA-DMB en Control Cardiovascular • Abordaje estadístico del control Cardiovascular mediante supuestos no-normales • Estudios del balance en el sistema nervioso central • Análisis del ECG para detección de apnea • Desórdenes eléctricos y Mechano-Electrical Feedback.
Líneas de interés en investigación • PUA-DMB en Genómica y Proteómica Funcaional • Métodos estadísticos y de Aprendizaje maquinal para análisis patrones de genes y proeínas • DNA Microarray data analysis (INSPECTOR,SOM) • Agriculture, cancer, etc. • Gel based protein analysis (2D-DIGE technology) • Modelos estadísticos para análisis de invación celular.
Líneas de interés en investigación • Optimización y diagnóstico de clasificadores y regresores no-paramétricos (aprendizaje maquinal) • Selección de características • Validación, evaluación y selección de modelos • Aprendizaje Maquinal en contextos estadísticos: • Comportamiento de técnicas computacionales de reconocimiento de patrones bajo hipótesis distribucionales conocidas.
El mapa de colaboraciones M. Balzarini (PhD) Biometrics Dept. UNC J. Lopez del Olmo (PhD) CNIC - Spain BDMG UCC Estudios moleculares y funcionales de la transición epitelio mesenquimal y su impacto en el aumento de la agresividad tumoral. PICT-2008 Statistical Models for protein pattern analysis. MinCyt –cba 2008 • Llera (PhD) • Moll. And Cell therapy Lab. • Leloir Inst. - Argentina Somewhere in the world: Terry Speed Functional Genomics and Proteomics
El mapa de colaboraciones M. Balzarini (PhD) Biometrics Dept. UNC P. Willshaw (PhD) School of Health Sciences Swansea Univ. - UK BDMG UCC R. Valtuille (Phys) Fresenius Medical Care Arg. Hemodialysis
El mapa de colaboraciones M. Balzarini (PhD) Biometrics Dept. UNC BDMG UCC P. Abry (PhD) Ecole Normal Superieur de Lyon - France Cardiovascular Control and Signal Processing
Experiencias en empresas/centros de I+D • GALIX (Holter de ECG) • Fresenius Medical Care • Aeromedical (Stent Coronario) • INTA • INTI • UBA • Ledesma
Hasta la próxima Make everything as simple as possible, but not simpler (A. Enstain) Si uno hace lo que todo el mundo hace, obtiene lo que todo el mundo obtiene. (¿?) El atroz encanto de ser argentinos, M. Aguinis