420 likes | 588 Views
MSc Engenharia Biomédica IST, Lisboa, 14 de Novembro, 2007. ‘ Emparelhamento de Cromossomas Para Propósitos de Cariotipagem ’. Artem Khmelinskii Nº 52767 Orientadores : Professor João Sanches Professora Maria do Carmo Fonseca. Sumário. Motivação Formulação do Problema
E N D
MSc Engenharia Biomédica IST, Lisboa, 14 de Novembro, 2007 ‘Emparelhamento de CromossomasPara Propósitos de Cariotipagem’ • Artem Khmelinskii Nº 52767 • Orientadores: • Professor João Sanches • Professora Maria do Carmo Fonseca
Sumário • Motivação • Formulação do Problema • Extracção de Características • Emparelhamento • Resultados • Conclusão e Trabalhos Futuro
Motivação (1) • Citogenética: estudo do material cromossómico • Leucemía (caracterizada pelas anomalias cromossómicas) • Estudos citogenéticos são essenciais na escolha do tratamento certo para o doente • Cariotipágem (emparelhamento) • Cariótipo: características do cromossoma • Espera-se resultados rápidos, precisos e específicos • As análises citogenéticas requerem uma permanente intervenção humana
Cariótipo anormal feminino t(9;22)(q34;q11) Leucemía Mielóide Crónica
Motivação (1) • Citogenética: estudo do material cromossómico • Leucemía (caracterizada pelas anomalias cromossómicas) • Estudos citogenéticos são essenciais na escolha do tratamento certo para o doente • Cariotipágem (emparelhamento) • Cariótipo: características do cromossoma • Espera-se resultados rápidos, precisos e específicos • As análises citogenéticas requerem uma permanente intervenção humana
Motivação (2) Um problema importante durante décadas dentro do âmbito do processamento de imagem e reconhecimento de padrões Dificuldades Distorção geométrica e de intensidade Similaridade entre os cromossomas Pacotes comerciais – Leica ®, Cytovision® e Metasystems® Resultados de emparelhamento quase nulos No IMM há uma forte componente manual Objectivo: novas contribuições para a resolução do problema de emparelhamento pelo software Leica CW 4000 Karyo Novas características Classificadores
Sumário • Motivação • Formulação do Problema • Extracção de Características • Emparelhamento • Resultados • Conclusão e Trabalhos Futuro
Formulação do Problema • Extracção de características • Emparelhamento
Extracção de Características Individualização com as Bounding Box • Dimensão • Forma • Textura
Extracção de Características - Dimensão • Área (contagem dos píxeis) • Perímetro • Altura (~altura das Bounding Boxes) • Comprimento dos eixos da menor elipse envolvente • Proporção de tamanho
Extracção de Características - Forma 3 0 4 5 7 6 8 2 1 • Área Normalizada (Área/Perímetro) • Directional Chain Code
Extracção de Características - Textura Escalamento dos Cromossomas • Perfil de Densidade • Mutual Information
Extracção de Características – Mutual Information • Mede a informação que duas variáveis/imagens X e Y partilham • Entropia de Shannon
Extracção de Características – Perfil de Densidade a c b e e • Valor médio ao longo das transversais ao eixo medial do cromossoma • ~PMS (“poor man skeleton”)
Matriz de Características - F • Tamanho: , onde corresponde ao número de cromossomas e ao número de características usadas no emparelhamento • , onde , , • é a métrica euclidiana • Distâncias parciais • Matriz de distâncias Global
Emparelhamento • Objectivo • Encontrar a matriz de permutação , onde • Dimensão matriz C: • Optimização combinatória global (A*) de uma função de custo que depende da matriz de distâncias • Cumpre a restrição de 1 mínimo por linha e por coluna
Emparelhamento Objectivo Exemplo: • 2 Pares de cromossomas • 1 com 2 • 3 com 4 A*
Matriz de Distâncias - D • Dimensão matriz D: • 2 algortimos Não - Supervisionados • 2 algoritmos Supervisionados • vectores de pesos , onde corresponde a um determinado par/classe de cromossomas • A distância entre dois cromossomas é a distância mínima obtida de entre os vários vectores , i.e.,
algoritmo de Soma de Distâncias • A distância entre dois cromossomas é simplesmente a soma das métricas associadas às diferentes características • Igual importancia para todas as carateristicas
algoritmo Não Supervisionado de Votação (1) • emparelhamentos • matrizes de distâncias, contendo cada uma delas, as distâncias parciais associadas a uma característica específica
algoritmo Não Supervisionado de Votação (2) A* A* A* A*
algoritmo de Combinação Linear Supervisionado Binária (1) • Treino • Para todos as classes k de cromossomas é estimado um vector wk de pesos • Solução
algoritmo de Combinação Linear Supervisionado Binária(2) . . . = =
algoritmo de Combinação Linear Supervisionado de Máxima Separação • Treino • Para todos as classes k de cromossomas é estimado um vector wk de pesos • Solução
Sumário • Motivação • Formulação do Problema • Extracção de Características • Emparelhamento • Resultados • Conclusão e Trabalhos Futuro
Resultados (0) • Dados de teste • “Bons” cariogramas • 5 conjuntos de cromossomas de classes diferentes (por ordem crescente de dificuldade de emparelhamento) por cada cariograma • 4 Pares 1, 10, 16, 21 • 5 Pares 1, 10, 16, 21 + 3 • 6 Pares 1, 10, 16, 21 + 3 + 12 • 7 Pares 1, 10, 16, 21 + 3 + 12 + 15 • 8 Pares 1, 10, 16, 21 + 3 + 12 + 15 + 22 • Não-Supervisionados: 16 cariogramas, i.e., 16x5 conjuntos de teste no total • Supervisionados: 4 cariogramas de treino, 2 cariogramas de teste • 9 características utilizadas no emparelhamento
Resultados (1) - algoritmo Não Supervisionado de Votação √ - Emparelhamento total (100%)
Resultados (2) - algoritmo de Soma de Distâncias √ - Emparelhamento total (100%)
Resultados (3) - algoritmo de Combinação Linear Supervisionado Binária √ - Emparelhamento total (100%)
Resultados (4) – algoritmo de Combinação Linear Supervisionado de Máxima Separação √ - Emparelhamento total (100%)
Resultados (5) - Tempos de Execução • 4.402 segundos - algoritmo de Votação • 0.204 segundos - algoritmo Soma de Distâncias • Não significativo – algoritmos supervisionados
Sumário • Motivação • Formulação do Problema • Extracção de Características • Emparelhamento • Resultados • Conclusão e Trabalhos Futuro
Conclusão • Data set ainda reduzido • Resultados são bastante promissores dada a complexidade e dificuldade do problema • Taxas de sucesso de emparelhamento de 100 % para conjuntos de 16 cromossomas (8 pares) • Taxas de sucesso superiores às do software Leica CW 4000 Karyo utilizado pelo IMM
Trabalho Futuro • Melhoramentos a 3 níveis: • (Testes exaustivos) • Pré-Processamento • Equalização do histograma (brilho&contraste) • Desconvolução semi adaptativa (desfocagem) • Correcção geométrica (distorções geométricas) • Espaço das Características • Selecção das características • Introdução de mais características (WDD´s, Wavelets) • Classificadores • Support vector machines • Redes Neuronais
Referências (principais - 1) • Data-driven homologue matching for chromosome identification, Stanley, R.J.; Keller, J.M.; Gader, P.; Caldwell, C.W.; IEEE Transactions on Medical Imaging Volume 17, Issue 3, June 1998 Page(s):451 – 462 • On Fully Automatic Feature Measurement for Banded Chromosome Classification, Piper J. and Granum E., Cytometry, 1989, 10, Page(s):242-255 • Profile and feature extraction from chromosomes, Ritter, G.; Schreib, G.; Pattern Recognition, 2000. Proceedings. 15th International Conference on Volume 2, 3-7 Sept 2000 Page(s):287 – 290 • A mathematical model for classical chromosome identification using the logical combinatory approach, Ortiz-Posadas, M.R.; Pantaleao, C.H.Z.; Bose, R.; Engineering in Medicine and Biology Society, 2003. Proceedings of the 25th Annual International Conference of the IEEE Volume 2, 17-21 Sept. 2003 Page(s):1342 - 1345 • Chromosome classification for karyotype composing applying shape representation on wavelet packet transform, Guimaraes, L.V.; Schuck, A.; Elbern, A.; Engineering in Medicine and Biology Society, 2003. Proceedings of the 25th Annual International Conference of the IEEE Volume 1, 17-21 Sept. 2003 Page(s):941 – 943 • Identification of human chromosome by using integrated density profile, Granlund H. G., IEEE Trans. Biomed. Eng., vol. BME-23,pp. 182-192, 1976 • Mutual-information-based registration of medical images: a survey, Pluim, J.P.W.; Maintz, J.B.A.; Viergever, M.A.; Medical Imaging, IEEE Transactions on Volume 22, Issue 8, Aug. 2003 Page(s):986 – 1004
Referâncias (principais - 2) Basic Pathology, Vinay, Kumar, Rmazi, S., Cotran and Stanley, L., Robbins, Saunders, 2003, 7th Edition Cancer Cytogenetics: Methods and Protocols (Methods in Molecular Biology), John Swansbury, Humana Press, 2003 Artificial Intelligence: A Modern Approach, Stuart Russell and Peter Norvig, Prentice Hall, 2003, 2nd Edition Introduction to the Human Body, Tortora, J., G., Grabowski, R., S., John Wiley & Sons, 2001,5th Edition Automatic landmark detection on chromosomes' images for feature extraction purposes, Moradi, M.; Setarehdan, S.K.; Ghaffari, S.R.; Image and Signal Processing and Analysis, 2003. ISPA 2003. Proceedings of the 3rd International Symposium on Volume 1, 18-20 Sept. 2003 Page(s):567 – 570 Analyzing Chromosomes, Czepulkowski, B., BIOS, 2001 Human Cytogenetics, A Practical Approach, Volume II, Rooney and Czepulkowski, IRL Press, 2nd Edition Practical Handbook on Image Processing for Scientific and Technical Applications, Bernd Jähne, University of Heidelberg, CRC Press, 2nd Edition, 2004