160 likes | 300 Views
1. Pablo Medina, 2. Victor Bucheli, 3. Paulo Orozco, 4. Roberto Zarama. Análisis de textos por medio de herramientas estadísticas y de redes complejas. CEIBA. Redes + estadística:. Software y métodos comput. (Filtrado de palabras no claves). Textos (Información estaísitca medible):
E N D
1. Pablo Medina, 2. Victor Bucheli, 3. Paulo Orozco, 4. Roberto Zarama Análisis de textos por medio de herramientas estadísticas y de redes complejas CEIBA
Redes + estadística: Software y métodos comput. (Filtrado de palabras no claves) Textos (Información estaísitca medible): • Palabras frecuentes (Conceptos) • Ubicación dentro de un texto • etc Redes (Usa info. estad. para visualizar): • Relaciones entre palabras • Centralidad e influencia de palab. • Comunidades de palabras Resultado: • Mejor comprensión del texto • Interpretación • Conceptos inmersos dentro del texto empleados por autor • Información más allá del hilo conductor
Análisis del output (Información estadística) Diadas (palabras continuas) más concurridas en un texto:
Análisis del output (Información estadística) Ubicación dentro de textos de una plabra dada y compararlos Documento 1 Aparición en el texto Aparición concurrida Documento 2 Fracción del texto
Análisis del output (Redes): Entrada de Info. Estad. para construir la red del doc. MANE Comunidad más grande Medida Atributo Grado Nodal Tamaño nodo Comunidad Color Dirección red No dirigida Conexidad Disconexa Componente más grande conectado
Ejemplo Una clasificación de universidades con base en algunos resultados de su investigación* Scientometrics (2012) 91:369–382 DOI 10.1007/s11192-012-0627-7 Growth of scientific production in Colombian universities: an intellectual capital-based approach Victor Bucheli • Adriana Dıaz • Juan Pablo Calderon •Pablo Lemoine • Juan Alejandro Valdivia • Jose Luis Villaveces Roberto Zarama
Crecimiento Exponencial Colombia Crecimiento Lineal Colombia