450 likes | 590 Views
Information Science 2005. Tefko Saracevic, PhD School of Communication, información and Library Studies Rutgers University New Brunswick, New Jersey USA http://www.scils.rutgers.edu/~tefko. Organizaci ó n de la presentaci ó n. El paisaje – problemas , soluciones, lugar social
E N D
Information Science 2005 Tefko Saracevic, PhD School of Communication, información and Library Studies Rutgers University New Brunswick, New Jersey USA http://www.scils.rutgers.edu/~tefko
Organización de la presentación • El paisaje – problemas, soluciones, lugar social • Estructura –áreas principales de investigación y práctica • Tecnología – Recuperación de la información – la mayor parte • Información – representación; bibliometría • Gente – usuarios, uso, búsqueda, contexto • Ruptura paradigmática– distanciamiento de las áreas de investigación • Bibliotecas digitales – ¿de quiénes son? • Conclusiones– grandes cuestiones para el futuro
Parte 1. El gran paisajeProblemas abordados • Un poco de historia: Vannevar Bush (1945): • Definió el problema como“... La tarea masiva de hacer más accesible el enorme repositorio del conocimiento.” • Un problema que sigue con nosotros y sigue creciendo. Tabla de contenidos
… solución • Bush sugirió una máquina: “Memex ... Asociación de ideas … que duplique los procesos mentales artificialmente.” • Una solución tecnológica al problema • Todavía con nosotros: determinante tecnológico
En la base de la Ciencia de la Información: un problema Intentar controlar el contenido en: • La explosión de la información • El crecimiento exponencial de los artefactos informativos, si no de la propia información Y hoy ADEMÁS • La explosión de la comunicación • El crecimiento exponencial de los medios y modos de comunicación, transmisión, acceso y uso de la información
Aplicar la tecnología para solucionar los problemas en el uso efectivo de la información PERO: Desde una perspectivaHUMANA & SOCIAL Y no solo TECNOLOGICA solución tecnológica, PERO …
Gente Información Tecnología o un modelo simbólico
Problemas & soluciones:CONTEXTO SOCIAL • Práctica profesional E investigación científica relacionada con: Comunicación efectiva de los registros del conocimiento - ‘literatura’ - entre humanos en el contexto de las necesidades y usos sociales, organizaciones e individuales • Con la ventaja de las nuevas tecnologías de la información
Características generales • Interdisciplinariedad - relaciones con un conjunto de campos, algunos más o menos predominantes • Imperativo tecnológico - fuerza impulsora como en muchos campos modernos • Sociedad de la información - contexto social y papel social en su evolución - compartido con muchos otros campos Tabla de contenidos
Parte 2. EstructuraComposición del campo • Como muchos campos, la ciencia de la información tiene muchas áreas diferentes de concentración y especialización • Que cambian y evolucionan a lo largo de tiempo • se acercan y se separan • se ignoran, más o menos, entre sí
más importante aún, las diferentes áreas… • reciben más o menosfinanciación & énfasis • produciendo grandes desequilibrios en el trabajo y el progreso • atrayendo diferentes audiencias y campos • esto incluye • vastas diferencias en los niveles de soporte para la investigación e • inversiones y aplicaciones enormes en el campo comercial
Información o Gente o ¿Cómo encontrar una estructura? descomponiendo áreas y esfuerzos en la investigación y práctica, enfatizando Tecnología Tabla de contenido
Parte 3. Tecnología • Identificada con la recuperación de información (RI) • con mucho se lleva los mayores esfuerzos e inversiones • es internacional y global • los intereses comerciales subyacentes son grandes y crecientes
Recuperación de información – definición & objetivo “ RI: ... aspectos intelectuales de la descripción de información, ... búsqueda, ... & sistemas, máquinas...” Calvin Mooers, 1951 • ¿Cómo proporcionar a los usuarios información relevante de forma efectiva? Para ese fin: 1. ¿Cómo organizar la información intelectualmente? 2. ¿Cómo especificar la búsqueda & la interacción intellectualmente? 3. ¿Qué técnicas & sistemas usar efectivamente?
Investigación contemporánea en RI • Ahora principalmente dentro de la Informática • e.g Special Interest Group on RI, Association for Computing Machinery (SIGIR,ACM) • Extendida globalmente • v.g. grandes comunidades de investigación han emergido en China, Corea y Singapur • Sacada fuera de la Ciencia de la Información - “todo el mundo hace recuperación de información” • minería de datos, aprendizaje automático, procesamiento del lenguaje natural, inteligencia articial, gráficos por ordenador …
Text REtrieval Conference (TREC) • Principal esfuerzo de investigación experimental • Comenzó en 1992, ahora probablemente terminando • “para soportar la investigación de la comunidad RI proporcionando la infraestructura necesaria para la evaluación en gran escala” • Métodos • proporciona grandes bases de documentos, consultas, juicios de relevancia y análisis comparativos • usando esencialmente la metodología que uso Cranfield en los sesenta • organizada en varios temas que han ido evolucionando
El impacto de TREC • Internacional – gran impacto en crear comunidades de investigación • Conferencias anuales • informes, intercambio de resultados, cooperación • Resultados • principalmente en informes, disponibles en http://trec.nist.gov/pubs.html • estados de la cuestión • pero solo una parte publicada en revistas y libros
Genómicacon 4 sub líneas HARD (High Accuracy Retrieval from Documents) Novelty (nueva información no redundante) Respuestas a consultas Robust (mejorando temas en los que la recuperación es deficiente) Terabyte (colecciones muy grandes) Web Líneas anteriores: ad-hoc (1992-1999) routing (92–97) interactive (94-02) filtering (95-02) cross language (97-02) speech (97-00) Spanish (94-96) video (00-01) Chinese (96-97) query (98-00) y unas pocas más que solo tuvieron dos años de duración Líneas TREC 2004103 grupos de 21 países
Ampliación del RI – siempre cambiando y con nuevas áreas añadidas • RI a través de diferentes idiomas (CLIR) • Procesamiento del lenguaje natural (NLP RI) • RI de música (MIR) • Imagen, vídeo y multimedia • Lenguaje oral • RI en Bioinformática y Genómica • Resumen; extracción de texto • Respuesta de consultas • Interacción hombre/máquina • XML RI • RI en la Web; buscadores web • RI en contexto – gran área para los grandes buscadores e investigación más reciente
RI comercial • Buscadores basados en la RI • Pero añadiendo muchas elaboraciones e innovaciones significativas • gestionando enormes cantidades de páginas rápidamente • interesantes juegos de algoritmos de spamming & page rank –IR competitivo- combate de algoritmos • incluyendo el contexto en la búsqueda • Extensión e impacto mundial • unos 2000 buscadores en más de 160 países • El inglés fue dominante, pero ya no
RI comercial : “un mundo feliz” • Grandes inversiones & sector económico • Esperanzas de grandes beneficios, aunque todavía cuestionables • Conduce a RI propietaria y secreta • Con un fichaje agresivo de los mejores talentos • Nuevos centros comerciales de investigación en diferentes países (v.g. MS en China) • La financiación de la investigación académica está cambiando • Fuga de cerebros de la academia • Los motores de búsqueda comerciales tienen que hacer frente a grandes retos • Perspectiva de: Amit Singhal
La RI puso en marcha con éxito • La emergencia y desarrollo de la INDUSTRIA de la información • La evolución de la CI como PROFESIÓN y CIENCIA • Muchas APLICACIONES en muchos campos • Incluyendo la Web – motores de búsqueda • Mejoras en la INTERACCIÓN PERSONAS - COMPUTADORAS • La evolución de la INTEDISCIPLINARIEDAD La RI tiene una larga y orgullosa historia Tabla de contenidos
Parte 4. Información • Varias áreas de investigación • Como un fenómeno básico – no demasiado progreso • Medidas como las de Shannon no han tenido éxito • Concentrada en sus manifestaciones y efectos • No hay progreso reciente en este tema de investigación básica • Representación de la información • Gran área conectada con RI, biblioteconomía • Metadatos • Bibliometría • Estructuras de la literatura
¿Qué es la información? Bien comprendida intuitivamente, pero mal formulada formalmente • Han emergido varios puntos de vista y modelos • Shannon: fuente - canal -destino • señales no son contenido – no es realmente aplicable, a pesar de muchos intentos • Cognitivo: cambios en las estructuras cognitivas • Procesamiento y efectos del contenido • Social: contexto, situación • Búsqueda de información, tareas
La información en la Ciencia de la Información:Tres sentidos(del más estrecho al más amplio) • información en términos de la decisión, sin tener en cuenta prácticamente los procesos cognitivos • señales, bits, datos simples - v.g.. Teoría de la Información (Shanon), Economía, • información incluyendo el procesamiento cognitivo y la comprensión • comprensión, emparejamiento de textos, Brookes • información también en relación al contexto, la situación, el problema a resolver • USUARIOS, USO, TAREA Para la Ciencia de la Información (incluyendo la recuperación de información): la tercera interpretación, la más amplia, es necesaria
Parte 5. Gente • Servicios profesionales • en la organización – moviéndose hacia la gestión del conocimiento y la inteligencia competitiva • en la industria – vendedores, agregadores, Internet, • Investigación • Usuarios & estudios de usuario • Estudios de interacción • Ampliando el campo a los estudios de búsqueda de la información, contexto social, colaboración • Estudios de relevancia • Social informatics
Uso y estudios de usuarios • El área más antigua • cubre muchos temas, métodos y orientaciones • muchos estudios están relacionados con la RI • v.g. búsqueda, multitarea, visualización, navegación • Introduciéndose en los estudios de usuarios de la web • Estudios cuantitativos y cualitativos • Emergencia de la webmetría
Interacción • El modelo tradicional de la RI se concentra en el emparejamiento, pero no en el lado del usuario y la interacción • Diversos modelos de interacción han sido sugeridos • Ingwersen’s cognitive, Belkin’s episode, Saracevic’s stratified model • Difícil de realizar experimentos y de confirmarlos • Se consideran clave para proporcionar • las bases de un diseño mejor • la comprensión sobre el uso de los sistemas • Las interacciones en la Web: una nueva área clave
Búsqueda de información • Se concentra en el contexto más amplio, no solo en la RI o la interacción: en la gente según se comporta en la vida y el trabajo • Ha proporcionado varios modelos • v.g. Las etapas de Kuhlthau’s stages, o el modelo basado en tareas de Järvelin • Incluye estudios sobre la vida real, construcción del sentido, localización de la información, vida laboral, descubrimiento de información • Basado en el concepto de la construcción social de la información Tabla de contenidos
Parte 6. Ruptura del paradigma entre sistemas y gente • Desde principios de los años ochenta se ha producido una ruptura entre dos enfoques: centrado en los sistemas • algoritmos, TREC, motores de búsqueda • continua el modelo tradicional de RI centrado en los humanos (usuarios) • cognitivo, situacional, estudios de usuarios • modelos de interacción, algunos comenzados en TREC
Lado humano vs. sistema • Lado humano (usuario) : • a menudo crítico, incluso unilateral • propone un mantra de implicaciones para el diseño • pero no proporciona resultados en la práctica • Lado del sistema: • ignora los estudios H • ‘dinos que hacer y lo haremos’ • El tema NO es H o S • ni siquiera menos H vs. S • sino como pueden H y S trabajar juntos • uno de los principales retos para el futuro
Llamadas vs soporte • Muchas llamadas a un diseño, enfoque y evaluación centrados en el usuario/humano • Conjunto de obras que lo discuten, pero pocas proponen soluciones concretas • Sin embargo, la mayor parte del soporte se va al trabajo de sistemas • en la era digital el soporte es para lo digital • Un intento reciente de combinar ambas perspectivas: Book: Ingerwersen, P. and Järvelin, K. (2005). The turn: Integration of información seeking and retrieval in context. Springer. Tabla de contenidos
Parte 7.Bibliotecas digitales • Área ENORME & creciente • Área “caliente” in I&D • con un número importante de becas y proyectos en los EE. UU., Europa y otros países • pero en ellos lo “DIGITAL” es grande & “bibliotecas“ pequeño • Área “caliente” en la práctica • Se están construyendo colecciones digitales y bibliotecas híbridas • Existen muchos proyectos por todo el mundo
Problemas técnicos • Sustanciales - mayores y más complejos que lo anticipado: • representación, almacenamiento y recuperación de los objetos bibliotecarios digitales • particularmente si fueron originalmente diseñados para ser impresos y luego se digitalizaron • gestionar operacionalmente grandes colecciones - temas de escala • tratar con colecciones diversas y distribuidas • interoperabilidad • asegurar la preservación y la persistencia • incorporar la gestión de derechos
EEUU: Digital Library Initiatives • Consorcios dependientes de la financiación de la National Science Foundation • DLI 1: 1994-98, 3 agencias, $24M, 6 grandes proyectos • DLI 2: 1999-2006, 8 agencias, $60+M, 77 proyectos grandes y pequeños en varias categorías • proyectosinternacionales conjuntos • National Science, Mathematics, Engineering, and Technology Education Digital Library • cerca de 200 proyectos de demostración & desarrollo • La financiaciónterminada en 2005 • ahora desviada a áreas relacionadas
Unión europea: DELOS • DELOS Network of Excellence on Digital Libraries • muchos proyectos a lo largo de la Unión Europea • de carácter muy tecnológico • muchas reuniones y talleres • hasta cierto punto recuerda a las DLIs de los EE. UU: • bien financiados, a largo plazo • a diferencia de lo que ocurre en los EE. UU. el soporte continúa
Temas de investigación • comprender los objetos en las BD • representados en muchos formatos • metadatos, catalogación, indización • conversión, digitalización • organización de grandes colecciones • gestión de colecciones, escalamiento • preservacion, archivo • interoperabilidad, estandarización • acceso, uso, búsqueda • búsqueda federada en colecciones distribuidas • evaluación de bibliotecas digitales
Proyectos de BD en la práctica • Muy orientados a las instituciones y sus misiones • en bibliotecas, pero también en otras • museos, sociedades, gobiernos, empresas • en muchas variantes • Extendidos globalmente • incluyendo la digitalización • U California, Berkeley’s Libweb“lista más de 7300 páginas de bibliotecas de más de 125 países” • Extendiéndose a gran velocidad • a menudo a costa de otros recursos
¿En conexión? • La investigación y la práctica actual en BD son desarrolladas actualmente • mayormente de forma independiente una de otra • informando mínimamente a la otra parte • y con una conexión mútua ligera o inexistente • Son en el momento actual universos paralelos con escasas conexiones e interación • no es bueno ni para la investigación ni para la práctica Tabla de contenido
Parte 8. ConclusionesLas contribuciones de la CI • Puso en marcha la gestión de la información en la sociedad • Desarolló un cuerpo organizado de conocimiento y de competencias profesionales • Aplicó la interdisciplinariedad • Alcanzó un estado de madurez • penetró muchos campos y actividades humanas • Acentuó el factorHUMANO en la interacción hombre-máquina
Retos • Ajustarse al papel organizacional y social creciente y cambiante de la información y de la infraestructura informacional relacionada • Jugar un papel positivo en la globalización de la información • Responder al imperativo tecnológico en términos humanos • Responder a los cambios que se han producido desde la explosión de la información a la de la comunicación • convirtiendo las propias experiencias en soluciones, especialmente en el campo de la web • Unir competitividad y calidad • Reunir lo DIGITAL con las BIBLIOTECAS
Momento crítico • La CI está en un momento crítico de su evolución • Muchos grupos y campos… se están desplazando al campo de la información • fuerte competencia • entrada de jugadores poderosos • lucha por el control • Para ser un jugador de primera, la CI necesita progresar en: • investigación & desarrollo • competencias profesionales • esfuerzos educacionales • relaciones interdisciplinares • Es necesaria una re-examinación
Gracias Thank you Hvala Danke Merci Grazie
Bibliografía Bates, M. J. (1999). Invisible Substrate of información Science. Journal of the American Society for información Science,50, 1043-1050. Bush, V. (1945). As We May Think. Atlantic Monthly, 176, (11), 101-108. Available: http://www.theatlantic.com/unbound/flashbks/computer/bushf.htm Hjørland, B. (2000). Library and información Science: Practice, Theory, and Philosophical Basis. información Processing & Management, 36 (3), 501-531. Pettigrew, K.E. & McKechnie, L.E.F. (2000). The use of theory in información science research. Journal of the American Society for información Science and Technology, 52 (1), 62 - 73. Saracevic, T. (1999). información Science. Journal of the American Society for información Science, 50 (9) 1051-1063. Available: http://www.scils.rutgers.edu/~tefko/JASIS1999.pdf Saracevic, T. (2005). How were digital libraries evaluated? Presentation at the course and conference Libraries in the Digital Age (LIDA)30 May-3 June 2005, Dubrovnik, Croatia. Available: http://www.scils.rutgers.edu/~tefko/DL_evaluation_LIDA.pdf Webber, S. (2003) información Science in 2003: A Critique. Journal of información Science, 29, (4), 311-330. White, H. and Mc Cain, K. (1998). Visualizing a Discipline: An Author Co-citation Analysis of información Science 1972-1995. Journal of the American Society for información Science, 49 (4), 327-355.