1 / 56

Lexicografía académica

Lexicografía académica. Presente y futuro. Modernización tecnológica. Informatización del fichero. 1993 . Se inicia el proceso de informatización del fichero general que servía como fundamento para la preparación de los diccionarios.

yuri
Download Presentation

Lexicografía académica

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Lexicografía académica Presente y futuro

  2. Modernización tecnológica

  3. Informatización del fichero • 1993. Se inicia el proceso de informatización del fichero general que servía como fundamento para la preparación de los diccionarios. • Los ficheros léxicos, aunque de gran valor filológico, resultaban insuficientes para documentar con rapidez y precisión los usos lingüísticos de la comunidad hispanohablante.

  4. Corpus electrónicos • 1995. El proceso de informatización de ficheros es sustituido por la construcción de un gran banco de datos basado en corpus. • Ventajas: • -Acceso inmediato a grandes conjuntos de materiales. • -Documentación por frecuencia estadística. • -Informaciones utilísimas sobre el uso.

  5. Corpus de referencia • En lingüística, se llama corpus a un conjunto formado por miles de textos (novelas, obras de teatro, guiones de cine, noticias de prensa, ensayos, transcripciones de noticiarios radiofónicos o televisivos, transcripciones de conversaciones, discursos, etc.) y cientos de millones de formas. Son empleados habitualmente para conocer el significado y características de palabras, expresiones y construcciones a partir de los usos reales registrados. Dado el tamaño que poseen, los corpus tienen que estar en formato electrónico. • Un corpus general (llamado de referencia) tiene como propósito básico el de servir para obtener las características globales que presenta una lengua en un momento determinado de su historia. En el caso del español actual, el corpus debe contener textos de todos los tipos y también de todos los países que constituyen el mundo hispánico.

  6. BANCO DE DATOS DE LA REAL ACADEMIA ESPAÑOLA • CORDE (Corpus diacrónico del español). • CREA (Corpus de referencia del español actual). • CORPES (Corpus del español del siglo XXI).

  7. Nuevos corpus • Corpus escolar. • Corpus jurídico (CJ). • Corpus científico-técnico (CCT). • Corpus de la Gramática (CGRAE) • Corpus del Diccionario histórico (CDH)

  8. CREACorpus de referencia del español actual • Medio:El 90% corresponde a la lengua escrita y el 10% a la lengua oral. • Cronológico: El corpus está dividido en períodos de cinco años: 1975-1979; 1980-1984; 1985-1989; 1990-1994; 1995-1999, 2000-2004. • Geográfico:El 50% del material del CREA procede de España, y el otro 50%, de América. • Temático: Cada grupo de materiales (libros y prensa, miscelánea y oral) se clasifica de modo independiente. • Cantidad: 160 millones de registros. • Uso. Diferentes diccionarios académicos.

  9. CREA • Campos temáticosSe han establecido seis áreas generales a las que deben asignarse cada uno de los textos del corpus. Cada  una se estructura en áreas temáticas. Son criterios de búsqueda que pueden seleccionarse en la aplicación. • Adquisición de textos • Escaneado: programa de reconocimiento óptico de caracteres (ROC). • La prensa más reciente se descargó en formato electrónico. • La prensa de los años 70 y 80 se procesó mediante un programa de dictado automático,. • Miscelánea: bien manualmente (propaganda, prospectos..), bien en formato electrónico (correos electrónicos, blogs…). • Además, el CREA integra materiales procedentes de otros corpus.

  10. Aplicaciones del CREA • Diccionarios académicos: utilizan diariamente los materiales del corpus, cuyas posibilidades de consulta permite que la información registrada en ellos resulte ajustada a la realidad de la lengua. • El CREA es el punto de partida forzoso para investigaciones sobre el español actual, principalmente lingüísticas, pero también de campos tan dispares como el de la publicidad, la terminología o la sociología, así como para la elaboración de numerosos productos derivados: gramáticas, diccionarios, tesauros, correctores ortográficos, métodos de didáctica del español y aplicaciones de traducción automática, entre otros.

  11. CORDECorpus diacrónico del español • Ámbito. El CORDE es un corpus textual de todas las épocas y lugares en que se habló español. • Cantidad. Cuenta con 300 millones de registros. Es el mayor conjunto de registros léxicos de la historia de la lengua española. • Tipología textual. El corpus recoge textos escritos en prosa y verso y, dentro de cada modalidad, en textos narrativos, líricos, dramáticos, científico-técnicos, históricos, jurídicos, religiosos, periodísticos, etc. Se pretende recoger todas las variedades geográficas, históricas y genéricas.

  12. CORPES XXICorpus del español del siglo xxi • Es un corpus de referencia. • Textos. Seleccionados de acuerdo con una serie de parámetros y son tratados con un sistema de codificación. • Aprobación. Congreso celebrado en Medellín en marzo de 2007. • Tipos y países. De todos los tipos y todos los países con un volumen de 25 millones de formas por año. • Primera fase (hasta diciembre de 2014): textos entre 2001 y 2012. • La primera fase: 300 millones de formas. • En diciembre de 2013: 160 millones de formas. • La versión provisional se presentó en el VI Congreso Internacional de la Lengua Española (Panamá, octubre de 2013). • Disponible a través de la aplicación de consulta.

  13. Departamento de Español al Día • Servicio de consultas. -Por formulario. La Academia tiene abierta línea directa a través de Internet para cuantos usuarios deseen plantear dudas, problemas, sugerencias… Actualmente se atienden más de cien consultas diarias. Este servicio tiene una importancia grande, pues a través de las consultas se detectan fallos, lagunas, ambigüedades, contradicciones, indeterminaciones, vaguedades… de las obras académicas. -En Twitter. Más de seiscientos mil seguidores. • Diccionario panhispánico de dudas. • Ortografía. • Correcciónde las obras académicas.

  14. Diccionario panhispánico de dudas (2005) • Constituye una aplicación de desarrollo de largas investigaciones sobre los diferentes bastiones de la norma, investigación acelerada desde la creación del Servicio de consultas del Departamento de ‘Español al Día’ de la RAE.

  15. Estructura del DPD • I. Diccionariopropiamente dicho, formado por las distintas entradas ordenadas alfabéticamente. • II. Apéndices: • Modelos de conjugación verbal.         Lista de abreviaturas.         Lista de símbolos alfabetizables.         Lista de símbolos o signos no alfabetizables.         Lista de países y capitales, con sus gentilicios. • III. Glosario de términos lingüísticos: aclara los conceptos gramaticales usados en el diccionario. •  IV. Fuentes citadas:datos identificativos de las fuentes citadas en los ejemplos de uso.

  16. Tipos de artículos • Artículos temáticos.Tratan cuestiones generales, como las normas de acentuación gráfica, el uso de los signos de puntuación o de las mayúsculas, las reglas de formación del femenino o del plural, el dequeísmo, la concordancia, etc. Enversalita negrita. • Artículos no temáticos. Son los referidos a palabras concretas que plantean algún tipo de duda en lo que respecta, por ejemplo, a su acentuación, su forma gráfica, su forma de plural o de femenino, su régimen preposicional, etc. El lema de estos artículos aparece impreso en redonda negrita, salvo extranjerismos crudos (encursiva negrita).

  17. Diccionario del estudiante (2005) • Obra lexicográfica de nueva planta y basada en corpus juvenil de lengua, destinada a los estudiantes. Constituyó una aportación novedosa y de gran calidad.

  18. Diccionario del estudiante • Dirigido a los alumnos hispanohablantes entre los doce y los dieciocho años, • Contiene más de 40 000 voces y locuciones del español. • Vocabulario que debe manejar un estudiante de secundaria y bachillerato. • Cada definición va acompañada de ejemplos basados en el uso real. • Elaborado sobre un banco de datos léxico procedente de los libros de texto y de consulta de España y de América. • Es un diccionario de nueva planta: todas las voces recogidas y cada una de sus definiciones han sido redactadas de primera mano y sometidas a una metodología nueva en forma adecuada a las necesidades de los estudiantes a quienes va dirigida la obra. • Dos ediciones : la primera se presentó el 15 de septiembre de 2005. En 2011 se publicó una segunda edición, que sumó a la anterior una serie de voces y acepciones nuevas.Revisión ortográfica.

  19. Diccionario práctico del estudiante • Versión del Diccionario del estudiantedirigida a los alumnos de institutos y colegios de los países hispanoamericanos • Se prescinde de voces no empleadas allí. Ejemplos adaptados al uso americano con un lenguaje actual y de fácil comprensión. • Contiene más de 30 000 palabras y locuciones del léxico vivo del español general, y en particular de América. Se selecciona el vocabulario fundamental que debe manejar un estudiante de enseñanza secundaria, desechando los usos anticuados y puramente nacionales. • Dos ediciones • -La primera: 2007 (Congreso Internacional de la Lengua Española, Cartagena de Indias, Colombia). • -En 2012 se publicó una segunda edición. Sumó voces y acepciones nuevas, aprobadas para la próxima edición del DRAE(2014).

  20. DICCIONARIO DE AMERICANISMOS

  21. Diccionario de americanismos (2011) • La colaboración de la RAE y de la Asociación de Academias cristalizó en la concreción de un largo proyecto diseñado a finales del siglo XIX: un diccionario del español hablado en los países americanos. Participaron todas las Academias coordinadas por D. Humberto López Morales. El resultado ha sido una obra esencial para conocer la lengua del mundo hispánico.

  22. DRAE • Edición: cerrada el 14 de marzo de 2014. • Publicación: octubre 2014, coincidiendo con el tricentenario. • Objetivos: enriquecerlo, modernizarlo y hacerlo más coherente. • Armonización: Nueva gramática de la lengua española, Ortografía de la lengua española y Diccionario de americanismos. • Regularización de las marcas geográficas americanas. • Revisión del tratamiento de los extranjerismos. • Incrementado de entradas: incorporación de neologismos y a la actualización del léxico de diversos campos temáticos. • Técnica lexicográfica: cambios en la estructura de los artículos con el fin de que sean más claros y coherentes. • Versión en línea : se elabora una nueva aplicación de consulta, que amplíe las posibilidades de búsqueda y permita la navegación dentro del Diccionario.

  23. NUEVO DICCIONARIO HISTÓRICO DE LA LENGUA ESPAÑOLA

  24. Antecedentes • 1996: Suspensión del Diccionario histórico. • 2001: Nuevo tesoro lexicográfico de la lengua española. Recopila 216 diccionarios del español, desde Nebrija. Ediciones conjuntas: -Léxico hispánico primitivo (siglos viii al xii). Con la fundación Menéndez Pidal. -Nuevo tesoro lexicográfico del español (s. xiv-1726). Lidio Nieto y Manuel Alvar Ezquerra.

  25. Fundación Lapesa • 2005. Se crea la Fundación Instituto de Investigación Rafael Lapesa para el Nuevo diccionario histórico de la lengua española. • Director: José Antonio Pascual. • 2006. Proyecto prioritario en el ámbito de las humanidades (presidente J.L. Rodríguez Zapatero).

  26. CDH (Corpus del Nuevo diccionario histórico) • Se ha confeccionado como punto de partida para la elaboración del Nuevo diccionario histórico. Cuenta con más de 53 millones de ocurrencias (32 pertenecen a textos españoles y más de 20 millones a obras americanas). Los textos se han sometido a un minucioso proceso de anotación lingüística esencial en el trabajo lexicográfico. Se ha desarrolló una modélica interfaz de consulta aplicable a otros corpus. Dirigido por el académico José Antonio Pascual.

  27. Redacción y herramienta • El CDH se ha terminado en el 2009. • Se ha iniciado la fase de redacción y de confección de la herramienta. • Se elaboran las versiones parciales a medida que se perfecciona la herramienta provisional. • Se pueden consultar unas 500 voces pertenecientes a tres campos semánticos: instrumentos musicales, armas y enfermedades. • Será modelo para próximos diccionarios.

  28. Plataforma tecnológica de la lengua española • Es un banco de datos, un conjunto de recursos lingüísticos para la comunidad hispanohablante. • Es un banco de datos inmenso en el que se integran todas las obras (diccionarios, gramáticas, ortografías), todos los ficheros, todos los fondos documentales y todos los corpus de de la RAE. Integra los corpus existentes y las ampliaciones que se realizarán en los próximos años. • Es un banco de datos unificado. Todos los datos del banco se verán sometidos a un procesamiento minucioso, integrado, interrelacionado y unificado. Esto permitirá una potente conexión interna, una mejor interrelación con datos de otras fuentes externas (bibliográficas, geográficas, estadísticas…) y una mejor adaptación a las herramientas tecnológicas. A la vez, este avance cualitativo que permitirá un enriquecimiento exponencial de los resultados.

  29. Objetivos • Facilitar un acceso inteligente tanto a recursos lingüísticos como a nuevos métodos de procesamiento e inferencia de conocimiento lingüístico. • Propiciar la generación de nuevo conocimiento de la lengua española y mejorar su competitividad no solo en el ámbito cultural, sien el mundo científico y tecnológico • Situar con estos recursos a la lengua española en el nuevo mundo emergente, de manera que salga de la situación de desventaja en la que se halla frente a otras lenguas que disponen ya de dichos medios. • Promover la creación de una industria basadas en esta tecnología. • Ayudar a colectivos especializados (investigadores, universidades, etc.) en su labor de investigación pura y facilitarles el acceso al conocimiento que existe y que se acumula en torno a la lengua española.

  30. Objetivos de la PTLE • Facilitará a sectores industriales y colectivos (investigadores, docencia, gran público, etc.) todos los recursos léxicos de la lengua española que puedan requerir para desarrollar sus proyectos con contenido filológico, lingüístico, lexicográfico y bibliográfico o en general para satisfacer sus necesidades: • Creando dichos recursos cuando no existan • Procesando y consolidando los existentes en la RAE • Enlazando con otras fuentes de recursos externas a la RAE • Ofrecerá el acceso a dichos recursos a través de aplicaciones avanzadas y flexibles, dotadas de un amplio menú de funcionalidades • Facilitará soporte y recursos para diseño y desarrollo de aplicaciones industriales relacionadas con la lengua española, como correctores ortográficos, gramaticales y de estilo, traductores automáticos, etc. • Innovará y unificará los procesos de edición y producción de diccionarios y otras obras de referencia del español. • Atenderá las necesidades docentes y del público general en materia lingüística mediante consultas avanzadas a diccionarios, consultas gramaticales y ortográficas, consultas unificadas, etc.

  31. Principios • 1.1. La PAE es una infraestructura de recursos lingüísticos del español de todo el mundo. La Academia se propone, con la ayuda de este proyecto, la creación de un centro de recursos lingüísticos del español de todo el mundo. Para la creación de esta infraestructura ha de colaborar con la red de Academias de la Lengua asociadas en ASALE y con muchas universidades y centros de investigación del mundo hispánico. • 1.2. La PAE es una infraestructura de recursos lingüísticos para los estudiosos del español, así como de las industrias de la lengua en todo el mundo. Se abordará la creación de una infraestructura necesaria para el funcionamiento de los equipos de investigación y de las industrias de la lengua, pero que ni los equipos universitarios ni las empresas pueden abordar por sí solas. La línea que se seguirá es la adoptada hasta el presente en los proyectos otorgados a la RAE: se recibe la subvención, se construye el recurso y se pone a disposición de los usuarios.

  32. Estructura PTLE : • Banco de datos Unificado (BDU). Capa que contiene las bases de datos , repositorio de recursos lingüísticos y conectores con otras fuentes léxicas • Capa de Tecnologías Lingüísticas, desde donde se ofrecen determinadas funcionalidades especiales (consulta avanzada al diccionario, corrección ortográfica, etc.) • Capa de Consulta, que facilitará el acceso a los usuarios al Banco de datos Unificado, permitiendo gran cantidad de criterios de búsqueda (procedencia del texto, naturaleza, autor, etc.) • Capa de Servicio, desde donde se realizarán todas las funciones relacionadas con la gestión y administración de usuarios (identificación, gestión de perfiles, gestión de incidencias, informes de uso, etc.). Soportará además los interfaces (API´s) sobre los que agentes externos podrán desarrollar sus propias aplicaciones, productos y servicios. • Entorno de Redacción. Aplicación de redacción específicamente diseñada para la edición de diccionarios y que integrará además interfaces de conexión estándares con el mundo exterior. Sobre esta capa se desarrollarán también, como parte del proyecto, dos aplicaciones tipo que representarán una perspectiva diacrónica de la lengua (Diccionario Histórico) y otra sincrónica (Diccionario Fundamental)

  33. Banco de datos unificado • Fondos lexicográficos: Todos los diccionarios de la RAE. • Obras académicas: Gramática, Ortografía y Diccionario panhispánico de dudas. • Fondos documentales y bibliográficos: archivo y bibliotecas (más de doscientos mil libros y dos millones de documentos) • Fichero general: fichero con más de diez millones de papeletas. Biblioteca del léxico e inventario de recursos lingüísticos o mapa de enlaces a fuentes lingüísticas externas a la RAE • Repositorio de consultas (millones de consultas mensuales) que la RAE recibe a través de distintos medios (portal web, correo, twitter, etc) • Corpus:

  34. Vigor del español • Es la segunda lengua más hablada (unos 495 millones). • Es el segundo idioma en comunicación internacional. • Es la tercera lengua más utilizada en internet (con un crecimiento del 807 % entre 200º y 2011), • Es una de las primeras en número de países donde se habla y en extensión geográfica • Presenta unas perspectivas de crecimiento superiores a las del chino y del inglés, tanto por razones demográficas como por el número de quienes la estudian como segunda lengua. • Se considera que para 2030 el 7,5 % de la población mundial hablará español y que hacia el 2050 Estados Unidos será el primer país hispanohablante del mundo

  35. Vigor del español (2) • Es un idioma relativamente homogéneo. • Es una lengua geográficamente compacta. • Muchospaíses hispanohablantes ocupan territorios contiguos. • Los territorios hispánicos ofrecen un índice de comunicatividad muy alto. • Tiene carácter oficial y vehicular en 21 países. • Es una lengua en expansión. • Es una de las grandes lenguas de cultura, con una gran proyección internacional en el mundo de la literatura, de la música, de la pintura, de la arquitectura y de la moda. • Los países hispanoamericanos se hallan en un período de expansión económica.

  36. Desfase del español en la ciencia • España ocupa el décimo lugar en la clasificación mundial de producción científica. • En el número de documentos citados, se sitúa en undécimo lugar. • El número de revistas españolas incluidas en la base de datos del ISSN constituye el 4,4 % del total, aunque ha crecido más del 211 % con respecto a 2001. • El español científico y técnico se halla relegado a un plano apenas perceptible en el ámbito internacional.

  37. Desarrollo de la lexicografía • La lexicografía surge hace más de seis mil años. Sin embargo, no adquiere madurez metodológica y estatuto de disciplina científica hasta la segunda mitad del siglo xx, en el seno de la lingüística aplicada. Su evolución y crecimiento ha sido espectacular. A ello han contribuido: • La publicación de importantes reflexiones metalexicográficas. • La renovación tecnológica de la informática ha supuesto un cambio cuantitativo y cualitativo. Ha renovado y mejorado ad infinitum en tiempo, en costes, en esfuerzo, en capacidad de almacenamiento de datos y en accesibilidad a los mismos, en seguridad, en capacidad de interrelación, en la redacción y en otras tareas de elaboración de los diccionarios. Las modernas bases de datos permiten idear y realizar diccionarios totales integrados que hace pocos años eran impensables. En el pasado inmediato ha supuesto un cambio radical, pero son aún mayores las expectativas. • La multiplicación de variedades de diccionarios, algunos de ellos muy especializados y de gran calidad.

More Related