Título

El Corpus Histórico del Español en México

Autor

ALFONSO MEDINA URREA

CARLOS FRANCISCO MENDEZ CRUZ

Nivel de Acceso

Acceso Abierto

Resumen o descripción

Tema del mes

Los corpus lingüísticos constituyen uno de los tipos más prominentes de recursos digitales de uso en las humanidades. En la tradición lingüística los corpus se conocen como muestras textuales de diversas naturalezas, escritos u orales, representativos de alguna lengua, área temática, género literario, registro sociolingüístico, lenguaje de especialidad, etcétera. Hoy en día, los corpus lingüísticos son irremediablemente electrónicos. En México, la compilación de corpus electrónicos se inició en los años setenta, antes de la era de Internet. El primer corpus electrónico en español, el Corpus del Español Mexicano Contemporáneo de El Colegio de México, se constituyó como la base estadística de la nomenclatura del Diccionario del Español en México. Luego, con el advenimiento de Internet se han hecho disponibles al mundo los corpus de la Real Academia Española (CORDE y CREA), el Corpus del Español de Mark Davies y El Corpus Histórico del Español en México (CHEM). Este último, desarrollado en el Grupo de Ingeniería Lingüística (GIL) del Instituto de Ingeniería de la Universidad Nacional Autónoma de México, es el foco del presente artículo. Los corpus son un recurso fundamental en las investigaciones lingüísticas, en el desarrollo de herramientas de procesamiento de lenguaje natural y en la construcción de otros recursos lingüísticos como son los diccionarios, lexicones, etcétera. Por todo esto, en el GIL se han desarrollado herramientas computacionales de extracción automática de términos y definiciones (para la lexicografía y terminología computacionales), con el afán de apoyar de forma decisiva la labor de lexicógrafos y terminólogos. En este contexto, en el GIL se han abierto proyectos para elaborar corpus de diversas áreas, como la Ingeniería, los Contextos Definitorios (fragmentos textuales que incluyen en su interior un término y su definición) y las Sexualidades en México, lo que permitirá el estudio de documentos sobre las áreas de sexualidad y sexología y la futura creación automática de diccionarios electrónicos

Editor

Universidad Nacional Autónoma de México. Dirección General de Cómputo y de Tecnologías de Información y Comunicación. Revista Digital Universitaria

Fecha de publicación

1 de julio de 2011

Tipo de publicación

Artículo

Formato

html

application/pdf

Fuente

Revista Digital Universitaria (1607 - 6079). Vol. 12, No. 7 (2011)

Idioma

Español

Relación

http://www.revista.unam.mx/vol.12/num7/art64/art64.pdf

http://www.revista.unam.mx/index_jul11.htm

Cobertura

MX

Repositorio Orígen

Repositorio Institucional RUTIC

Descargas

0

Comentarios



Necesitas iniciar sesión o registrarte para comentar.