Título
El Corpus Histórico del Español en México
Autor
ALFONSO MEDINA URREA
CARLOS FRANCISCO MENDEZ CRUZ
Nivel de Acceso
Acceso Abierto
Materias
Resumen o descripción
Tema del mes
Los corpus lingüísticos constituyen uno de los tipos más prominentes de recursos digitales de uso en las humanidades. En la tradición lingüística los corpus se conocen como muestras textuales de diversas naturalezas, escritos u orales, representativos de alguna lengua, área temática, género literario, registro sociolingüístico, lenguaje de especialidad, etcétera. Hoy en día, los corpus lingüísticos son irremediablemente electrónicos. En México, la compilación de corpus electrónicos se inició en los años setenta, antes de la era de Internet. El primer corpus electrónico en español, el Corpus del Español Mexicano Contemporáneo de El Colegio de México, se constituyó como la base estadística de la nomenclatura del Diccionario del Español en México. Luego, con el advenimiento de Internet se han hecho disponibles al mundo los corpus de la Real Academia Española (CORDE y CREA), el Corpus del Español de Mark Davies y El Corpus Histórico del Español en México (CHEM). Este último, desarrollado en el Grupo de Ingeniería Lingüística (GIL) del Instituto de Ingeniería de la Universidad Nacional Autónoma de México, es el foco del presente artículo. Los corpus son un recurso fundamental en las investigaciones lingüísticas, en el desarrollo de herramientas de procesamiento de lenguaje natural y en la construcción de otros recursos lingüísticos como son los diccionarios, lexicones, etcétera. Por todo esto, en el GIL se han desarrollado herramientas computacionales de extracción automática de términos y definiciones (para la lexicografía y terminología computacionales), con el afán de apoyar de forma decisiva la labor de lexicógrafos y terminólogos. En este contexto, en el GIL se han abierto proyectos para elaborar corpus de diversas áreas, como la Ingeniería, los Contextos Definitorios (fragmentos textuales que incluyen en su interior un término y su definición) y las Sexualidades en México, lo que permitirá el estudio de documentos sobre las áreas de sexualidad y sexología y la futura creación automática de diccionarios electrónicos
Editor
Universidad Nacional Autónoma de México. Dirección General de Cómputo y de Tecnologías de Información y Comunicación. Revista Digital Universitaria
Fecha de publicación
1 de julio de 2011
Tipo de publicación
Artículo
Recurso de información
Formato
html
application/pdf
Fuente
Revista Digital Universitaria (1607 - 6079). Vol. 12, No. 7 (2011)
Idioma
Español
Relación
http://www.revista.unam.mx/vol.12/num7/art64/art64.pdf
http://www.revista.unam.mx/index_jul11.htm
Cobertura
MX
Repositorio Orígen
Repositorio Institucional RUTIC
Descargas
0