Electrónica: Alfonso Medina Urrea

.

Alfonso Medina Urrea 

Nombre Completo

Alfonso Medina Urrea 

Categoría

Investigador Asociado C 

Subdirección

Electromecánica 

Coordinación

Eléctrica y Computación 

Área Adicional

 

Líneas de investigación

1. Minería de textos.
2. Compilación de corpus lingüísticos electrónicos.
3. Desarrollo de herramientas para explotación y análisis de corpus lingüísticos electrónicos.
4. Descubrimiento no supervisado de estructura morfológica al interior del sintagma de diversas lenguas.
5. Medición de distancias morfológicas entre dialectos y registros, diacrónicos y sincrónicos.

Descripción

Líneas de investigación en el Grupo de Ingeniería Lingüística: Esencialmente centradas alrededor del desarrollo de aplicaciones en Ingeniería Lingüística; en especial, en la construcción de corpus lingüísticos electrónicos y las herramientas para explotarlos. He sido responsable de los proyectos DGAPA PAPIIT IX402204 (extraordinario 2004), “Constitución de Corpus Lingüísticos Electrónicos”, IN400905 (2005-2007) “Constitución del Corpus Histórico del Español de México”, que han servido para la compilación de un corpus electrónico de carácter diacrónico que puede consultarse en http://www.iling.unam.mx/chem/. En el presente soy responsable del proyecto IN402008 (2008-2010) “Glutinometría y variación dialectal”.
Además del desarrollo de estos recursos, investigamos métodos de segmentación morfológica automática no supervisada a partir de corpus electrónicos. En especial, trabajamos con métodos de descubrimiento de bases, afijos, grupos afijales de palabras gráficas de diversas lenguas naturales, lo que constituye investigación básica para el desarrollo de segmentadores (stemmers), lematizadores y analizadores morfológicos en general.
Estos métodos se han aplicado al español de México (en el Corpus del Español Contemporáneo de México de El Colegio de México), al checo (con la nomenclatura del Corpus Nacional de la República Checa), y diversos corpus pequeños de lenguas o registros de lenguas poco investigados electrónicamente: del chuj (lengua maya), del rarámuri (o tarahumara) y del español cubano (escolares guamenses), entre otros.

Ubicación

Edificio 12, Piso 2, Cubículo 326
Instituto de Ingeniería, UNAM
México, D.F., México; C.P. 04510,
Apartado postal 70-472

Teléfono

+52 (55) 56233600 x 8860 
Fax +52 (55) 56233507 

Área

Tecnologías de la información 

Especialidad

Ingeniería en Computación 
Datos adjuntos
Creado el 03/06/2014 08:12 p.m.  por IINGEN\WebMaster 
Última modificación realizada el 03/06/2014 08:12 p.m.  por IINGEN\WebMaster