Estudio comparativo de métodos de transcripción para corpus orales: el caso del español

  • Marimar Rufino Morales Université de Montréal
Palabras clave: rehablado, transcripción, reconocimiento automático del habla, programa de dictado, corpus oral

Resumen

Los avances tecnológicos han propulsado la metodología de investigación en transcripción. Los programas para corpus lingüísticos basados en modelos estadísticos y de aprendizaje profundo han mejorado las fases de alineación y anotación. En cambio, cuando se trata de transcribir el material, la carga interpretativa y la propia naturaleza de las conversaciones obstaculizan la automatización del proceso. De esta manera, la transcripción de entrevistas destinadas al estudio de la lengua oral se sigue haciendo con un reproductor y un teclado, y puede convertirse en uno de los aspectos más largos del procesamiento de datos. Sin embargo, en otros contextos profesionales, el reconocimiento automático del habla se emplea para transcribir de forma eficaz gracias a la colaboración humano-computadora. Las técnicas y estrategias difieren, pero todas tienen en común que estabilizan las fluctuaciones de las herramientas informáticas y son más rápidas que otros métodos. En este estudio se ha utilizado una de ellas, el rehablado off-line con las entrevistas del Corpus oral de la lengua española en Montreal. Se ha medido el tiempo empleado, así como la precisión y se ha comparado con el reconocimiento automático del habla y con la mecanografía. El rehablado off-line ha permitido el uso de un programa automático de dictado en su estado actual como herramienta para potenciar la transcripción de entrevistas en menos tiempo y con menos errores.

Biografía del autor/a

Marimar Rufino Morales, Université de Montréal

Doctoranda en estudios hispánicos en la Université de Montréal e imparte clases de traducción español-francés. Tras graduarse en la EUTI de Granada, se especializó en traducción audiovisual en Canadá, donde lleva más de 25 años subtitulando para la televisión en diferido, y 15 en directo. Dentro de su línea de investigación -la variación del español-, le interesa optimizar la transcripción de la lengua hablada con ayuda de la tecnología inteligente.

Publicado
2020-12-12
Cómo citar
Rufino Morales, M. (2020). Estudio comparativo de métodos de transcripción para corpus orales: el caso del español. Revista Nebrija De Lingüística Aplicada a La Enseñanza De Lenguas, 14(29), 126 - 146. https://doi.org/10.26378/rnlael1429406
Sección
Sección temática