Inicio - Ciencia y Tecnología - Esta inteligencia artificial ya traduce y transcribe cualquier audio

Esta inteligencia artificial ya traduce y transcribe cualquier audio

Whisper es una nueva inteligencia artificial de OpenAI que planea revolucionar los traductores y las tecnologías de voz a texto. De acuerdo a ArsTechnicaesta IA es capaz de transcribir y traducir entrevistas, podcasts, conversaciones y mucho más. Pero lo mejor de todo es que su capacidad para hacerlo está casi al nivel de un humano.

Según comentan desde OpenAI, su inteligencia artificial se ha entrenado con más de 680.000 horas de audio. Pero, además de escuchar, Whisper también ha tenido que hacer coincidir dichas palabras con texto escrito.

Gracias a la red neuronal de la inteligencia artificial, puede utilizar contexto a partir de los datos de entrada, para posteriormente aprender asociaciones que pueden traducirse en la salida del modelo.

Cómo funciona Whisper, la IA capaz de traducir y transcribir cualquier entrada de audio

«El audio de entrada se divide en trozos de 30 segundos», describe OpenAI en la publicación oficial. De esta forma, «se convierte en un espectrograma… y se pasa al codificador».

Pero no es todo. Posteriormente, se entrena al codificador para predecir el texto correspondiente. ¿Cómo se hace? Se entremezclan tokens especiales que orientan al modelo a llevar a cabo una sola tarea, como la de identificación de idioma. Después se añaden a la ecuación otras variables, como la identificación de las marcas de tiempo a nivel de frase, la transcripción del habla multilingüe y la traducción al inglés.

Lo mejor de todo es que el trabajo de Whisper no acaba aquí. OpenAI ha decidido publicar su código para que pueda funcionar como base a los futuros procesadores del habla y herramientas de accesibilidad. Por lo tanto, hay oportunidad de ver mejoras en la inteligencia artificial.

Fuente: hipertextual.com

Más noticias...

La tecnología RISC-V representa una oportunidad para China. Una apuesta que aterroriza a EEUU

La arquitectura RISC-V interpreta un papel central en la estrategia de China. Esta tecnología es una …

A %d blogueros les gusta esto: