LipNet es la aplicación que lee los labios mejor que un experto

lipnet-leitura-labial-iaLipNet supera a humanos expertos en pruebas de lectura labial 

El programa de inteligencia artificial DeepMind de Google mejor conocido por la construcción de AplhaGO, que venció a uno de los mejores jugadores GO del mundo. Pero la tecnología tiene numerosas aplicaciones en el campo de la ciencia y podría resultar especialmente útil para la audiencia. «Escribieron los investigadores en su artículo.

Investigadores de la Universidad de Oxford y DeepMind se unieron para crear un sistema de IA entrenado con 5000 horas de videos de la BBC, que contenía 118.000 frases. Se las arregló para superar a un lector de labios profesional que presta sus servicios a tribunales del Reino Unido.

Cuando se muestra una prueba aleatoria de 200 videos de emisiones de la BBC, el lector de labios humano fue capaz de descifrar menos de un cuarto de las palabras habladas. Pero cuando el sistema IA fue probado usando el mismo conjunto de datos, descifró casi la mitad de las palabras y pudo hacer frases completas y complejas.
Además, la máquina fue capaz de anotar el 46 por ciento de las palabras sin error, mientras que el profesional sólo manejó alrededor del 12 por ciento. La mayoría de los errores de la IA fueron menores, como si perdieran la ‘s’ del final de las palabras.2016-11-23-image-4Hace dos semanas, otro sistema de aprendizaje profundo que puede leer labios fue desarrollado en la Universidad de Oxford, con el nombre LipNet. Este sistema también fue capaz de vencer a un humano cuando trataba de leer con precisión los labios, aunque el conjunto de datos utilizado en este caso, llamado GRID, contenía sólo 51 palabras únicas, mientras que los datos de la BBC contienen casi 17.500, según New Scientist.
GRID también utilizó videos bien iluminados de personas que se enfrentaron a la cámara leyendo tres segundos de palabras. Después de mostrar los 29,000 videos de AI, tuvo una tasa de error de sólo 6.6 por ciento, mientras que los humanos que fueron probados usaron 300 videos similares y tuvieron una tasa de error promedio de 47.7 por ciento.

Los investigadores dicen que el sistema podría encontrar uso en tecnologías móviles, asistentes virtuales y para tareas generales de reconocimiento de voz. También podría ser invaluable para ayudar a las personas sordas y con deficiencias auditivas a entender a los demás.

¿Qué les parece? Esperemos que pronto deje su etapa de desarrollo, aunque ya lleve un 93% de precisión.

Via: Techspot.

También les puede interesar: El Galaxy S8 será el primer smartphone con Snapdragon 835.

Por:

Editora del Sitio web de Cultura Geek: GadgetsGirls Youtube: www.youtube.com/user/GadgetsGirls

Más posts de

Escribe tu comentario