Ciencia y tecnología | Actualidad
Inteligencia artificial

Google desarrolla un sistema que te permite silenciar a quien no quieras escuchar

La inteligencia artificial es capaz de reconocer las voces y separarlas para que tan solo escuches lo que tú quieras

Bilbao

En diciembre de 2014, la serie distópica Black Mirror, en la que Charlie Brooker nos muestra las consecuencias que puede tener la tecnología sobre el mundo en un futuro no muy lejano, estrenaba Blanca navidad, su especial navideño. Un episodio en el que se muestra qué es lo que pasaría su pudiéramos bloquear a personas en la vida real como hacemos en las redes sociales

Más información

Un capítulo que, una vez más, demuestra que Black Mirror está un paso por delante de la realidad. Recientemente, un equipo de investigadores de Google ha desarrollado una inteligencia artificial capaz de analizar las voces de un vídeo y separarlas. Gracias a ello, el usuario podrá suprimir aquella que le incordie o no le permita escuchar lo que dice una tercera persona con un solo clic

El 'efecto cóctel' llevado al mundo de la computación

Tal y como explica el equipo de investigadores de Google a través de su blog, este proyecto está inspirado en el conocido como el 'Efecto cóctel'. Una capacidad natural del ser humano que nos permite enfocar nuestra atención en una persona en particular en un ambiente ruidoso "enmudeciendo" otro tipo de voces y sonidos. El equipo pretende trasladar el 'efecto cóctel' al sector de la computación, donde no parece tan sencillo de desarrollar.

Para ello han desarrollado 'Looking to listen at the Cocktail Party'. Un modelo audiovisual de aprendizaje profundo, es decir, basado en la inteligencia artificial, que permite aislar una sola señal de voz de una mezcla de sonidos como otras voces y ruido de fondo. Así, el usuario tan solo tendrá que seleccionar la cara de la persona que quiera escuchar para silenciar el resto de voces.

Las aplicaciones de esta tecnología

A pesar de que pueda parecer que esta tecnología ha sido desarrollada para silenciar a aquellas personas que no soportemos, 'Looking to listen at the Cocktail Party' permitiría obtener videoconferencias con mejor sonido, ofrecer retransmisiones en varios idiomas sin demasiadas complicaciones e incluso desarrollar audífonos mejorados. 

Por otro lado, este método también puede ser utilizado como un proceso previo para el reconocimiento de voz y el desarrollo de los subtítulos automáticos de vídeo. La inteligencia artificial sería capaz de separar el audio de las diferentes fuentes para presentar subtítulos más precisos y fáciles de leer para el usuario. 

David Justo

David Justo

(Astrabudua, 1991) Periodista especializado en tecnología que aborda la vida digital desde otro punto...

 
  • Cadena SER

  •  
Programación
Cadena SER

Hoy por Hoy

Àngels Barceló

Comparte

Compartir desde el minuto: 00:00