Una IA permite sintetizar la voz a partir del pensamiento en tiempo real

Los investigadores desarrollaron una interfaz que puede transformar las señales neuronales en habla con una latencia mínima.

8 1
Nueva interfaz cerebro-computadora sintetiza la voz humana. Nueva interfaz cerebro-computadora sintetiza la voz humana.
02 Abril 2025

Una nueva interfaz con inteligencia artificial logró decodificar el habla a partir del pensamiento. Los investigadores desarrollaron una conexión que permite transformar las señales neuronales para transformarlas en voz con un retraso casi nulo: menos de un segundo. 

La investigación de la Universidad de California en Berkeley y publicada en la revista Nature Neuroscience esta semana, representa una verdadera hazaña para mejorar la calidad de vida de quienes sufren impedimentos para comunicarse. Utilizando avances recientes en modelado basado en inteligencia artificial, los investigadores desarrollaron un método de transmisión que sintetiza señales cerebrales en voz audible casi en tiempo real.

Un avance en la calidad de vida

La neuroprótesis y la interfaz desarrolladas están diseñadas para permitir que los pacientes con parálisis severa y anartria (pérdida de habla) puedan tener voz. El sistema decodifica las señales de la corteza motora y utiliza IA para transformarlas en habla audible. “Nuestro enfoque de transmisión brinda la misma capacidad de decodificación rápida de voz de dispositivos como Alexa y Siri a las neuroprótesis”, dijo Gopala Anumanchipalli, profesor adjunto Robert E. y Beverly A. Brooks de Ingeniería Eléctrica y Ciencias de la Computación en UC Berkeley y coinvestigador principal del estudio.

Según el coautor principal del estudio, Cheol Jun Cho, estudiante de doctorado en ingeniería eléctrica y ciencias de la computación en UC Berkeley, la neuroprótesis funciona tomando muestras de datos neuronales de la corteza motora, la parte del cerebro que controla la producción del habla, y luego utiliza IA para decodificar la función cerebral en habla.

Cómo funciona esta interfaz cerebro-computadora

“Básicamente, estamos interceptando señales donde el pensamiento se traduce en articulación y en medio de ese control motor”, dijo.

“Entonces, lo que estamos decodificando es después de que un pensamiento ha sucedido, después de que hemos decidido qué decir, después de que hemos decidido qué palabras usar y cómo mover los músculos del tracto vocal”.

Además, el descubrimiento comprende otra hazaña: la voz surge prácticamente con el pensamiento. En su estudio previo sobre BCI (interfaz cerebro-computadora), los investigadores tenían una latencia de decodificación prolongada, de aproximadamente 8 segundos para una sola frase. Con el nuevo enfoque de transmisión, se puede generar una salida audible casi en tiempo real, mientras el sujeto intenta hablar.

Tamaño texto
Comentarios 1
Informate de verdad Aprovechá esta oferta especial
$11,990 $3,590/mes
Suscribite ahoraPodés cancelar cuando quieras
Comentarios
Cargando...