Minuto a Minuto

Ciencia y Tecnología Multan a ‘X’ con 140 mdd por falta de transparencia y diseño engañoso
La Comisión Europea (CE) multó a la red social X con 120 millones de euros (casi 140 millones de dólares) por incumplir sus obligaciones de transparencia de acuerdo a la ley de servicios digitales comunitaria, en la que es su primera decisión contra una plataforma por violar esa legislación. Las infracciones de la empresa de … Continued
Deportes En vivo: Sorteo final del Mundial 2026
Washington D.C. será la sede del sorteo de la Copa Mundial 2026, donde 48 selecciones conocerán su suerte en el máximo evento del futbol
Deportes F1: Norris domina práctica 2 del GP de Abi Dhabi
El piloto inglés Lando Norris tuvo el mejor tiempo en la segunda práctica libre del Gran Premio de Abu Dhabi de F1
Internacional EE.UU. ataca otra narcolancha en el Pacífico Oriental; hay cuatro muertos
El ataque contra la supuesta narcolancha fue informado por el Comando Sur estadounidense en su cuenta oficial de X
Nacional Metro CDMX, con servicio lento y cierre de estaciones
El Metro CDMX informó el cierre de estaciones, mientras que usuarios reportaron servicio sumamente lento
Una interfaz con IA permite a una mujer con parálisis ‘hablar’ casi en tiempo real
Momento en el que los investigadores conectan el implante cerebral a la computadora sintetizadora de voz. EFE/Crédito: Noah Berger. Imagen de la Facultad de Ingeniería de la Universidad de California en Berkeley

Un equipo científico de la Universidad de California en Berkeley y en San Francisco (Estados Unidos) diseñó un dispositivo capaz de traducir la actividad del habla en el cerebro en palabras habladas casi en tiempo real, consiguiendo que una mujer de 47 años con tetraplejia ‘hablara’ después de 18 años.

Este trabajo resuelve “el viejo problema” de la latencia de las neuroprótesis del habla, es decir, el tiempo que transcurre entre el momento en que un sujeto intenta hablar y el momento en que se produce el sonido.

Gracias a los últimos avances basados en inteligencia artificial (IA), los investigadores desarrollaron un método de transmisión que sintetiza las señales cerebrales en habla audible casi en tiempo real. Su descripción se publica en la revista Nature Neuroscience.

“Nuestro enfoque de ‘streaming’ lleva la misma capacidad de decodificación rápida del habla de dispositivos como Alexa y Siri a las neuroprótesis”, resume Gopala Anumanchipalli, co-investigador principal del estudio.

“Utilizando un tipo de algoritmo similar, descubrimos que podíamos descodificar datos neuronales y, por primera vez, hacer posible una transmisión de voz casi sincrónica. El resultado es una síntesis del habla más natural y fluida”, explica el científico.

Para Edward Chang, otro de los científicos principales, esta nueva tecnología “tiene un enorme potencial” para mejorar la calidad de vida de las personas con parálisis graves que afectan al habla. “Es emocionante que los últimos avances en IA estén acelerando enormemente las interfaces cerebro-ordenador para su uso práctico en el mundo real en un futuro próximo”.

Como parte de un ensayo clínico, los equipos de Chang y Anumanchipalli implantaron la interfaz cerebro-computadora en una mujer de 47 años con tetraplejia (parálisis de las extremidades y el torso), que no había podido hablar o vocalizar durante 18 años después de sufrir un accidente cerebrovascular.

Para recopilar los datos necesarios para entrenar su algoritmo, los investigadores primero hicieron que la participante mirara una indicación en la pantalla, como la frase “hola, ¿cómo estás?”, y luego intentara pronunciar esa frase en silencio.

Así, los autores entrenaron una red neuronal de aprendizaje profundo utilizando la actividad cerebral de la participante, que se registró mediante electrodos implantados sobre su corteza sensomotora del habla, mientras pronunciaba internamente en su cerebro frases completas que contenían mil 24 palabras únicas.

A continuación, se utilizó este modelo para descodificar el habla en línea, simultáneamente con la intención vocal de la participante (Ann), y luego producir audio imitando su voz -esta había sido entrenada utilizando un clip de ella hablando antes de la lesión-.

Cheol Jun Cho, otro de los firmantes del trabajo, resume que la neuroprótesis funciona tomando muestras de datos neuronales de la corteza motora, la parte del cerebro que controla la producción del habla, y luego utiliza la IA para descodificar la función cerebral y convertirla en habla.

“Básicamente interceptamos las señales en las que el pensamiento se traduce en articulación (…). Así que lo que estamos descodificando es después de que se haya producido un pensamiento, después de que hayamos decidido qué decir, después de que hayamos decidido qué palabras utilizar y cómo mover los músculos del tracto vocal”.

En su anterior estudio sobre este tipo de dispositivos, los investigadores se encontraron con una larga latencia de descodificación, de unos 8 segundos para una sola frase. Con el nuevo método de transmisión, la salida audible puede generarse casi en tiempo real, mientras el sujeto intenta hablar, recoge un comunicado de la Facultad de Ingeniería de la Universidad de California en Berkeley.

Para descartar que el sistema simplemente estaba emparejando patrones y repitiendo partes de los datos de entrenamiento, los investigadores probaron su capacidad para sintetizar palabras que no formaban parte del vocabulario del adiestramiento primario. En este caso, eligieron 26 palabras del llamado alfabeto fonético de la OTAN, como “alpha” o “bravo”.

“Descubrimos que nuestro modelo lo hace bien, lo que demuestra que, efectivamente, está aprendiendo los componentes básicos del sonido o la voz”, concluye Anumanchipalli.

Con información de EFE