Minuto a Minuto

Nacional Indicio crítico en funeraria El Ángel: exigencias forenses y obligaciones estatales para convertir restos en parte de la verdad
Si el Estado pretende que ese hallazgo contribuya efectivamente a la identificación, la sanción y la reparación, debe actuar con disciplina científica y escrupuloso respeto a procedimientos que garanticen la validez y admisibilidad de la prueba
Entretenimiento BTS lidera Netflix con su concierto de regreso
El evento en directo alcanzó el 'Top 3' en todos los mercados, según FlixPatrol, que mostró las primeras previsiones de espectadores a la espera de las cifras oficiales que Netflix publicará el miércoles
Internacional Cuba se recupera paulatinamente tras segundo apagón nacional
Habitantes de Cuba se recuperan este domingo del segundo apagón nacional que sufrió esta semana y el séptimo en año y medio
Nacional “Pueblos y Paisajes 2026” congrega a más de 2 mil 500 ciclistas en Sinaloa
El gobierno de Sinaloa destacó que “Pueblos y Paisajes 2026” forma parte de las acciones para fortalecer estilos de vida saludables, la movilidad sustentable y la cultura ambiental
Internacional En Nicaragua, dueños presentan a sus mascotas ante San Lázaro para pedir por su salud
La devoción hacia San Lázaro, considerado en Nicaragua como el protector de los animales, reúne a cientos de fieles en la iglesia Santa María Magdalena de Masaya
Científico con dificultades del habla crea herramienta para ser entendido
Dimitri Kanevsky. Foto de @CHChearing

Dimitri Kanevsky, un científico de Google con dificultades en el habla, creó una herramienta capaz de transcribir en tiempo real lo que dice, y que funciona gracias al aprendizaje automático y la inteligencia artificial.

Se trata de “Euphonia”, un proyecto, aún en desarrollo, que nace con el objetivo de ayudar a las personas a ser entendidas, mejorando así su accesibilidad, y que Kanevsky ha presentado este jueves en las oficinas de Google en Madrid.

El proyecto se centra sobre todo en mejorar el reconocimiento automático de voz y en cómo se puede entrenar a ordenadores y dispositivos móviles para comprender mejor a las personas que tienen dificultad a la hora de pronunciar palabras debido a complicaciones neurológicas por enfermedades o lesiones cerebrales traumáticas.

Y es que, como recuerda este investigador ruso en la página web de este proyecto de Google, para los millones de personas en todo el mundo que tienen dificultades a la hora de hablar, la comunicación cara a cara puede ser un gran desafío.

Aunque hay herramientas como el asistente de Google o Google Home que pueden ayudar a la gente a llamar a alguien o a ajustar la iluminación, es posible que estas no funcionen de manera tan eficaz para aquellas personas con problemas en el habla, señala.

Esto se debe a que los algoritmos de reconocimiento de voz “han visto” millones de ejemplos de personas cuyas voces suenan “típicas” pero pocos de personas con deficiencias en el habla, por eso Kanevsky desarrolló esta herramienta.

Kanevsky pensó en un principio que la investigación no le llevaría más de cinco años, pero al final necesitó muchos más años para desarrollarla.

Ahora esta es capaz de transcribir los mensajes de cualquier persona en tiempo real después de un “entrenamiento” que puede durar unas 25 horas; esto es lo que hizo este investigador, repetir distintas frases durante este tiempo para que la aplicación se acostumbrara y se adaptara a su manera de hablar.

Para seguir implementándola, el científico pide ahora voluntarios, que presten sus voces para continuar con “el entreno” de su sistema y así mejorarlo.

En un futuro, según dijo en la presentación Kanesvsky, la herramienta estará disponible para 70 idiomas.

Reconoce que su sueño era desarrollar un proyecto de reconocimiento de voz que pudiera ayudar a la gente que no oye y/o no puede comunicarse correctamente.

“Ahora tengo una aplicación que me permite entender a otras personas y que estas personas me entiendan a mí para poder dar conferencias sobre geometría algebraica“, una de sus vocaciones, subraya Kanevsky: “esto es maravilloso”.

Antes de unirse a Google, Dimitri fue miembro del equipo de investigación en el departamento de Algoritmos de Habla y Lenguaje en el Centro de Investigación Watson de IBM; también trabajó en Instituto Max Planck de Alemania o el Instituto de Estudios Avanzados de Princeton.

Con información de EFE