La tecnología de voz de Xiaomi ayuda a las personas con trastornos del habla

Xiaomi será famosa por los teléfonos inteligentes y una gran cantidad de productos IoT, pero esta marca es más que sus dispositivos más populares. La marca ahora ha revelado una tecnología texto a voz Fue desarrollado por Xiaomi AI Lab que le permite crear una voz única y personalizada para usuarios con trastornos del habla.

Este sonido único reemplaza los sonidos electrónicos más comunes, lo que permite que una persona con un trastorno del habla se comunique con los demás en un tono natural. La iniciativa surgió del proyecto «Own My Voice» dirigido por el comité «Tecnología para el bien» de Xiaomi.

¿Por qué Xiaomi lanzó este proyecto?

Xiaomi se preocupa por las personas y se esfuerza por satisfacer sus necesidades a través de la innovación tecnológica. Descubrió el deseo de muchos usuarios con trastornos del habla de tener sus voces únicas para la comunicación diaria y creó un equipo de proyecto. «Tengo mi voz» Para invitar a un usuario sin palabras a actuar como receptor de audio. Zhou Shi, presidente del Comité de Tecnología de Tecnología para el Bien De Xiaomi dijo: “Nos emociona explorar los múltiples valores que nos aporta la innovación tecnológica, como responder a las solicitudes de los usuarios sobre su identidad y construir su identidad”.

¿Cómo implementó Xiaomi el proyecto?

Para generar la voz más adecuada y personalizada para el destinatario, el equipo ha reclutado a más de 200 voluntarios dentro de Xiaomi para donar sus voces. Utilizaron un algoritmo de comparación de voces para unir las características de las voces donadas por los voluntarios con las voces del destinatario. A través de este enfoque, encuentran el sonido más adecuado como sonido de referencia principal para el receptor. Con la personalización y la protección de la privacidad en mente, el sonido real seleccionado se ha manipulado a través de intrincadas modificaciones acústicas para crear un sonido acústico nuevo y original.

Luego, utilizaron la tecnología de texto a voz diseñada automáticamente para entrenar el modelo de IA, haciendo que esta nueva voz adquiriera gradualmente un ritmo y un tono naturales capaces de expresar verdaderamente la emoción y el tono humanos.

El proyecto «Tengo mi voz» Combina una variedad de los algoritmos más avanzados con la tecnología de voz desarrollada por Xiaomi para garantizar la privacidad, seguridad y alta fidelidad de la voz sintetizada, creando una nueva idea de síntesis de voz personalizada para usuarios con trastornos del habla.

¿Cuál es el significado del proyecto?

La columna vertebral de este proyecto es un grupo de expertos en tecnología del habla de Xiaomi AI Lab. Desde 2017, han publicado 37 tesis sobre el habla en las actas de importantes congresos internacionales como la Conferencia Internacional sobre Procesamiento de Voz, Habla y Señales (ICASSP). éxito «Tengo mi voz» Se basa principalmente en la tecnología de texto a voz diseñada y desarrollada automáticamente.

La tecnología de texto a voz de estilo espontáneo hace que la voz se sintetice como un ser humano real en tono, pausa, velocidad y otras características. Esto reemplaza la sensación monótona y antinatural del sonido electrónico con un sonido más natural. Esta tecnología es aplicable actualmente a muchos dispositivos inteligentes equipados con Xiaoai, el asistente de voz AI de Xiaomi. El proyecto «Tengo mi voz» Muestra que la tecnología automatizada de texto a voz también puede adoptarse ampliamente en las áreas de accesibilidad y mejora de la experiencia del usuario.

Zhou Shi agregó: «Si notamos y abordamos las necesidades de las minorías en una etapa temprana, el proceso de implementación de la tecnología se puede acortar significativamente. Esto permite que los beneficios de las nuevas tecnologías sean accesibles para los usuarios con discapacidades sin demora»..

A partir de ahora, Xiaomi seguirá recibiendo comentarios de los receptores de audio y seguirá estudiando la viabilidad de este proyecto a mayor escala. Xiaomi continuará habilitando la accesibilidad con las últimas tecnologías y se esforzará por satisfacer las diversas necesidades de las personas a través de la innovación tecnológica.

READ  RedmiBook Pro obtiene una actualización con AMD Ryzen

Gualtiero Varas

"Emprendedor. Aficionado incurable al twitter. Gamer. Aficionado apasionado de la cerveza. Practicante de la web. Estudiante típico".

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Back to top