La Curva de Aprendizaje, parte 4: Un nuevo modelo de IA y un lenguaje en evolución
Samsung Research en China es parte de una serie sobre las personas y las innovaciones detrás de la democratización de la IA móvil.
Mientras Samsung continúa siendo pionero en experiencias premium de IA móvil, visitamos los centros de investigación de Samsung en todo el mundo para conocer cómo Galaxy AI permite que más usuarios maximicen su potencial. Galaxy AI ahora admite 16 idiomas, por lo que más personas pueden ampliar sus capacidades lingüísticas, incluso sin conexión, gracias a la traducción en el dispositivo en funciones como Traducción simultánea, Interprete, Asistente de notas y Asistente de Navegación. Pero ¿qué implica el desarrollo del lenguaje de IA? La última vez visitamos Vietnam para aprender cómo preparar los datos que se utilizan para entrenar modelos de IA. Esta vez, estamos viendo cómo los equipos hicieron de Galaxy AI una oferta única tanto para China continental como para Hong Kong.
El rápido crecimiento de las herramientas de inteligencia artificial que utilizan grandes modelos de lenguaje (LLM) se ha observado en todo el mundo y China no es una excepción. Con ERNIE Bot de Baidu y MiracleVision de Meitu emergiendo como opciones populares en China, Samsung R&D Institute China se asoció con ambas compañías para ayudar a desarrollar funciones de Galaxy AI para el país.
El Samsung R&D Institute China en Guangzhou (SRC-G) y Beijing (SRC-B) trabajaron para garantizar que los hablantes de mandarín en China tuvieran la misma experiencia de Galaxy AI que otros usuarios en todo el mundo, a pesar de que la tecnología de back-end se ve diferente. El equipo aprovechó los recursos dedicados a dialectos chinos de socios externos y creó una solución Galaxy AI única para China.
“Tenemos la ventaja de combinar las mejores prácticas globales con las prácticas locales de China, además de crear nuevas características y mejorarlas constantemente a través de la comunicación diaria con los consumidores chinos“, dice Hairong Zhang, líder del grupo de innovación de software en SRC-G. “Con la rica experiencia en desarrollo del Galaxy S24, estoy orgulloso de cómo nuestro equipo cooperó con empresas locales chinas de inteligencia artificial, como Baidu y Meitu, para brindar una solución que impacte en China“.
Al principio, los equipos tuvieron que aclimatarse a los estilos de trabajo de cada uno y solucionar los problemas iniciales de asimetría de información. Daijun Zhang, director de SRC-B, estableció un grupo de trabajo para garantizar que el proyecto siguiera el cronograma de desarrollo y avanzara rápidamente hacia sus objetivos.
Gracias a la experiencia del equipo de Beijing en la generación de modelos a gran escala y la colaboración exitosa con socios externos, todas las funciones de IA generativa se lanzaron con éxito en China. El resultado es una solución que tiene relevancia local y características específicas para el mercado, como Touch to Search (Tocar para buscar).
Ampliando el chino para desarrollar el dialecto cantonés
El chino para China continental (mandarín) llegó a Galaxy AI con el lanzamiento del Galaxy S24 en enero de 2024. Pero el trabajo del Samsung R&D Institute China estaba lejos de estar terminado. Al equipo también se le asignó la tarea de desarrollar el modelo de IA para el chino en Hong Kong (cantonés), un dialecto que se sustentó en el trabajo ya realizado para el mandarín pero que aporta un conjunto completamente nuevo de características lingüísticas para abordar.
Al desarrollar el cantonés, el equipo de I+D de China enfrentó importantes desafíos culturales a los que necesitaba responder para poder respaldar plenamente su ubicación en el mercado. El primer fenómeno cultural son los dos conjuntos de sistemas de escritura y habla. Los habitantes de Hong Kong utilizan gramática y expresiones similares al mandarín cuando escriben, pero adoptan una gramática coloquial completamente diferente cuando se comunican a diario. Además, el cantonés tiene nueve tonos de pronunciación, mientras que el mandarín tiene cuatro.
Otro fenómeno cultural es que el propio dialecto cantonés se desarrolla con los tiempos. Agregando a eso el hecho de que las personas a menudo combinan cantonés e inglés en las conversaciones, dejando claro por qué fue complicado crear casos de prueba y validar paquetes de idiomas.
“El cantonés es un dialecto muy singular que varía en las distintas regiones donde se habla cantonés”, afirma Jing Li, que dirige la operación para probar la solución de IA en cantonés. “Algunas de las jergas, frases, vocabulario e incluso los tonos varían de un lugar a otro. Por lo tanto, llevamos a cabo una gran cantidad de trabajo para verificar los datos específicos de Hong Kong, así como también para corregir decenas de miles de casos de prueba relevantes”.
Con estas complejidades en mente, SRC-G y SRC-B trabajaron juntos para admitir una combinación de código profunda utilizando una combinación de cantonés e inglés para el reconocimiento de voz, admitiendo simultáneamente expresiones habladas y escritas en traducción automática y reflejando pronunciaciones actuales en síntesis de voz.
Impacto cultural de la comunicación
Cuando Galaxy AI lanzó la opción de idioma chino (Hong Kong), los comentarios de los clientes mostraron que el arduo trabajo del equipo de I+D de Samsung estaba justificado.
Tanto para China continental como para Hong Kong, las actividades de Galaxy AI de Samsung muestran la importancia de que una marca global tenga presencia y experiencias locales, así como el poder de la colaboración abierta con otras organizaciones. En Hong Kong, el cantonés es una parte clave de la identidad cultural de quienes viven allí. Por eso era tan importante para el equipo acertar con el modelo de lenguaje de IA.
“El lenguaje y la comunicación son cruciales en todas las regiones y en todos los ámbitos de la vida“, afirma Henry Wat, jefe del grupo de ingeniería de Samsung Electronics Hong Kong. “No importa el idioma, cualquier herramienta que ayude a las personas a comunicarse es invaluable. Creo que nuestro trabajo es significativo”.
En el próximo episodio de La Curva de Aprendizaje, nos dirigiremos a Brasil para ver cómo un equipo trabaja a través de culturas y fronteras para llevar Galaxy AI a más personas.