El primer modelo de inteligencia artificial de lenguaje de gran escala desarrollado para el idioma tibetano, denominado DeepZang, se ha convertido en una de las principales atracciones durante una importante feria tecnológica celebrada en Pekín, debido a sus avanzadas capacidades de reconocimiento y respuesta en esa lengua ancestral.
El innovador sistema fue diseñado para comprender y generar contenido en tibetano con alta precisión, gracias a una base de datos compuesta por casi 70 millones de entradas de corpus paralelo tibetano-mandarín y más de 30,500 horas de grabaciones de voz. La plataforma abarca además los tres principales dialectos tibetanos, lo que representa un importante avance en la preservación y modernización digital del idioma.
Durante las demostraciones tecnológicas, los asistentes pudieron interactuar con el modelo mediante un ratón inteligente con reconocimiento de voz. Al hablarle directamente al dispositivo, la inteligencia artificial responde de forma fluida en tibetano, ejecutando tareas que van desde la redacción de contratos comerciales hasta la creación de poemas y textos literarios.
Los desarrolladores destacaron que DeepZang busca facilitar la inclusión digital de comunidades tibetanas y ampliar el acceso a herramientas tecnológicas en lenguas minoritarias, un desafío que aún persiste en gran parte del mundo tecnológico.
La plataforma ya supera los 300 mil usuarios registrados, mientras que más del 70 % de su base está conformada por jóvenes entre 18 y 40 años, reflejando el creciente interés de las nuevas generaciones por la inteligencia artificial aplicada a su idioma y cultura.
Especialistas consideran que este avance marca un paso significativo en el desarrollo de tecnologías lingüísticas regionales y podría abrir la puerta a nuevos modelos de IA enfocados en otras lenguas con menor representación digital.
The world's first large language AI model for the Tibetan language, DeepZang, has emerged as a standout attraction at a tech expo in Beijing.
— China Science (@ChinaScience) May 15, 2026
The model has amassed nearly 70 million accurately matched Tibetan-Mandarin parallel corpus entries and over 30,500 hours of Tibetan… pic.twitter.com/zzbtKbNJhw


