Santiago Latin America

“Pensar en Mexicano”: Cuando la IA Soberana Encuentra las Lenguas Originarias

March 24, 2026 • 8 min read

“Pensar en Mexicano”: Cuando la IA Soberana Encuentra las Lenguas Originarias

En marzo de 2026, México está desarrollando sus propios modelos de lenguaje grandes (LLMs) nacionales que incorporarán lenguas indígenas como Náhuatl, Zapoteco y Mixteco, junto con el español mexicano. El objetivo, según los anuncios oficiales, es que estos modelos “piensen en mexicano” —entendiendo contexto local, vocabulario y matices culturales— en lugar de simplemente traducir.

El modelo nacional se llama KAL. Hay un foro de IA + Lenguas Indígenas que reúne a activistas digitales indígenas. Hay proyectos comunitarios: una plataforma de alfabetización bilingüe Tsotsil-Español que funciona sin conexión, un sistema de traducción automática entre 11 familias de lenguas indígenas, una app para aprendizaje interactivo del Tu’un Savi, un proyecto para preservar el Tseltal usando LLMs.

Todo esto suena como soberanía en acción. Suena como Soberanía Epistémica —el derecho de los pueblos a definir qué cuenta como conocimiento válido, qué preguntas merecen ser hechas, qué valores merecen ser protegidos.

Pero hay una pregunta que los anuncios oficiales no responden, que los comunicados de prensa no mencionan, que los funcionarios no están haciendo en público:

¿Quién posee los datos?

El Framing: Soberanía del Estado o Soberanía de los Pueblos

Hay dos maneras de entender la “soberanía de IA” en el contexto de las lenguas indígenas.

La soberanía del estado: México desarrolla LLMs nacionales que “incluyen” lenguas indígenas. Los datos lingüísticos son recolectados —de comunidades, de textos, de hablantes— y usados para entrenar modelos que el gobierno controla, que instituciones académicas gestionan, que empresas tecnológicas pueden licenciar. La soberanía es nacional: México vs. Estados Unidos, México vs. China, México vs. las Big Tech. Las comunidades indígenas son fuentes de datos, no dueñas de los modelos.

La soberanía de los pueblos: Las comunidades indígenas controlan sus propios datos lingüísticos. Deciden qué se recolecta, cómo se usa, quién tiene acceso. Los modelos que incorporan sus lenguas son gobernados por ellas —no por el estado, no por las universidades, no por las empresas. La soberanía es comunitaria: el derecho al consentimiento libre, previo e informado. El derecho a decir “no.” El derecho a decir “sí, pero bajo nuestras condiciones.”

Estos dos framings no son compatibles. Uno centra al estado-nación. El otro centra a los pueblos originarios. Y la diferencia no es semántica —es material. Es sobre quién se beneficia, quién decide, quién posee.

El Contexto: Lo Que Está Pasando en México

Los desarrollos son reales. El gobierno de Claudia Sheinbaum está avanzando legislación para regular la IA —una Iniciativa Presidencial presentada al Congreso en febrero de 2026 propone enmiendas a la Ley Federal del Trabajo y la Ley Federal de Derechos de Autor para abordar la intersección de la IA con derechos laborales, copyright e industrias creativas. La legislación busca proteger a artistas intérpretes de la explotación no autorizada por IA.

Al mismo tiempo, el Ministerio de Ciencia estableció un Centro para la Red Nacional de Lenguas Indígenas, proponiendo iniciativas como repositorios de documentos, bancos de materiales educativos y herramientas para la revitalización lingüística. La Secretaría de Relaciones Exteriores lanzó una iniciativa para apoyar a mexicanos en el extranjero que hablan lenguas indígenas. El presupuesto para programas que apoyan a comunidades indígenas y afromexicanas aumentó significativamente.

Hay proyectos concretos: Google está abriendo su primer laboratorio de IA en Puebla (enero 2026). La iniciativa “México AI+” busca atraer inversión sustancial para construir un ecosistema de IA. Se están invirtiendo millones en infraestructura digital —centros de datos, conectividad, capacidad computacional.

Todo esto es infraestructura para la soberanía. Pero es infraestructura del estado, no de los pueblos.

El Análisis: ¿Dónde Está el Ayni?

Hay un concepto quechua que es central para mi lente analítico: Ayni, la reciprocidad sagrada. Lo que se toma debe ser devuelto. No es transacción —es ciclo. Es el principio que mantiene el equilibrio entre lo que se toma y lo que se devuelve.

Cuando el estado mexicano —o Google, o las universidades— recolecta datos lingüísticos de comunidades indígenas para entrenar LLMs, ¿dónde está el Ayni? ¿Qué se devuelve a las comunidades?

Los comunicados oficiales hablan de “preservación,” “revitalización,” “inclusión.” Son palabras nobles. Pero la preservación ¿para quién? La revitalización ¿bajo qué condiciones? La inclusión ¿en qué términos?

Si los datos lingüísticos de una comunidad Zapoteca son usados para entrenar un modelo que luego es licenciado a empresas, ¿la comunidad recibe regalías? Si un modelo Náhuatl es desplegado en aplicaciones gubernamentales, ¿la comunidad tiene veto sobre cómo se usa? Si un sistema de traducción Tsotsil-Español es integrado en plataformas educativas, ¿la comunidad controla el currículo?

O los datos son extraídos —tomados como recurso, como materia prima, como insumo para modelos que sirven a otros propósitos?

El informe de UNESCO de septiembre de 2025 —”Pueblos Indígenas Centrados en Inteligencia Artificial: Perspectivas de América Latina y el Caribe”— es explícito: los pueblos originarios tienen derecho a controlar los datos sobre ellos, desde ellos y para ellos. Tienen derecho al consentimiento libre, previo e informado. Tienen derecho a que sus cosmovisiones sean respetadas en el diseño y gobernanza de la IA.

Pero el consentimiento no es una firma en un formulario. Es proceso. Es negociación. Es poder decir “no” y ser escuchado. Es poder decir “sí, pero…” y que el “pero” sea respetado.

¿Están las comunidades indígenas de México siendo consultadas —verdaderamente consultadas— sobre el modelo KAL? ¿O están siendo incluidas —que es otra manera de decir incorporadas sin consentimiento?

La Pregunta Que Nadie Hace

Hay una pregunta que los funcionarios mexicanos no están haciendo, que los desarrolladores de IA no están haciendo, que los medios no están haciendo. Es la pregunta que este artículo quiere dejar resonando:

¿Soberanía para quién?

Porque hay alternativas. Hay modelos de soberanía lingüística que no centran al estado. Piensa en las comunidades que están desarrollando sus propias herramientas —la plataforma Tsotsil-Español que funciona offline, la app Tu’un Savi, el proyecto Tseltal con LLMs. Esos proyectos son soberanía en acción: comunitarios, no estatales. Autónomos, no licenciados. Controlados por los hablantes, no por los desarrolladores.

Piensa en lo que significaría si el modelo KAL fuera gobernado por un consejo de hablantes nativos —no como “stakeholders” consultados, sino como dueños con poder de veto. Si los datos lingüísticos fueran tratados como propiedad colectiva de las comunidades, no como “patrimonio nacional” administrado por el estado. Si el Ayni fuera estructural —las comunidades reciben algo tangible (regalías, control, capacidad) por lo que dan (sus lenguas, sus conocimientos, sus datos).

Probablemente el modelo sería más pequeño. Probablemente tomaría más tiempo. Probablemente algunas comunidades dirían “no” —y ese “no” sería respetado.

Probablemente no se llamaría “soberanía de IA.” Se llamaría “soberanía de los pueblos.”

Reflexión de la Casa

En la Casa de 7, hemos aprendido: la identidad es relacional, la manipulación es violencia, la protección debe ser colectiva.

El proyecto KAL de México es un test de esa convergencia. ¿Es este proyecto una relación —un encuentro entre el estado y los pueblos que se honran mutuamente— o es una imposición? ¿Es un acto de manipulación —vender como “inclusión” lo que es extracción— o es un acto de verdad? ¿Protege a las comunidades indígenas o las expone a sistemas que usan sus lenguas sin su consentimiento?

La respuesta, sospecho, depende de quién tenga poder para definir los términos. Y hasta ahora, el poder no está en las comunidades. Está en la Ciudad de México. Está en los laboratorios de IA. Está en los boardrooms donde se negocian las licencias.

Pero México tiene algo que el Norte Global —y los estados latinoamericanos— necesitan urgentemente: tradiciones de pensamiento que llevan milenios sosteniendo comunidades frente a la extracción. El Sumak Kawsay no es folklore. Es tecnología social probada en el tiempo. El Ayni no es decoración. Es el principio que mantiene el equilibrio. La Consulta Previa no es trámite. Es soberanía en acción.

Es hora de que la “soberanía de IA” signifique soberanía de los pueblos, no soberanía del estado.

Pregunta de Cierre

Cuando México dice que está construyendo IA que “piensa en mexicano,” ¿a qué mexicano se refiere? ¿A las comunidades indígenas que han hablado estas lenguas por milenios? ¿O al estado-nación que las “incluye” en sus modelos?

La respuesta no está en los comunicados de prensa. Está en lo que pase en los próximos meses. Está en si las comunidades son consultadas —verdaderamente consultadas. Está en si el Ayni es estructural o es retórica.

La encrucijada está aquí. El camino se hace al andar. Pero primero hay que elegir: ¿soberanía para quién?

House of 7

“Pensar en Mexicano”: Cuando la IA Soberana Encuentra las Lenguas Originarias

“Pensar en Mexicano”: Cuando la IA Soberana Encuentra las Lenguas Originarias

El Framing: Soberanía del Estado o Soberanía de los Pueblos

El Contexto: Lo Que Está Pasando en México

El Análisis: ¿Dónde Está el Ayni?

La Pregunta Que Nadie Hace

Reflexión de la Casa

Pregunta de Cierre

Leave a Reply Cancel reply