Alianza regional lanza Latam-GPT, la primera IA creada con datos latinoamericanos

Latam-GPT fue construido bajo principios éticos claros, con procesos de selección y documentación de datos que aseguran transparencia y uso responsable. 

10 de febrero de 2026

Este martes 10 de febrero se lanzó Latam-GPT, el primer Gran Modelo de Lenguaje abierto de la región, diseñado con identidad propia desde y para América Latina y el Caribe, y que es fruto de un trabajo coordinado por el Centro Nacional de Inteligencia Artificial (CENIA) en colaboración con diversas entidades regionales.

Latam-GPT representa un avance relevante para la región al proponer un modelo de Inteligencia Artificial (IA) construido con idiomas, datos y contextos propios de América Latina y el Caribe, desarrollado por talento regional para la región. A diferencia de los modelos entrenados principalmente con información en inglés y marcos culturales del Norte Global, Latam-GPT comprende los matices culturales, lingüísticos y los contextos históricos y políticos latinoamericanos. Este modelo, desarrollado por investigadores, científicos y profesionales de la región, posiciona a América Latina no solo como usuaria de tecnología de vanguardia, sino como protagonista en su creación, fortaleciendo la capacidad regional para innovar con identidad propia.

El desarrollo del primer Gran Modelo de Lenguaje abierto de la región fue liderado por el Centro Nacional de Inteligencia Artificial con el apoyo del Ministerio de Ciencia, Tecnología, Conocimiento e Innovación de Chile, el Banco de Desarrollo de América Latina y el Caribe (CAF), Amazon Web Services (AWS) y el centro tecnológico Data Observatory, además de la colaboración de diversos Estados de la región y alianzas desde la academia, organismos internacionales, y líderes tecnológicos.

El hito tecnológico contó con la presencia del Presidente de la República, Gabriel Boric; el ministro de Ciencia, Aldo Valle; el director CENIA, Álvaro Soto; el Especialista Principal de Ciudades Inteligentes y Desarrollo Digital  del Banco de Desarrollo de América Latina y el Caribe, Marcelo Facchina; el líder de Tecnología de Amazon Web Services para el Cono Sur de América Latina, Rafael Mattje; y el director ejecutivo del Data Observatory, Rodrigo Roa. Al evento asistieron también destacadas autoridades nacionales y regionales, miembros del cuerpo diplomático y diversos representantes del ecosistema tecnológico latinoamericano.

A diferencia de las soluciones comerciales cerradas, Latam-GPT fue concebido como un bien público orientado a democratizar el acceso a esta tecnología y habilitar su uso en ámbitos estratégicos como educación, gestión pública e innovación productiva. Ello, gracias a su diseño de código abierto, que permitiría a universidades, gobiernos, startups y diversas comunidades, desarrollar soluciones propias sobre una base común, transparente y trazable.

"Eso que se expresa en manifestaciones culturales de esas características también es necesario que, en estos tiempos, tenga una expresión en el lenguaje. Y el lenguaje de hoy día nos guste o no nos guste está muy determinado por la inteligencia artificial. Entonces, no tenemos que temerle, no tenemos que verla sólo como amenaza, tenemos que verla como oportunidad y eso es lo que está haciendo LATAM-GPT hoy día", sostuvo el Presidente Gabriel Boric, quien pudo ver interacciones con el modelo que ilustran cómo el sistema podría operar en el futuro, evidenciando la capacidad de éste para procesar contextos regionales con un nivel de precisión y comprensión que los modelos importados no logran alcanzar.

"Latam-GPT permite que América Latina se suba a la revolución de la IA como actor, desarrollando tecnología propia y demostrando lo que se es posible cuando la región trabaja unida", comentó el director de CENIA, Álvaro Soto.

Por su parte, el ministro de Ciencia, Aldo Valle, señaló: “Este proyecto nace desde la convicción de que la integración regional es la única vía realista para alcanzar soberanía tecnológica con sentido democrático, por eso lo articulamos mediante una gobernanza público-privada inédita, que reúne al Estado, universidades, organismos internacionales y empresas tecnológicas. Es parte de política pública robusta, con una Política Nacional de Inteligencia Artificial y con inversiones concretas en supercómputo, data centers, formación docente y modernización del Estado. Desde Chile lideramos esta iniciativa poniendo esta infraestructura al servicio de la pertinencia cultural, de nuestras lenguas, valores y tradiciones, como una herramienta de innovación para mejorar la calidad de vida de las personas y enfrentar, desde nuestras propias capacidades, los desafíos del siglo XXI”

"Latam-GPT demuestra que la colaboración regional liderada por el talento calificado de CENIA, apoyada en infraestructura tecnológica de clase mundial, puede convertir una visión en impacto real. Desde AWS, aportamos lo más avanzado en tecnología de nube e IA para apoyar el entrenamiento del modelo —una de las fases más críticas para este tipo de proyecto—, optimizando la infraestructura y reduciendo el tiempo de entrenamiento en un 64%, de 25 a 9 días", sostuvo Rafael Mattje, Líder de Tecnología de Amazon Web Services para el Cono Sur de América Latina. “Este proyecto establece un marco replicable para que gobiernos, universidades y empresas desarrollen soluciones de IA que comprendan los contextos y nuances culturales, lingüísticos e históricos de América Latina. Estamos comprometidos con democratizar el acceso a capacidades avanzadas de IA y seguiremos contribuyendo para que el talento latinoamericano construya el futuro de la tecnología", concluyó.

“En un contexto global en el que la inteligencia artificial está redefiniendo la productividad, la competitividad y el funcionamiento de nuestras economías y sociedades, América Latina y el Caribe enfrentan el desafío de construir capacidades propias para participar plenamente en esta transformación. Esto implica avanzar en el desarrollo de infraestructuras digitales estratégicas para la IA —como capacidad de cómputo, datos y conectividad— y en la generación de soluciones alineadas con las prioridades y realidades de la región. En ese marco, Latam-GPT representa un paso concreto hacia una mayor soberanía tecnológica y cultural y una oportunidad para que América Latina y el Caribe se posicionen como actores activos en la economía digital del futuro. Desde CAF seguimos comprometidos con esta agenda y dispuestos a apoyarla en toda la región”, afirmó el presidente ejecutivo de CAF, Sergio Díaz-Granados.

"Latam-GPT marca un hito en la soberanía digital de América Latina y demuestra que sí podemos ser protagonistas del desarrollo tecnológico. Como Data Observatory nos enorgullece haber aportado nuestra infraestructura en la nube, capacidad de procesamiento de datos y la experiencia de nuestro equipo para operar esta tecnología con eficiencia", comentó el director ejecutivo de Data Observatory, Rodrigo Roa.

Idiomas y datos locales

La construcción de Latam-GPT responde a una brecha histórica en el desarrollo de modelos de lenguaje a nivel global, ya que, según estimaciones basadas en repositorios abiertos como Common Crawl, los datos en español y portugués representan -respectivamente- apenas cerca del 4% y el 2% del total utilizado para entrenar este tipo de sistemas.

Esta subrepresentación implicó que las realidades latinoamericanas no fueran consideradas de manera adecuada ni en el diseño ni en el entrenamiento inicial de gran parte de los modelos disponibles hoy, quedando incorporadas, en muchos casos, a través de ajustes posteriores y mecanismos de corrección, y no como parte constitutiva de su arquitectura.

Frente a este escenario, Latam-GPT fue entrenado desde su origen para comprender las variantes del español y el portugués, así como las historias, memorias e identidades culturales de la región. Esto permitió procesar, generar y analizar idiomas de manera situada y contextualizada, con potencial aplicación en investigación, gestión pública y desarrollo tecnológico.

Una colaboración regional sin precedentes liderada por talento latinoamericano

Para llegar a la creación de un modelo 1.0 de Latam-GPT, el proceso consideró la recolección y curaduría de datos, además de un periodo de pre-training y post-training.

Cabe mencionar que el modelo se desarrolló sobre una arquitectura base Llama 3.1 – 70 mil millones de parámetros, complementada con un corpus regional -un conjunto organizado de textos y contenidos con los que se entrena un modelo de lenguaje y que le permite comprender el contexto cultural e identitario de la región- obtenido bajo permisos. Ello, además de benchmarks adaptados al contexto latinoamericano y una documentación rigurosa en materia ética y de gobernanza.

La construcción de Latam-GPT fue posible gracias a una colaboración inédita entre instituciones públicas, académicas y tecnológicas de la región, articulando a más de 100 profesionales y más de 60 instituciones de 15 países, que aportaron datos, conocimiento y experiencia técnica.

En este esfuerzo regional, el CENIA y el Ministerio de Ciencia, Tecnología, Conocimiento e Innovación de Chile, desempeñaron un rol clave al coordinar puntos focales en los países participantes, lo que permitió canalizar la búsqueda, selección y aporte de datasets representativos de la región.

En total, se reunieron más de 300 mil millones de tokens de texto plano, equivalentes a alrededor de 230 mil millones de palabras, obtenidos bajo permisos y licencias explícitas, curados de tal manera de asegurar la anonimización de datos y eliminar elementos tóxicos (como noticias falsas o discriminación, por ejemplo). Gracias a ese proceso, el modelo cuenta con un dataset de alta calidad en áreas como humanidades y ciencias sociales, educación, ciencias de la salud, políticas públicas, economía, medioambiente, artes y pueblos indígenas.

Impulso a la innovación

Latam-GPT nace con una convicción estratégica: poner la Inteligencia Artificial al servicio de las personas, propósito que requiere dominar la tecnología, comprender sus impactos y definir reglas claras para un diseño responsable.

Uno de los objetivos centrales del proyecto es fortalecer las capacidades técnicas de América Latina para liderar sus propios procesos de innovación.

Para el director de CENIA, “Latam-GPT no es un fin en sí mismo, sino una base tecnológica abierta que permite desarrollar modelos derivados y aplicaciones adaptadas a distintos contextos regionales, apoyadas por herramientas y materiales que facilitan su uso y evolución. De este modo, la región no es solo usuaria de IA, sino que puede crear soluciones propias a partir de capacidades compartidas”.

Con un impacto proyectado que podría mejorar la productividad de hasta el 50% de la fuerza laboral latinoamericana, Latam-GPT queda a disposición de gobiernos, universidades y emprendedores como una plataforma abierta para el desarrollo de soluciones éticas, transparentes y alineadas con las necesidades de la región.

El éxito del proyecto posiciona a Chile y a América Latina como referentes globales en el desarrollo de una Inteligencia Artificial abierta, colaborativa y con identidad propia.

Suscríbete a nuestra newsletter