LATAM GPT y la apuesta por una IA que entienda América Latina
“Cuando los modelos globales de inteligencia artificial describen Latinoamérica, suelen imaginarse llamas, ceviches y ruinas. Omar Florez, un destacado arequipeño, Doctor en Computación trabaja hoy en el preentrenamiento contínuo de lo que será la IA que entiende a América Latina más que ninguna otra.”
Hoy hablaremos de la “Soberanía digital, el sesgo cultural en modelos de IA y el surgimiento de LATAM GPT como respuesta regional.
Tiempo de lectura estimado: “8 minutos”
LATAM GPT y la apuesta por una IA que entienda América Latina
Pídele a cualquier modelo de inteligencia artificial que genere “una imagen realista de la mujer peruana”. Con alta probabilidad obtendrás a alguien sosteniendo una llamita, con un plato de ceviche al frente y Machu Picchu como telón de fondo. No es maldad. tampoco es conspiración. Es solo la estadística de lo que da como resultado actualmente la IA generativa en base a los modelos que aprenden de lo que tienen, y lo que tienen sobre América Latina es, en su mayoría, postales para turistas.
Eso —esa reducción de 650 millones de personas a unos cuantos íconos exóticos— es lo que en inteligencia artificial se llama sesgo. Y es exactamente el problema que un grupo de investigadores, liderados desde Chile y con la participación de más de 30 instituciones en 20 países, decidió atacar de frente con LATAM GPT: el primer modelo de lenguaje construido en América Latina, para América Latina.
La revolución más rápida de la historia a la que nadie tuvo tiempo de adaptarse
Antes de entender por qué LATAM GPT importa, Omar Florez nos advierte que debemos entender la escala del fenómeno que intenta corregir. ChatGPT, lanzado en noviembre de 2022, alcanzó 800 millones de usuarios activos semanales en apenas 17 meses desde su lanzamiento, estableciendo el récord de adopción más rápida en la historia de la tecnología. Para poner esa cifra en contexto: TikTok tardó nueve meses en llegar a 100 millones de usuarios; Instagram, casi dos años y medio; Facebook, cuatro años y medio. La IA lo hizo en dos meses.
Lo que esto significa no es solo un hecho impresionante para slides de presentación. Significa que la sociedad —los sistemas laborales, los marcos regulatorios, los sistemas educativos, la psicología colectiva de las personas— no tuvo tiempo de prepararse. Cada revolución tecnológica anterior dejó espacio para el duelo y la adaptación.
La Revolución Industrial tardó dos siglos en desplegarse. La era de la electricidad, varias décadas. Esta, en cambio, sugiere que las fases de adopción tradicionales se están solapando en el tiempo, ha pasado de ser una curva suave a un acantilado.
El resultado práctico lo describe con brutal honestidad José Miguel Ucendo en el episodio de la Cápsula Digital: la promesa de que la IA nos daría más tiempo libre está, de momento, incumpliéndose. Lo que ocurre en las empresas no es que los trabajadores ganen 12 horas de margen semanal, sino que se les pide producir lo que antes era el trabajo de 12 horas extra, en el mismo tiempo de siempre. La herramienta amplía la capacidad. El sistema extrae esa capacidad ampliada. Bienvenido al capitalismo de siempre, con superpoderes.
Un niño de Arequipa que quería ser astronauta y aprendió que sí se puede
Omar Florez nació en Arequipa, estudió en la Universidad Nacional de San Agustín (UNSA) y desde pequeño se hizo una pregunta incómoda:
¿Por qué en Perú no se fabrican tecnologías? Los celulares vienen de otra parte. Los computadores, de otra. Los carros, de otra. La curiosidad lo llevó a una conclusión que muchos evitan articular: para entender cómo funciona esto, había que salir. Y salió.
Omar estudió el doctorado becado en Estados Unidos —tras recibir también becas de Chile y Brasil— y pasó una década trabajando en empresas que no suelen aparecer en los CVs latinoamericanos: IBM Research, Intel Labs en Santa Clara, Capital One, el equipo de investigación de Twitter donde desarrolló modelos multilingüe y sistemas de detección de toxicidad. En los eventos de inteligencia artificial, cuenta, siempre se encontraba con los mismos: una pequeña congregación de latinos en un océano de ingenieros chinos e indios.
Eso lo llevó a fundar LatinX in AI, una organización que financia a investigadores latinoamericanos para asistir a las conferencias más importantes del sector. Y eventualmente a CENIA para entrenar al LATAM GPT: la conclusión lógica de dos décadas observando que la región produce talento pero no tecnología propia.
El sesgo no es un bug sino el sistema funcionando exactamente como fue diseñado
Los sesgos culturales en los modelos de IA no provienen de que sus creadores sean malas personas, sino de algo más difícil de combatir: la distribución de datos.
Los modelos de IA funcionan analizando grandes conjuntos de datos de entrenamiento para identificar patrones y correlaciones, y esos datos reflejan el mundo tal como está documentado digitalmente. El mundo está documentado, predominantemente, en inglés. Las evaluaciones de modelos de lenguaje a escala global permanecen limitadas en contextos lingüísticos diversos, y los benchmarks existentes suelen medir conocimiento factual más que generación de contenido en idiomas no dominantes.
Lo que Omar Florez explica en términos técnicos es que muchos modelos que supuestamente hablan español, en realidad están hablando desde traducciones del inglés. No procesan el español desde adentro: lo mapean desde afuera. Es la diferencia entre alguien que vivió veinte años en Buenos Aires y alguien que aprendió a imitar el acento en YouTube. El resultado puede sonar igual. No es igual.
El efecto concreto lo describió el equipo del CENIA de Chile con un experimento sencillo: cuando los investigadores le pidieron a ChatGPT una descripción de la cultura latinoamericana en 500 caracteres, el modelo respondió sobre arte, calidez, comunidad y celebración de la vida. Una respuesta que podría aplicarse a cualquier cultura y que no dice nada de nada. La diversidad lingüística de los pueblos originarios, ausente. Las diferencias de clase que atraviesan la historia política de cada país, ausentes. Las tensiones territoriales que definen identidades enteras, ausentes.
No es que el modelo mienta. Es que simplemente no sabe. Y cuando no sabe, construye el promedio más seguro con los datos que tiene: el estereotipo.
300 millones de documentos y la rebeldía de un arequipeño
LATAM GPT es técnicamente una versión del modelo abierto LLaMA 3 de Meta, en su versión de 70 mil millones de parámetros. Edu Al Peirano expuso el ejemplo de TOYOTA, que empezó desmontando coches de FORD para entender cada mecanismo y luego se convirtió en el fabricante de coches que más produce en el mundo. La analogía es precisa y la usa el propio Omar Flores: Japón tomó tecnología existente, la desarmó, la estudió y construyó algo propio. Con el tiempo, ese algo propio se convirtió en la marca más fabricada del mundo.
El proyecto reúne más de 50 alianzas técnicas en 15 países de la región, con apoyo del banco de fomento regional CAF y una alianza público-privada que articula al Estado, la academia a través del CENIA, y líderes tecnológicos como AWS. Los datos recopilados —cerca de 300 millones de documentos en español, portugués e inglés, en palabras de Flores en el episodio— representan según el propio proyecto aproximadamente 17,5 terabytes de información inédita, proveniente en gran parte de fuentes externas a internet. Es el dataset más grande en español y portugués construido con foco regional.
La elección de partir de LLaMA 3 en lugar de entrenar desde cero no es una concesión: es inteligencia estratégica. Entrenar desde cero modelos de esa escala cuesta cientos de millones de dólares. El proceso de “continued pretraining” —continuar el entrenamiento de un modelo base con datos específicos— permite ajustar la distribución de conocimiento sin gastar ese capital. El modelo, explica Florez, aprende más sobre Latinoamérica sin olvidar lo que ya sabía. Como llevar a alguien que ya terminó primaria en Estados Unidos y meterle a la secundaria en Latinoamérica.
La primera empresa que utilizará el modelo será la chilena Digevo, que desarrollará robots conversacionales especializados en servicio al cliente para aerolíneas y empresas de retail, capaces de reconocer jerga, modismos e incluso la velocidad del habla, reduciendo los sesgos de otros modelos.
La IA como infraestructura, no como chatbot
Hay una confusión persistente que el propio Omar Florez aborda en el episodio con una metáfora poderosa. Cuando alguien construyó la ruta Panamericana, no lo hizo pensando en conectar a una persona con su trabajo. Lo hizo pensando en conectar regiones, economías, culturas. La carretera es infraestructura. La IA debe entenderse de la misma manera.
No es una página web donde preguntas cómo hacer lomo saltado y recibes una receta. Es una plataforma que puede mejorar el sistema judicial de un país, transformar las consultas médicas en zonas rurales de Colombia, automatizar partes del proceso legislativo que hoy tardan ocho meses porque nadie llega a consenso.
La IA no es la bombilla eléctrica: es la red eléctrica.
OMAR FLOREZ, PHD
Esto tiene consecuencias directas para la discusión sobre regulación, que en muchos países de la región oscila entre el pánico y la ignorancia. Si sobreregulas una tecnología en etapa incipiente, lo que produces no es seguridad sino exclusión. Te conviertes en usuario permanente de tecnología que otros construyeron y otros controlan. La soberanía digital no es un concepto romántico; es una variable económica concreta. Las inversiones de Brasil en IA dentro de su Plan 2024-2028 proyectan 4 mil millones de dólares y se inscriben en un proyecto de posicionamiento científico y tecnológico de largo plazo. Cuando un país invierte así, no solo compra herramientas: compra la capacidad de decidir cómo esas herramientas funcionan para su propia gente.
El “no” como horizonte y el “no todavía” como brújula
Hay un momento del episodio que vale quedarse con él. Omar Florez habla del ecosistema de Silicon Valley no como un lugar geográfico —Mountain View, Palo Alto, San Francisco; la capital del valle migra con las empresas que la definen— sino como una cultura del “hay un amigo que trabaja en algo parecido”. Un entorno donde la primera respuesta ante una idea descabellada no es decirte que no puedes, sino preguntarte con quién ya estás conectado.
América Latina, dice Florez, lleva recibiendo “no” desde niños. No puedes ser astronauta porque no naciste en el país correcto. No pueden construir carros porque eso se hace en otra parte. No pueden hacer inteligencia artificial porque para eso se necesita Harvard. Cada “no” calibra la ambición hacia abajo. LATAM GPT es, entre otras cosas, un “no menos” en ese trayecto. Una señal visible de que el espacio existe, de que el talento ya está ahí, y de que la barrera no es técnica sino narrativa.
La IA permite hoy, por primera vez, convertir muchos de esos “no” en “no todavía” de una manera materialmente accesible. Las mejores clases de Stanford sobre machine learning están en YouTube. Las herramientas para construir agentes, disponibles sin costo. Los modelos base, de código abierto. Lo que hace falta no es tecnología: es la certeza de que la tecnología no es territorio ajeno.
Lo que se juega ahora no se puede diferir
El código, según datos de GitHub que Florez cita en el episodio, pasó de ser generado por IA en un 8% hace tres años a un 40% hoy. Si la curva se extrapola linealmente, en el 19 de abril de 2030 ese porcentaje alcanzará el 100%. Esto no significa que los programadores desaparezcan: significa que el acto de programar se transforma tan radicalmente que quien no entienda la lógica detrás quedará fuera no por falta de código, sino por falta de comprensión.
Cada revolución tecnológica anterior separó a los países que sabían construir de los que solo sabían comprar. La diferencia entre las dos categorías no es solo económica. Es política. Es la diferencia entre diseñar los algoritmos que deciden qué créditos se aprueban y cuáles se rechazan, o aplicarlos sin entenderlos. Entre construir los modelos que procesan datos médicos de tu población, o depender de que alguien en otro continente decida qué datos importan.
La ministra de Ciencia de Chile resumió el argumento con una claridad que vale guardar: los modelos de lenguaje son la esencia de la inteligencia artificial y hoy solo son desarrollados por Estados Unidos, China y algunos países de Europa. Contar con un modelo latinoamericano que dé cuenta de la cultura, el idioma y la aproximación a la vida de la región permite avanzar hacia una IA más sustentable.
LATAM GPT no pretende competir con GPT-5 o Gemini. Pretende algo más duradero: demostrar que América Latina puede ser origen de tecnología, no solo destino. Que hay un estudiante de 15 años en Ayacucho, en Medellín, en Oaxaca, que debería saber que construir inteligencia artificial no es prerrogativa de California. Y que si hay un momento para empezar a instalarlo, ese momento es exactamente ahora.
La pregunta que queda abierta —y que Omar Florez lanza al final del episodio con una honestidad que descoloca— es personal: ¿Cómo quieres tú cambiar tu realidad, y qué herramientas tienes a la mano para hacerlo?
Pocas veces esa pregunta ha tenido tan pocas excusas para quedarse sin respuesta.
🔗 CONOCE A ► OMAR FLOREZ
🔗 CONOCE A ► JOSEMI UCENDO
Conduce: @edualpeirano
Producido en: @laparlante_pe 📢
Únete a EXPLORA: ¿Quieres colaborar o ser patrocinador en una próxima Entrevista Estelar?
Puedes escribir a: https://exploramkt.com/contacto
Te buscamos a ti, que tienes una Marca con Propósito, explorando y viajando hacia la Conquista de tu espacio en el Universo Digital.
📱Suscríbete al canal y comparte este video @exploramkt
🎧 Explora Cápsula Digital 🌐exploramkt.com 📩 hola@exploramkt.com
💲 PROMOCIONES
🎁 Código de Descuento: EXPLORA
👉 HOSTINGER – www.hostinger.com/explora
👉 METRICOOL – https://f.mtr.cool/EXPLORA26
👉 CAPCUT – https://www.capcut.com/capcut_pc_web/fission_receive?code=JagHlc24056063&lng=en
“No vendemos productos, creamos experiencias que transforman vidas” – Edu Al Peirano
🚀 Todos los derechos reservados. Explora Marketing Digital.
Este artículo fue elaborado a partir del episodio de la Cápsula Digital de Explora Marketing Digital, con Omar Flores (PhD en Computación, líder del preentrenamiento de LATAM GPT) y José Mi (productor y creador de contenido). Investigación complementaria basada en fuentes de CENIA Chile, Euronews, Infobae y la Universidad de Chile.
[“Omar Flores”, “José Miguel Ucendo”, “Edu Al Peirano”, “Sam Altman”, “Gabriel Boric”]
[“LATAM GPT”, “LatinX in AI”, “CENIA Chile”, “LLaMA 3 (Meta)”]