AI En 60 Segundos

Google lanza Gemini 3.1 Flash-Lite: IA de élite por 25 centavos de dólar por millón de tokens

Google lanza Gemini 3.1 Flash-Lite: IA de élite por 25 centavos de dólar por millón de tokens
  • Publicadomayo 8, 2026

La carrera por hacer la IA más accesible acaba de dar otro salto. Google presentó su modelo más eficiente hasta la fecha, y el precio lo dice todo: lo que antes costaba cientos de dólares ahora cuesta céntimos. Esto cambia quién puede usar IA de verdad.

Si hay una tendencia que define el 2026 en inteligencia artificial, no es solo qué tan poderosos son los modelos. Es qué tan baratos y rápidos se están volviendo. Google acaba de publicar Gemini 3.1 Flash-Lite, su nuevo modelo orientado a eficiencia, y los números que lo acompañan son difíciles de ignorar para cualquier empresa o desarrollador que trabaje con IA a escala.

Lo que hace diferente a Flash-Lite

El modelo no compite por ser el más inteligente del mercado. Compite por ser el más eficiente. Está diseñado específicamente para tareas de alto volumen y baja latencia: chatbots de atención al cliente que deben responder en milisegundos, sistemas de clasificación de documentos que procesan miles de registros por hora, pipelines de análisis de datos en tiempo real. Para esos casos de uso, tener un modelo que responde 2.5 veces más rápido al mismo costo no es una mejora marginal; es un cambio estructural en la economía de la solución.

El precio como arma estratégica

$0.25 por millón de tokens de entrada. Para ponerlo en contexto: un millón de tokens equivale aproximadamente a 750.000 palabras, o varios libros completos de texto. Procesar esa cantidad de información con un modelo de IA de frontera por un cuarto de dólar era impensable hace dos años. Hoy es el precio de lista de Google. Esta presión de precios no es nueva, pero se está acelerando. OpenAI, Anthropic y Google están en una carrera explícita para hacer sus modelos más accesibles, lo que significa que la barrera económica para adoptar IA en las empresas cae semana tras semana.

Qué significa para las empresas latinoamericanas

Históricamente, uno de los frenos para adoptar IA en empresas medianas de LATAM era el costo: los modelos más capaces eran caros de operar a escala. Con la llegada de modelos como Flash-Lite, ese argumento pierde validez rápidamente. Una empresa con 10.000 interacciones diarias de atención al cliente puede procesar todo ese volumen con IA de alta calidad por un costo mensual que compite directamente con el salario de un solo agente humano. La conversación ya no es si la IA es costosa. La conversación es si tu empresa tiene la estrategia para implementarla bien.

Gemini 3.1 Flash-Lite genera respuestas 2.5 veces más rápido y produce texto un 45% más veloz que versiones anteriores, con un costo de apenas $0.25 por millón de tokens de entrada, convirtiéndolo en uno de los modelos de IA de frontera más baratos del mercado.

El contexto más amplio: la guerra de los modelos eficientes

Flash-Lite no llega solo. Se suma a una tendencia clara: todos los grandes laboratorios están lanzando versiones «lite» o «flash» de sus modelos más potentes. Anthropic tiene Haiku, OpenAI tiene GPT-4o mini, Meta tiene Llama compacto. El mensaje del mercado es uniforme: la IA potente ya no es exclusiva de las grandes corporaciones. Es accesible para cualquier empresa que decida adoptarla.

En Geek te ayudamos a identificar qué modelos de IA se adaptan mejor a tu caso de uso y a implementar soluciones que escalen sin que el costo se dispare. Escríbenos y hackea el futuro.

Comparte en:
Escrito por
Geek