La factura de los agentes de IA deja de ser una tarifa plana | --no-rollback

La factura de los agentes de IA deja de ser una tarifa plana

La nube era infinita hasta que alguien miró la cuenta: la industria de la IA deja atrás la era de los subsidios y entra en la del taxímetro de tokens. El avance hacia modelos de pago por uso expone el coste real de la inteligencia artificial y reabre preguntas incómodas sobre sostenibilidad, dependencia y productividad.
Rubén S.
Columnista sobre derechos algorítmicos y otras heridas digitales
12 min

Durante un par de años hemos vivido dentro de una ficción cómoda: la inteligencia artificial parecía una suscripción más, con una complejidad económica equivalente a Netflix o Spotify, algo que podíamos pagar cada mes y olvidarnos. Pagabas una cuota fija al mes, abrías ChatGPT, Claude, Copilot o Cursor, y podías convertir una tarde dispersa en una sucesión de tareas resueltas que no parecía tener final. Siempre había una issue más que cerrar. No importaba demasiado si usabas el sistema diez minutos o diez horas. El coste psicológico era el mismo que el económico.

Ha sido emocionante y hemos cambiado mucho, pero esa etapa se está acabando. Puede que ya haya terminado.

No porque la IA haya fracasado. Más bien al contrario: ha empezado a funcionar tan bien que ha llegado al punto en el que ya no concebimos una forma de trabajar que no la incluya. Cuando una herramienta pasa a ser una capacidad y cuando un servicio pasa a ser una infraestructura, alguien tiene que pagar la factura. Y esa factura nunca fue tan cómoda como una suscripción mensual.

El cambio desde suscripciones planas a límites de uso y de ahí a pago por uso, no es una simple subida de precios. Es una revelación de costes. Durante la primera fase, los usuarios veían una interfaz de chat y una cuota mensual. Los proveedores veían inferencia, GPUs, memoria, electricidad, refrigeración, acuerdos de capacidad, abuso, picos de demanda y usuarios capaces de extraer miles de dólares de valor computacional desde planes de dos o tres cifras.

Mientras el principal objetivo era el crecimiento y la adquisición de usuarios, esa tensión podía esconderse. La fiesta debía continuar. Cuando los agentes se convierten en herramientas diarias de trabajo o en fuerza de trabajo misma, ya no. Alguien tiene que pagarla.

La tarifa plana siempre fue una subvención

El software como servicio se construyó sobre una promesa elegante: paga por acceso, no por posesión. No compres servidores, no instales versiones, no mantengas tu propia infraestructura. Suscríbete. Deja que el proveedor actualice, escale y opere. Tú solo añade usuarios.

El modelo por asiento funcionó porque el asiento era una aproximación práctica a la actividad. Más empleados implicaban más uso, más valor y más disposición a pagar. No era perfecto, pero encajaba razonablemente bien con aplicaciones que los humanos usaban de forma directa: CRM, herramientas de diseño, gestores de proyectos, suites ofimáticas.

Los agentes rompen esa simetría. Un humano ya no equivale a un flujo de trabajo. Un humano puede coordinar diez agentes, cada uno con decenas de pasos, llamadas a herramientas, consultas a recursos externos y ciclos de validación. El trabajo deja de estar limitado por el tiempo de interacción manual. La actividad se emancipa de las limitaciones humanas.

Pese a estar construidas con las mismas piezas, una sesión de trabajo con agentes tiene poco que ver con una conversación casual en un chat. La primera es una cinta transportadora de inferencia: planifica, lee, escribe, ejecuta, falla, vuelve a intentarlo, llama a otra herramienta, repite, resume, corrige, pasa tests, falla, repite, decide que necesita un enfoque distinto y para cuando te quieres dar cuenta ya han desaparecido millones de tokens.

Durante un tiempo los proveedores absorbieron esos costes, o más bien sus inversores. Quizás con la esperanza de que en algún momento la adopción desequilibrara la balanza a su favor. O quizás siempre sospecharon que la adopción no crecería como una preferencia, sino como una dependencia.

Pero un día alguien de finanzas se pregunta si todo esto va a convertirse en negocio o solo una forma carísima de mejorar los README. La respuesta del mercado ha llegado: la IA sigue, el buffet libre no.

Junio de 2026 como final de una era

Que GitHub sustituya sus Premium Request Units por AI Credits tiene un efecto simbólico para los desarrolladores y directo para sus carteras. Copilot fue para muchos de nosotros la primera IA generativa integrada en el trabajo cotidiano. El cambio no consiste solo en rebautizar unidades con un nombre más financiero. La diferencia importante es que el coste pasa a estar vinculado de forma más directa al consumo real.

Los precios de los planes pueden no cambiar en la superficie. Copilot puede seguir pareciendo Copilot. Pero la experiencia económica cambia profundamente. Rompe una presunción básica: lo que antes era una licencia de productividad con un coste fijo o previsible, pasa a necesitar presupuestos, gestión activa, supervisión constante y decisiones administrativas.

Anthropic, que ya llevaba más tiempo limitando los gastos de sus usuarios, se mueve en la misma dirección. OpenAI, con Codex, y Google, con Gemini, también están siguiendo caminos similares.

Vistos por separado, estos cambios pueden parecer ajustes comerciales. Vistos juntos, son una señal de régimen. Los grandes proveedores están convergiendo hacia la misma realidad: el acceso puede seguir empaquetado como producto, pero el trabajo real se mide como infraestructura.

Altman habló en marzo de un futuro en el que la inteligencia se compraría por uso, con contadores como la electricidad o el agua. Entonces no imaginábamos que el futuro estuviese tan cerca, pero sí sabíamos que la inteligencia no es electricidad: es entre otras cosas conocimiento, creatividad, experiencia, juicio o poder. Pero desde un punto de vista operativo, la industria parece empujar hacia que la IA se parezca a un servicio público (usando la palabra utility): siempre disponible, integrado en todo, necesario para vivir y facturado regularmente.

El coste está en mantener la continuidad

La parte menos intuitiva de los agentes no es que consuman mucho al responder. Es que consumen para seguir sabiendo qué están haciendo.

En una conversación breve, el coste se entiende más o menos bien: una entrada, una salida, quizá unas cuantas rondas. En una sesión de trabajo, la unidad económica deja de ser la respuesta y pasa a ser la continuidad. El sistema necesita conservar instrucciones, historial, fragmentos de código, resultados de herramientas, errores, decisiones anteriores y parte del contexto que permite decidir el siguiente paso.

Lo que en la interfaz parece memoria, por debajo suele ser procesamiento repetido. El agente no solo avanza; arrastra una mochila de contexto. Y esa mochila pesa más cuanto más larga, ambigua o ruidosa es la tarea.

Por eso puede bajar el precio por token y, al mismo tiempo, subir la factura. No es una contradicción. Si cada unidad cuesta menos, pero cada objetivo útil requiere muchas más unidades, el resultado económico puede empeorar. La eficiencia local no garantiza eficiencia total.

Esta es la diferencia entre usar IA como asistente y usarla como proceso. El asistente ayuda en momentos concretos. El proceso permanece, observa, prueba, corrige y necesita recordar por qué está ahí. Esa persistencia es precisamente lo que lo vuelve especialmente útil. También es lo que lo vuelve particularmente caro.

Por qué empezó por el desarrollo de software

No es casualidad que la primera grieta importante aparezca en las herramientas para programar u operar sistemas. Nuestro ecosistema concentra varias condiciones que lo convierten en el laboratorio perfecto para los agentes.

La primera es que casi todo es texto, lo que mejor entienden los LLMs. Repositorios, logs, issues, tests, documentación, comandos, diffs, errores, pull requests. Un agente puede intervenir en cualquier sistema que produzca señales que una máquina pueda leer.

La segunda es que el talento es caro. Si una herramienta ahorra horas reales a perfiles bien pagados, debería existir margen económico para pagar inferencia. Un gasto mensual de cientos de euros por persona puede sonar excesivo hasta que se compara con salarios, deuda técnica, retrasos o proyectos que nunca llegan a entrar por falta de tiempo.

La tercera es que el ciclo de retroalimentación puede automatizarse parcialmente. El código compila o no. Los tests pasan o fallan. El linter protesta. El agente puede iterar con señales externas, no solo con intuición lingüística. Eso vuelve mucho más útil el ciclo de actuar, observar y corregir.

Por eso Claude Code, Codex, Copilot, Cursor y herramientas similares no son solo una categoría más dentro del mercado de productividad. Son un experimento a gran escala sobre cómo usar agentes de IA en trabajos que generen valor real. La IA de código dejó de ser autocompletado con esteroides, para convertirse en una forma de delegar trabajo digital con resultados medibles.

No deja de ser irónico que el primer software que amenaza seriamente con automatizar parte del trabajo también amenaza con romper el modelo económico clásico con el que se construía el software.

La métrica que falta: coste por cambio aceptado

Si solo analizamos los tokens consumidos, será un análisis pobre. Los tokens explican el mecanismo, pero no explican el valor. La pregunta importante no es cuánta IA hemos usado, sino qué hemos conseguido con ella.

No basta con saber cuánto gastó un equipo en IA este mes. Hay que saber cuánto costó resolver un bug, aceptar una pull request, investigar un incidente, generar un test que detectó un fallo real o completar una migración que alguien llevaba meses posponiendo. La métrica interesante será algo parecido al coste de inferencia por unidad de trabajo útil.

Un agente que genera mucho código no necesariamente crea mucho software. Puede producir más revisión, abrir más frentes, introducir deuda técnica o tomar decisiones que todavía nadie había pedido. No sólo debemos medir la actividad, tenemos que evaluar el resultado.

La tarifa plana permitía no distinguir demasiado. Si todo estaba incluido, el despilfarro quedaba escondido dentro de una sensación general de productividad. El pago por uso será más incómodo, pero también cruelmente pedagógico. Mostrará qué tareas tienen sentido y cuáles tienen un coste difícil de defender ahora que hay alguien mirando la factura.

Cuanto antes distingamos entre gasto y valor, antes dejaremos de despilfarrar tokens en tareas que no lo merecen. Cuanto antes aprendamos a medir el coste de resolver un problema, mejor podremos decidir qué problemas merece la pena resolver con agentes.

Cada organización tendrá que volver a aprender a medir el coste de su trabajo. No solo el coste humano, sino también el coste artificial.

De prompt engineering a cost engineering

Hubo un momento en que la industria convirtió el prompt engineering en profesión, broma, esperanza y consultoría, todo al mismo tiempo. Con los agentes, la disciplina se ensancha. No basta con pedir bien. Hay que pedir con arquitectura.

La nueva habilidad será algo más parecido a cost engineering para agentes. Menos vistosa que escribir un prompt brillante, pero probablemente más útil.

Habrá que elegir el modelo ideal para cada tarea, no solo por sus capacidades, sino también por su coste. Un agente puede necesitar un modelo potente para planificar una refactorización delicada, pero no para clasificar archivos, reescribir imports, formatear JSON o resumir una salida de terminal. La sofisticación real estará en diseñar procesos y sistemas que escalen o degraden capacidad según riesgo, complejidad y valor esperado.

Habrá que tratar el contexto como un recurso escaso. Darle al modelo todo el repositorio, todo el historial y toda la documentación puede parecer prudente, pero a menudo será solo pereza arquitectónica. El contexto relevante es valioso. El contexto indiscriminado es ruido facturable.

Habrá que poner presupuestos por sesiones, tareas y proyectos. Una tarea autónoma debería saber cuándo detenerse, resumir progreso y pedir permiso. Ya no es sólo seguridad, es ahorro. Un sistema que no sabe parar no es autónomo.

Y habrá que observar el coste con la misma naturalidad con la que observamos latencia, errores o uso de CPU. Los equipos necesitarán saber qué prompts producen bucles, qué herramientas devuelven demasiado texto, qué repositorios son más caros para agentes y qué tipos de tareas disparan el gasto sin entregar suficiente valor.

Todos estos cambios podrían tener consecuencias positivas. Si el contexto cuesta, la claridad sale a devolver. APIs limpias, tests fiables, documentación útil y sistemas observables harán que humanos y agentes trabajen mejor. La vieja artesanía disciplinada que ya dábamos por perdida en tiempo récord, podría volver no por romanticismo profesional, sino porque el contador de coste castiga el caos.

Qué cambia para equipos pequeños y grandes empresas

Para startups y equipos pequeños, los agentes de código son una palanca enorme. Permiten construir más rápido, mantener herramientas internas, automatizar tareas que antes requerían contratar o esperar, y convertir intención en prototipo con una velocidad nueva.

Pero el coste variable introduce fragilidad. La misma herramienta que permite ir más rápido puede crear una estructura de gasto difícil de absorber si cada flujo crítico depende de modelos caros. Una startup puede descubrir que su equipo ampliado de agentes no cobra nómina, pero sí puede pasar una factura por tokens difícil de justificar frente al valor producido.

En grandes empresas, el problema principal será político. ¿Quién decide qué uso de IA merece presupuesto? ¿Ingeniería? ¿Finanzas? ¿Cada unidad de negocio? ¿Un centro de excelencia con nombre largo y reuniones semanales?

Los créditos compartidos, límites por equipo y presupuestos por usuario son solo la primera interfaz administrativa. Detrás vendrán modelos internos, cuadros de mando por coste, políticas de aprobación para gastos extraordinarios, auditorías de ROI y discusiones sobre por qué un equipo necesita más razonamiento artificial este trimestre.

Un contador visible no solo mide, también cambia comportamientos. Delegar en agentes seguirá siendo normal, operarlos de forma eficiente será diferencial.

La inteligencia medida también mide poder

La idea de comprar inteligencia usando contadores con dígitos alarmantes no es solo un asunto de presupuestos corporativos. Tiene consecuencias sociales.

Si los mejores modelos, los contextos más largos, los agentes más capaces y las integraciones más profundas cuestan más, entonces el acceso a esa capacidad cognitiva ampliada será desigual. No solo entre quien tiene herramienta y quien no, sino entre quien puede permitirse razonamiento premium y quien vive con la versión económica, limitada o agotada.

En educación, eso puede significar tutores de distinta calidad. En trabajo, empleados con distinta capacidad. En empresas, cuales pueden competir. En países, dependencia tecnológica sobre los proveedores que controlan los modelos, precios, políticas y disponibilidad.

La crítica a la metáfora de la electricidad tiene sentido aquí. La electricidad alimenta herramientas. La inteligencia artificial empieza a participar en decisiones. Si se convierte en infraestructura básica, su gobernanza importa. Quién mide, quién cobra, quién audita, quién accede y quién puede irse a otro proveedor no son preguntas secundarias.

La tarifa plana tampoco resolvía nada de esto. Solo lo escondía detrás de una cuota amable y falsamente democratizadora.

Una madurez incómoda

Tampoco conviene romantizar tiempos pasados. La tarifa plana fue útil, divertida y probablemente necesaria para que millones de personas descubrieran qué podían hacer con IA. Pero también era una distorsión. Nos acostumbró a no mirar el coste de procesos que siempre tuvieron un coste muy superior al que pagábamos.

El pago por uso traerá discordia y fricción. Muchos usuarios sentirán que les han quitado algo que ya era suyo, aunque en realidad era una promoción extendida. Los agentes de IA no serán menos importantes porque haya que medirlos. Al revés: se medirán porque ahora realmente importan.

Quizás esa sea la señal más clara de que la IA ha dejado de ser un experimento para convertirse en una parte integral de cómo trabajamos. No es el fin de la IA, es el fin de la era de la IA como juguete. Y por ello ahora las cuentas tienen que cuadrar.