Llevo meses viendo el mismo patrón: organizaciones que se lanzan a desplegar Copilot Studio con la emoción de la novedad, crean un "Super Agente" que lo hace todo... y al mes siguiente se llevan las manos a la cabeza cuando ven el reporte de consumo de créditos.
La realidad es que el modelo de "tarifa plana" mental que tenemos con las licencias de usuario (ese cómodo "30€ por usuario/mes y olvídate") no aplica aquí de la misma forma. En el mundo de los Agentes y Copilot Studio, cada interacción tiene un precio, y la diferencia entre diseñar bien o mal puede significar un coste 10 veces superior.
El taxímetro invisible: no todas las palabras valen lo mismo
Imagina que tienes un asistente humano, llamémosle Carlos. Si le preguntas a Carlos "¿Qué hora es?", él mira su reloj y te responde. Gasto de energía: mínimo.
Pero si le preguntas a Carlos "¿Cómo han evolucionado las ventas en comparación con el Q3 del año pasado en la región norte?", Carlos tiene que:
- Levantarse de la silla.
- Ir al archivo.
- Buscar las carpetas de 2024 y 2025.
- Leer los informes.
- Cruzar los datos.
- Redactar una conclusión.
En Copilot pasa exactamente lo mismo. Y Microsoft nos cobra el esfuerzo de "levantarse de la silla".

Desglosando la factura: Los 6 niveles de consumo
Vamos a profundizar en qué ocurre realmente bajo el capó cuando un usuario pulsa "Enviar".
1. Classic Answer: La vieja confiable (1 crédito)
Esto es lo que hacíamos con Power Virtual Agents antes de la fiebre de la IA Generativa. Es lógica determinista pura. Si el usuario dice "A", el bot responde "B".
El matiz importante: Muchos arquitectos desprecian esto por "antiguo", pero es tu mejor arma de ahorro. Si tu bot tiene que saludar, dar instrucciones de uso o responder preguntas estáticas de la política de empresa (que no cambian), usa temas clásicos. No gastes potencia de cálculo para decir "Hola, soy tu asistente".
2. Generative Answer: Improvisación con conocimiento general (2 créditos)
Aquí Copilot usa el LLM para redactar. Le das una fuente pública (tu web, un PDF genérico) y él construye la frase. Es barato (2 créditos) porque, aunque usa IA para redactar, no tiene que hacer la parte difícil: contextualizar con tus datos privados de forma segura.
3. Agent Action: Cuando el bot "toca" botones (5 créditos)
Aquí es donde veo muchos errores de concepto. "Ejecutar una acción" cuesta 5 créditos. Pero, ojo, esto es el "peaje" de Copilot Studio por llamar a la acción.
Imagina este escenario: Tienes un agente que llama a un flujo de Power Automate para crear un pedido en SAP.
- Copilot Studio te cobra 5 créditos por invocar la acción.
- Power Automate te cobra su propia ejecución (según licencia per flow o per user).
Estás pagando dos veces: una por la "inteligencia" de decidir llamar a la acción, y otra por la "fuerza bruta" de ejecutarla.
4. Content Processing: El coste oculto de la lectura (8 créditos)
Esto suele pillar desprevenidos a mis clientes. Copilot cobra por "estudiar".
Si subes un documento de 50 páginas a Copilot Studio para que sirva de base de conocimiento (Knowledge Source), el proceso de indexarlo y procesarlo tiene un coste. Y si en tiempo de ejecución le pides que analice un archivo adjunto que acaba de subir el usuario ("Analízame este PDF"), eso son 8 créditos.
Consejo de trinchera: No uses Copilot para procesar documentos masivos recurrentemente si puedes hacerlo con un flujo de procesamiento de documentos en segundo plano (AI Builder), que puede ser más eficiente en costes según el volumen.
5. Tenant Graph Grounding: La joya de la corona (10 créditos)
Aquí llegamos al punto crítico. 10 créditos. Es la interacción más cara estándar.
¿Por qué? Porque el Grounding (anclaje) con tus datos de Microsoft 365 es una obra de ingeniería compleja. Para responder "¿Qué dijo María sobre el proyecto X?", el sistema hace esto:
- Inferencia de intención: Entiende qué buscas.
- Microsoft Graph Search: Busca en todo tu tenant (emails, chats, OneDrive).
- Security Trimming: Verifica uno a uno si TÚ tienes permiso para ver esos documentos. El sistema nunca te mostrará algo que no podrías encontrar buscando tú mismo.
- RAG (Retrieval-Augmented Generation): Coge los trozos relevantes, se los pasa al LLM y le dice "Usa esto para responder".
- Generación y citado: Redacta la respuesta y añade las referencias.
Es magia, sí. Pero la magia cuesta. Un agente que abuse del Graph Grounding para consultas triviales se comerá tu capacidad asignada en días.
6. AI Tools avanzadas (15 - 100 créditos)
Si usas generadores de imágenes (DALL-E) o modelos especializados, el precio sube. Aquí no hay mucho misterio: cuanta más GPU necesita Microsoft, más créditos necesitas tú.
El nuevo modelo de Licenciamiento: Adiós Mensajes, Hola Créditos
Si vienes del mundo de Power Virtual Agents, olvida la palabra "sesión" y "mensaje facturable". Desde septiembre de 2025, el modelo ha cambiado radicalmente para unificarse bajo el concepto de Copilot Credits.
Todo se suma en el Tenant
Antes comprabas capacidad para "tu bot". Ahora, compras capacidad para "tu empresa". Los créditos se acumulan a nivel de tenant (organización). Esto significa que si el Agente de RRHH tiene poco uso este mes, sus créditos sobrantes pueden ser consumidos por el Agente de Ventas que está a tope por cierre de trimestre. Es un modelo mucho más flexible y justo.
Las dos vías de pago
Tienes dos formas de llenar el depósito de gasolina:
- Capacity Packs (Suscripción): Compras paquetes de 25.000 créditos/mes (aprox. 200$). Es tu "tarifa plana" base. Ojo: los créditos no consumidos NO se acumulan al mes siguiente (use it or lose it).
- Pay-As-You-Go (Azure): Conectas tu entorno a una suscripción de Azure. Si te pasas de tus 25.000 créditos, el servicio no se para, sino que empiezas a pagar por crédito consumido.
¿Y si tengo Microsoft 365 Copilot?
Aquí hay una "letra pequeña" beneficiosa. Si tus usuarios ya tienen licencia de Microsoft 365 Copilot y usan agentes dentro del ecosistema M365 (Teams, SharePoint) que solo usan capacidades estándar (respuestas generativas sobre sus datos), muchas veces ese consumo está incluido en su licencia de usuario. Pero en el momento que tu agente hace una acción externa (llamar a una API, usar un conector premium), empieza a descontar créditos del tenant.
Conclusión
No tengas miedo a usar las capacidades avanzadas; para eso están. Pero úsalas con intención. La próxima vez que diseñes un agente, pregúntate: "¿Esta respuesta necesita consultar el Graph (10 créditos) o me vale con una respuesta generativa simple (2 créditos)?". Tu presupuesto de TI te lo agradecerá.
Aún no hay comentarios. ¡Sé el primero en comentar!