Establezca presupuestos de IA a nivel de usuario, espacio de trabajo u organización, y detecte el gasto descontrolado de IA a tiempo.
por Kevin Stumpf
• Las cargas de trabajo de IA crean nuevos desafíos de gestión de costos, como bucles de reintento descontrolados o experimentación de agentes sin control, lo que hace que los controles de presupuesto de la nube tradicionales sean insuficientes para la adopción moderna de la IA.
• Los Controles de Gasto de IA de Unity AI Gateway introducen alertas de presupuesto proactivas para usuarios, espacios de trabajo, casos de uso y cuentas completas, ayudando a las organizaciones a monitorear y contener los costos de IA antes de que se conviertan en riesgos comerciales.
• Combinado con las tablas del sistema de Unity Catalog y los presupuestos de Databricks, Unity AI Gateway proporciona una gobernanza unificada para el uso de IA, visibilidad de costos y responsabilidad operativa para modelos, agentes, MCPs y proveedores.
Hoy, anunciamos Controles de Gasto en IA en Unity AI Gateway. Esta versión amplía la visibilidad de costos existente de Unity AI Gateway con alertas de presupuesto proactivas para darle control total sobre el gasto en IA de su organización, desde los agentes de codificación que sus desarrolladores usan a diario, hasta los agentes de producción que atienden a sus clientes, y los trabajos por lotes que se ejecutan durante la noche:

Las cargas de trabajo de IA ofrecen un valor desproporcionado, pero su perfil de costos es fundamentalmente más difícil de gestionar que su gasto tradicional en la nube:
Los empleados de ingeniería, soporte, ventas y operaciones están adoptando la IA más rápido que cualquier tecnología en la última década, desbloqueando nuevos casos de uso semana tras semana. Pero esa adopción trae un desafío de gestión: el uso de modelos fundacionales ahora abarca docenas de equipos, cientos de usuarios y miles de agentes con una mezcla cambiante de proveedores y niveles de modelos. Los controles de gasto deben aplicarse uniformemente en todas las cargas de trabajo de IA, para que su organización pueda adoptar la IA con confianza sin preocuparse por sorpresas en la factura.
Si bien los controles de gasto deben aplicarse uniformemente, diferentes partes de su organización necesitan diferentes controles de costos. Un equipo de plataforma se preocupa por los totales de todo el espacio de trabajo. Un líder de FinOps se preocupa por el consumo mensual a nivel de organización. Un gerente de ingeniería se preocupa por los presupuestos de experimentación por desarrollador. Los Controles de Gasto en IA le permiten configurarlos todos desde un solo lugar y están profundamente integrados con los presupuestos existentes de Databricks:
Para realizar un seguimiento del gasto en IA de su organización, siga estos pasos:

Cuando se supere uno de sus presupuestos, recibirá un correo electrónico de notificación:

La sección Costo de la consola de su cuenta le permite responder a los correos electrónicos de alerta de presupuesto o monitorear proactivamente el estado de sus presupuestos activos. En la página Presupuestos , verá de un vistazo cómo evolucionan sus presupuestos:

Abra cualquier presupuesto para ver cómo evoluciona su gasto en IA:

Si configuró umbrales de presupuesto a nivel de usuario, la página de detalles del presupuesto le mostrará cómo evoluciona el gasto individual en IA de los usuarios de su organización. Cuando los usuarios superan su umbral individual, su estado y gasto se muestran claramente para que pueda actuar rápidamente:

Para aumentar el umbral de un presupuesto, simplemente puede editar el Presupuesto y modificar sus límites de gasto.
Los presupuestos de Unity AI Gateway le ofrecen una visión general de alto nivel del gasto por usuario y por presupuesto. Para analizar más a fondo qué usuarios, modelos o casos de uso están impulsando su gasto, puede utilizar las capacidades de seguimiento de costos existentes de Unity AI Gateway. Cada solicitud se registra en las tablas del sistema de Unity Catalog con costos de DBU y no solo recuentos de tokens. El rendimiento aprovisionado, el tiempo de actividad, el uso de pago por token e incluso los costos de tokens de los proveedores de modelos externos se calculan automáticamente. Puede segmentar los datos de la forma en que su organización realice el seguimiento del gasto:
Acceda al panel de Análisis de Costos navegando a la página de Unity AI Gateway en su espacio de trabajo de Databricks y haga clic en “Ver panel”:

Esto abre un panel de análisis de uso y costos que puede personalizar completamente:

Los Controles de Gasto en IA son una extensión natural de las capacidades de gobernanza que ya utiliza en Databricks:
Databricks le proporciona un sistema único y consistente para gobernar lo que sus agentes pueden hacer, para quién pueden hacerlo y cuánto pueden gastar al hacerlo. ¡Comience hoy mismo!
(Esta entrada del blog ha sido traducida utilizando herramientas basadas en inteligencia artificial) Publicación original
Suscríbete a nuestro blog y recibe las últimas publicaciones directamente en tu bandeja de entrada.