Defina orçamentos de IA no nível de usuário, workspace ou organização, e identifique gastos descontrolados de IA logo no início.
por Kevin Stumpf
• As cargas de trabalho de IA criam novos desafios de gerenciamento de custos, como loops de repetição descontrolados e experimentação de agentes sem controle, tornando os controles orçamentários tradicionais da nuvem insuficientes para a adoção moderna da IA.\r\n• Os Controles de Gastos de IA do Unity AI Gateway introduzem alertas orçamentários proativos para usuários, workspaces, casos de uso e contas inteiras, ajudando as organizações a monitorar e conter os custos de IA antes que se tornem riscos de negócios.\r\n• Combinado com as tabelas de sistema do Unity Catalog e os orçamentos da Databricks, o Unity AI Gateway oferece governança unificada para o uso de IA, visibilidade de custos e responsabilidade operacional entre modelos, agentes, MCPs e provedores.
Hoje, estamos anunciando os Controles de Gastos de IA no Unity AI Gateway. Esta versão estende a visibilidade de custos existente do Unity AI Gateway com alertas de orçamento proativos para dar a você controle total sobre os gastos de IA da sua organização - desde os agentes de codificação que seus desenvolvedores usam todos os dias, até os agentes de produção que atendem seus clientes, e os trabalhos em lote executados durante a noite:

As cargas de trabalho de IA entregam um valor desproporcional - mas seu perfil de custo é fundamentalmente mais desafiador de gerenciar do que seus gastos tradicionais com a nuvem:
Funcionários de engenharia, suporte, vendas e operações estão adotando a IA mais rapidamente do que qualquer tecnologia na última década, desbloqueando novos casos de uso semana após semana. Mas essa adoção traz um desafio de gerenciamento: o uso de modelos de base agora abrange dezenas de equipes, centenas de usuários e milhares de agentes com uma mistura variável de provedores e níveis de modelo. Os controles de gastos precisam ser aplicados uniformemente em todas as cargas de trabalho de IA, para que sua organização possa se apoiar na IA com confiança, sem se preocupar com surpresas na fatura.
Embora os controles de gastos precisem ser aplicados uniformemente, diferentes partes da sua organização precisam de diferentes controles de custo. Uma equipe de plataforma se preocupa com os totais de todo o workspace. Um líder de FinOps se preocupa com o gasto mensal em nível de organização. Um gerente de engenharia se preocupa com orçamentos de experimentação por desenvolvedor. Os Controles de Gastos de IA permitem que você configure todos eles em um só lugar e estão profundamente integrados aos orçamentos existentes do Databricks:
Para rastrear os gastos de IA da sua organização, siga estas etapas:

Quando um dos seus orçamentos for excedido, você receberá um e-mail de notificação:

A seção Custo do console da sua conta permite que você responda a e-mails de alerta de orçamento ou monitore proativamente o status dos seus orçamentos ativos. Na página Orçamentos , você vê rapidamente como seus orçamentos estão evoluindo:

Abra qualquer orçamento para ver como seus gastos de IA estão evoluindo:

Se você configurou limites de orçamento por usuário, a página de detalhes do Orçamento mostrará como os gastos individuais de IA dos usuários da sua organização estão evoluindo. Quando os usuários excedem seu limite individual, seu status e gastos são claramente exibidos para que você possa agir rapidamente:

Para aumentar o limite de um orçamento, você pode simplesmente editar o Orçamento e modificar seus limites de gastos.
Os Orçamentos do Unity AI Gateway oferecem uma visão geral de alto nível dos gastos por usuário e por orçamento. Para analisar mais a fundo quais usuários, modelos ou casos de uso estão impulsionando seus gastos, você pode usar os recursos de rastreamento de custos existentes do Unity AI Gateway. Cada solicitação é registrada nas tabelas do sistema do Unity Catalog com custos de DBU e não apenas contagens de tokens. A taxa de transferência provisionada, o tempo de atividade, o uso pago por token e até mesmo os custos de token de provedores de modelos externos são todos calculados automaticamente. Você pode segmentar os dados da forma que sua organização rastreia os gastos:
Acesse o painel de Análise de Custos navegando até a página do Unity AI Gateway no seu workspace Databricks e clique em “Ver Painel”:

Isso abre um painel de análise de uso e custo que você pode personalizar totalmente:

Os Controles de Gastos de IA são uma extensão natural dos recursos de governança que você já usa no Databricks:
Databricks oferece um sistema único e consistente para governar o que seus agentes podem fazer, para quem podem fazer e quanto podem gastar para isso. Comece hoje mesmo!
(Esta publicação no blog foi traduzida utilizando ferramentas baseadas em inteligência artificial) Publicação original
Assine nosso blog e receba os posts mais recentes diretamente na sua caixa de entrada.