Ir para o conteúdo principal
Produto

Apresentando controles de gastos com IA com Unity AI Gateway

Defina orçamentos de IA no nível de usuário, workspace ou organização, e identifique gastos descontrolados de IA logo no início.

por Kevin Stumpf

• As cargas de trabalho de IA criam novos desafios de gerenciamento de custos, como loops de repetição descontrolados e experimentação de agentes sem controle, tornando os controles orçamentários tradicionais da nuvem insuficientes para a adoção moderna da IA.\r\n• Os Controles de Gastos de IA do Unity AI Gateway introduzem alertas orçamentários proativos para usuários, workspaces, casos de uso e contas inteiras, ajudando as organizações a monitorar e conter os custos de IA antes que se tornem riscos de negócios.\r\n• Combinado com as tabelas de sistema do Unity Catalog e os orçamentos da Databricks, o Unity AI Gateway oferece governança unificada para o uso de IA, visibilidade de custos e responsabilidade operacional entre modelos, agentes, MCPs e provedores.

Hoje, estamos anunciando os Controles de Gastos de IA no Unity AI Gateway. Esta versão estende a visibilidade de custos existente do Unity AI Gateway com alertas de orçamento proativos para dar a você controle total sobre os gastos de IA da sua organização - desde os agentes de codificação que seus desenvolvedores usam todos os dias, até os agentes de produção que atendem seus clientes, e os trabalhos em lote executados durante a noite:

As cargas de trabalho de IA entregam um valor desproporcional - mas seu perfil de custo é fundamentalmente mais desafiador de gerenciar do que seus gastos tradicionais com a nuvem:

  • Seu trabalho em lote noturno que traduz transcrições de chamadas pode funcionar perfeitamente por um mês, e então começar a falhar na metade e acionar uma lógica de nova tentativa que multiplica seu custo em 10x da noite para o dia.
  • Os agentes de codificação da sua organização de engenharia economizam milhares de horas de desenvolvedor por semana - mas os mesmos agentes facilitam para um engenheiro iniciar um experimento acidental multiagente na sexta-feira à noite que esgota o orçamento mensal da equipe até domingo.

Funcionários de engenharia, suporte, vendas e operações estão adotando a IA mais rapidamente do que qualquer tecnologia na última década, desbloqueando novos casos de uso semana após semana. Mas essa adoção traz um desafio de gerenciamento: o uso de modelos de base agora abrange dezenas de equipes, centenas de usuários e milhares de agentes com uma mistura variável de provedores e níveis de modelo. Os controles de gastos precisam ser aplicados uniformemente em todas as cargas de trabalho de IA, para que sua organização possa se apoiar na IA com confiança, sem se preocupar com surpresas na fatura.

Configure Alertas de Orçamento em Cada Granularidade

Embora os controles de gastos precisem ser aplicados uniformemente, diferentes partes da sua organização precisam de diferentes controles de custo. Uma equipe de plataforma se preocupa com os totais de todo o workspace. Um líder de FinOps se preocupa com o gasto mensal em nível de organização. Um gerente de engenharia se preocupa com orçamentos de experimentação por desenvolvedor. Os Controles de Gastos de IA permitem que você configure todos eles em um só lugar e estão profundamente integrados aos orçamentos existentes do Databricks:

  • Por usuário: Defina orçamentos para experimentação individual — por exemplo, US$ 2000 por usuário por mês para a organização de engenharia. Identifique o desenvolvedor cujo agente está preso em um loop antes que isso apareça no P&L.
  • Por caso de uso: Receba alertas se os gastos da sua organização com agentes de codificação como codex ou claude code excederem US$ 1000 por usuário por mês
  • Por workspace: Mantenha cada unidade dentro do seu próprio orçamento. A produção recebe US$ 50.000/mês; o sandbox recebe US$ 5.000.
  • Por conta: Defina um teto máximo — digamos, US$ 200.000/mês para cada modelo, cada provedor, cada workspace — e seja alertado muito antes de se aproximar dele.

Comece a Usar os Orçamentos do Unity AI Gateway Hoje

Para rastrear os gastos de IA da sua organização, siga estas etapas:

Crie seu Orçamento do Unity AI Gateway

  • Abra as configurações da sua conta, navegue até Uso na barra lateral e abra a guia Orçamentos
  • Crie um Orçamento e selecione “Unity AI Gateway” como o tipo de Recurso
  • Opcionalmente, aplique o orçamento apenas a um subconjunto de workspaces
  • Opcionalmente, aplique “tags de Recurso” para configurar orçamentos para um subconjunto dos LLMs do AI Gateway. Somente os LLMs do AI Gateway cujas tags correspondem às suas tags de orçamento serão contabilizados no orçamento. Isso é útil para configurar orçamentos específicos para casos de uso.
  • Configure um “Limite compartilhado” que define o limite de gastos mensais globalmente em todos os recursos nos seus workspace(s) selecionado(s) que correspondem às tags de recurso
  • Configure um “Limite por usuário” que define um limite de gastos mensais por usuário na sua conta
  • Configure endereços de e-mail que recebem alertas quando os limites são excedidos

Uma vez criados, fique atento aos alertas de orçamento

Quando um dos seus orçamentos for excedido, você receberá um e-mail de notificação:

Analise seus orçamentos ativos

A seção Custo do console da sua conta permite que você responda a e-mails de alerta de orçamento ou monitore proativamente o status dos seus orçamentos ativos. Na página Orçamentos , você vê rapidamente como seus orçamentos estão evoluindo:

Abra qualquer orçamento para ver como seus gastos de IA estão evoluindo:

Se você configurou limites de orçamento por usuário, a página de detalhes do Orçamento mostrará como os gastos individuais de IA dos usuários da sua organização estão evoluindo. Quando os usuários excedem seu limite individual, seu status e gastos são claramente exibidos para que você possa agir rapidamente:

Para aumentar o limite de um orçamento, você pode simplesmente editar o Orçamento e modificar seus limites de gastos.

Analise os Gastos de IA da sua organização em detalhes

Os Orçamentos do Unity AI Gateway oferecem uma visão geral de alto nível dos gastos por usuário e por orçamento. Para analisar mais a fundo quais usuários, modelos ou casos de uso estão impulsionando seus gastos, você pode usar os recursos de rastreamento de custos existentes do Unity AI Gateway. Cada solicitação é registrada nas tabelas do sistema do Unity Catalog com custos de DBU e não apenas contagens de tokens. A taxa de transferência provisionada, o tempo de atividade, o uso pago por token e até mesmo os custos de token de provedores de modelos externos são todos calculados automaticamente. Você pode segmentar os dados da forma que sua organização rastreia os gastos:

  • Identidade: Agregue por usuário ou principal de serviço — mapeie os gastos para as pessoas e sistemas que os impulsionam.
  • Workspace, endpoint e tags: Agrupe por equipe, ambiente ou centro de custo.
  • Modelo e provedor: Veja quais modelos (Opus vs. Sonnet) e provedores (Anthropic vs. OpenAI vs. código aberto) estão gerando custos.
  • Tags de solicitação: Atribuição dinâmica para plataformas SaaS que atuam como proxy para clientes finais.

Acesse o painel de Análise de Custos navegando até a página do Unity AI Gateway no seu workspace Databricks e clique em “Ver Painel”:

Isso abre um painel de análise de uso e custo que você pode personalizar totalmente:

Uma plataforma para governar dados e IA

Os Controles de Gastos de IA são uma extensão natural dos recursos de governança que você já usa no Databricks:

  • Unity AI Gateway é o AI Gateway central da sua organização para gerenciar e acessar LLMs e MCPs.
  • Unity Catalog é o seu catálogo central para registrar e descobrir os ativos de dados e IA da sua organização. Permissões de acesso, logs de auditoria e dados de uso vivem todos no Unity Catalog.
  • Orçamentos Databricks fornecem a base para monitoramento e alertas de custos. Com esta versão, Orçamentos Databricks agora permitem que você configure orçamentos personalizados para IA para as cargas de trabalho de IA da sua organização.
  • Databricks oferece um sistema único e consistente para governar o que seus agentes podem fazer, para quem podem fazer e quanto podem gastar para isso. Comece hoje mesmo!

    (Esta publicação no blog foi traduzida utilizando ferramentas baseadas em inteligência artificial) Publicação original

    Receba os posts mais recentes na sua caixa de entrada

    Assine nosso blog e receba os posts mais recentes diretamente na sua caixa de entrada.