Passa al contenuto principale
Prodotto

Presentazione dei controlli di spesa per l'AI con Unity AI Gateway

Imposta i budget AI a livello di utente, workspace o organizzazione e individua tempestivamente le spese AI fuori controllo.

di Kevin Stumpf

• I carichi di lavoro AI creano nuove sfide di gestione dei costi, come cicli di tentativi incontrollati o sperimentazioni di agenti fuori controllo, rendendo i controlli di budget cloud tradizionali insufficienti per l'adozione moderna dell'AI.\r\n• I Controlli di Spesa AI di Unity AI Gateway introducono avvisi di budget proattivi per utenti, workspace, casi d'uso e interi account, aiutando le organizzazioni a monitorare e contenere i costi dell'AI prima che diventino rischi aziendali.\r\n• In combinazione con le tabelle di sistema di Unity Catalog e i budget Databricks, Unity AI Gateway fornisce una governance unificata per l'utilizzo dell'AI, la visibilità dei costi e la responsabilità operativa su modelli, agenti, MCP e provider.

Oggi annunciamo Controlli di Spesa AI in Unity AI Gateway. Questa release estende la visibilità dei costi esistente di Unity AI Gateway con avvisi di budget proattivi per darti il pieno controllo sulla spesa AI della tua organizzazione - dagli agenti di codifica che i tuoi sviluppatori usano ogni giorno, agli agenti di produzione che servono i tuoi clienti, ai job batch che vengono eseguiti durante la notte:

I carichi di lavoro AI offrono un valore sproporzionato - ma il loro profilo di costo è fondamentalmente più difficile da gestire rispetto alla tua spesa cloud tradizionale:

  • Il tuo job batch notturno che traduce le trascrizioni delle chiamate potrebbe funzionare perfettamente per un mese, poi iniziare a fallire a metà e attivare una logica di riprova che moltiplica il suo costo di 10 volte durante la notte.
  • Gli agenti di codifica della tua organizzazione di ingegneria fanno risparmiare migliaia di ore di sviluppo a settimana - ma gli stessi agenti rendono facile per un ingegnere avviare accidentalmente un esperimento multi-agente il venerdì sera che esaurisce il budget mensile del team entro domenica.

I dipendenti di ingegneria, supporto, vendite e operazioni stanno adottando l'AI più velocemente di qualsiasi altra tecnologia nell'ultimo decennio, sbloccando nuovi casi d'uso settimana dopo settimana. Ma questa adozione porta una sfida di gestione: l'utilizzo dei modelli di base ora si estende a decine di team, centinaia di utenti e migliaia di agenti con un mix variabile di fornitori e livelli di modello. I controlli di spesa devono essere applicati uniformemente a tutti i carichi di lavoro AI, in modo che la tua organizzazione possa affidarsi con fiducia all'AI senza preoccuparsi di sorprese sulla fattura.

Configura gli Avvisi di Budget a Ogni Livello di Granularità

Mentre i controlli di spesa devono essere applicati uniformemente, diverse parti della tua organizzazione necessitano di controlli di costo diversi. Un team di piattaforma si preoccupa dei totali a livello di workspace. Un responsabile FinOps si preoccupa del consumo mensile a livello di organizzazione. Un responsabile dell'ingegneria si preoccupa dei budget di sperimentazione per sviluppatore. I Controlli di Spesa AI ti permettono di impostarli tutti da un unico posto e sono profondamente integrati con i budget esistenti di Databricks:

  • Per utente: Imposta budget per la sperimentazione individuale — ad esempio, $2000 per utente al mese per l'organizzazione di ingegneria. Individua lo sviluppatore il cui agente è bloccato in un loop prima che appaia sul conto economico.
  • Per caso d'uso: Ricevi un avviso se la spesa della tua organizzazione per agenti di codifica come codex o claude code supera i $1000 per utente al mese
  • Per workspace: Mantieni ogni unità al proprio budget. La produzione ottiene $50.000/mese; il sandbox ottiene $5.000.
  • Per account: Imposta un limite massimo — ad esempio, $200.000/mese per ogni modello, ogni fornitore, ogni workspace — e ricevi un avviso molto prima di raggiungerlo.

Inizia oggi stesso con i Budget di Unity AI Gateway

Per monitorare la spesa AI della tua organizzazione, segui questi passaggi:

Crea il tuo Budget di Unity AI Gateway

  • Apri le impostazioni del tuo account, naviga su Utilizzo nella barra laterale e apri la scheda Budget
  • Crea un Budget e seleziona “Unity AI Gateway” come tipo di Risorsa
  • Applica facoltativamente il budget solo a un sottoinsieme di workspace
  • Applica facoltativamente “Tag risorsa” per configurare i budget per un sottoinsieme dei tuoi LLM di AI Gateway. Solo gli LLM di AI Gateway i cui tag corrispondono ai tuoi tag di budget verranno conteggiati nel budget. Questo è utile per configurare budget specifici per caso d'uso.
  • Configura una “Soglia condivisa” che imposta il limite di spesa mensile globalmente su tutte le risorse nei workspace selezionati che corrispondono ai tag risorsa
  • Configura una “Soglia per utente” che imposta un limite di spesa mensile per utente nel tuo account
  • Configura gli indirizzi email che ricevono avvisi quando le soglie vengono superate

Una volta creato, fai attenzione agli avvisi di budget

Quando uno dei tuoi budget viene superato, riceverai un'email di notifica:

Analizza i tuoi budget attivi

La sezione Costo della console del tuo account ti permette di rispondere alle email di avviso budget o di monitorare proattivamente lo stato dei tuoi budget attivi. Nella pagina Budget vedi a colpo d'occhio l'andamento dei tuoi budget:

Apri qualsiasi budget per vedere l'andamento della tua spesa AI:

Se hai configurato soglie di budget a livello di utente, la pagina dei dettagli del Budget ti mostrerà l'andamento della spesa AI individuale degli utenti della tua organizzazione. Quando gli utenti superano la loro soglia individuale, il loro stato e la loro spesa sono chiaramente evidenziati in modo da poter agire rapidamente:

Per aumentare la soglia di un budget, puoi semplicemente modificare il Budget e i suoi limiti di spesa.

Analizza in dettaglio la spesa AI della tua organizzazione

I Budget di Unity AI Gateway ti offrono una panoramica di alto livello della spesa per utente e per budget. Per analizzare ulteriormente quali utenti, modelli o casi d'uso stanno guidando la tua spesa, puoi utilizzare le capacità di monitoraggio dei costi esistenti di Unity AI Gateway. Ogni richiesta viene registrata nelle tabelle di sistema di Unity Catalog con i costi DBU e non solo i conteggi dei token. Il throughput provisionato, l'uptime, l'utilizzo pay-per-token e persino i costi dei token dei fornitori di modelli esterni sono tutti calcolati automaticamente. Puoi suddividere i dati in base a come la tua organizzazione traccia la spesa:

  • Identità: Aggrega per utente o service principal — mappa la spesa alle persone e ai sistemi che la guidano.
  • Workspace, endpoint e tag: Raggruppa per team, ambiente o centro di costo.
  • Modello e fornitore: Vedi quali modelli (Opus vs. Sonnet) e fornitori (Anthropic vs. OpenAI vs. open source) stanno generando costi.
  • Tag richiesta: Attribuzione dinamica per piattaforme SaaS che fungono da proxy per i clienti finali.

Accedi alla dashboard di Cost Analytics navigando alla pagina Unity AI Gateway nel tuo workspace Databricks e clicca su “Visualizza Dashboard”:

Questo apre una dashboard di analisi di utilizzo e costi che puoi personalizzare completamente:

Una piattaforma per governare dati e AI

I Controlli di Spesa AI sono una naturale estensione delle capacità di governance che già utilizzi in Databricks:

  • Unity AI Gateway è il Gateway AI centrale della tua organizzazione per gestire e accedere a LLM e MCP.
  • Unity Catalog è il tuo catalogo centrale per registrare e scoprire i dati e gli asset AI della tua organizzazione. Permessi di accesso, log di audit e dati di utilizzo risiedono tutti in Unity Catalog.
  • I budget Databricks forniscono le basi per il monitoraggio dei costi e gli avvisi. Con questa versione, i budget Databricks ora ti consentono di configurare budget personalizzati per l'IA per i carichi di lavoro di IA della tua organizzazione.
  • Databricks ti fornisce un sistema unico e coerente per governare ciò che i tuoi agenti possono fare, per chi possono farlo e quanto possono spendere per farlo. Inizia oggi stesso!

    (Questo post sul blog è stato tradotto utilizzando strumenti basati sull'intelligenza artificiale) Post originale

    Ricevi gli ultimi articoli nella tua casella di posta

    Iscriviti al nostro blog e ricevi gli ultimi articoli direttamente nella tua casella di posta.