Revenir au contenu principal
Produit

Présentation des contrôles des dépenses d'IA avec Unity AI Gateway

Définissez des budgets d'IA au niveau de l'utilisateur, de l'espace de travail ou de l'organisation, et détectez rapidement les dépenses d'IA excessives.

par Kevin Stumpf

• Les charges de travail d'IA créent de nouveaux défis en matière de gestion des coûts, tels que les boucles de réessai incontrôlées ou l'expérimentation d'agents non maîtrisée, rendant les contrôles budgétaires cloud traditionnels insuffisants pour l'adoption moderne de l'IA.\n• Les contrôles de dépenses d'IA de Unity AI Gateway introduisent des alertes budgétaires proactives pour les utilisateurs, les espaces de travail, les cas d'utilisation et l'ensemble des comptes, aidant les organisations à surveiller et à maîtriser les coûts de l'IA avant qu'ils ne deviennent des risques commerciaux.\n• Combiné aux tables système de Unity Catalog et aux budgets Databricks, Unity AI Gateway offre une gouvernance unifiée pour l'utilisation de l'IA, la visibilité des coûts et la responsabilité opérationnelle pour les modèles, les agents, les MCP et les fournisseurs.

Aujourd'hui, nous annonçons les contrôles de dépenses d'IA dans Unity AI Gateway. Cette version étend la visibilité des coûts existante de Unity AI Gateway avec des alertes budgétaires proactives pour vous donner un contrôle total sur les dépenses d'IA de votre organisation - des agents de codage que vos développeurs utilisent quotidiennement, aux agents de production servant vos clients, en passant par les tâches par lots exécutées pendant la nuit :

Les charges de travail d'IA offrent une valeur disproportionnée - mais leur profil de coût est fondamentalement plus difficile à gérer que vos dépenses cloud traditionnelles :

  • Votre tâche par lots nocturne de traduction de transcriptions d'appels peut fonctionner parfaitement pendant un mois, puis commencer à échouer à mi-parcours et déclencher une logique de nouvelle tentative qui multiplie son coût par 10 pendant la nuit.
  • Les agents de codage de votre organisation d'ingénierie économisent des milliers d'heures de développeur par semaine - mais ces mêmes agents permettent facilement à un ingénieur de lancer accidentellement une expérience multi-agents le vendredi soir qui épuise le budget mensuel de l'équipe d'ici le dimanche.

Les employés de l'ingénierie, du support, des ventes et des opérations adoptent l'IA plus rapidement que toute autre technologie au cours de la dernière décennie, débloquant de nouveaux cas d'utilisation semaine après semaine. Mais cette adoption entraîne un défi de gestion : l'utilisation des modèles de fondation s'étend désormais à des dizaines d'équipes, des centaines d'utilisateurs et des milliers d'agents avec un mélange changeant de fournisseurs et de niveaux de modèles. Les contrôles de dépenses doivent s'appliquer uniformément à toutes les charges de travail d'IA, afin que votre organisation puisse s'appuyer en toute confiance sur l'IA sans se soucier des surprises sur la facture.

Configurer les alertes budgétaires à chaque granularité

Bien que les contrôles de dépenses doivent s'appliquer uniformément, différentes parties de votre organisation ont besoin de contrôles de coûts différents. Une équipe de plateforme se soucie des totaux à l'échelle de l'espace de travail. Un responsable FinOps se soucie de la consommation mensuelle au niveau de l'organisation. Un responsable d'ingénierie se soucie des budgets d'expérimentation par développeur. Les contrôles de dépenses d'IA vous permettent de tout configurer à partir d'un seul endroit et sont profondément intégrés aux budgets existants de Databricks :

  • Par utilisateur : Définissez des budgets pour l'expérimentation individuelle — par exemple, 2000 $ par utilisateur et par mois pour l'organisation d'ingénierie. Repérez le développeur dont l'agent est bloqué dans une boucle avant que cela n'apparaisse sur le compte de profits et pertes.
  • Par cas d'utilisation : Recevez une alerte si les dépenses de votre organisation en agents de codage comme codex ou claude code dépassent 1000 $ par utilisateur et par mois.
  • Par espace de travail : Chaque unité respecte son propre budget. La production reçoit 50 000 $/mois ; le bac à sable reçoit 5 000 $.
  • Par compte : Définissez un plafond global — par exemple, 200 000 $/mois pour chaque modèle, chaque fournisseur, chaque espace de travail — et soyez alerté bien avant de l'atteindre.

Commencez dès aujourd'hui avec les budgets Unity AI Gateway

Pour suivre les dépenses d'IA de votre organisation, suivez ces étapes :

Créez votre budget Unity AI Gateway

  • Ouvrez les paramètres de votre compte, accédez à Utilisation dans la barre latérale et ouvrez l'onglet Budgets.
  • Créez un budget et sélectionnez « Unity AI Gateway » comme type de ressource.
  • Appliquez éventuellement le budget uniquement à un sous-ensemble d'espaces de travail
  • Appliquez éventuellement des « balises de ressource » pour configurer des budgets pour un sous-ensemble de vos LLM AI Gateway. Seuls les LLM AI Gateway dont les balises correspondent à vos balises de budget seront pris en compte dans le budget. Ceci est utile pour configurer des budgets spécifiques aux cas d'utilisation.
  • Configurez un « seuil partagé » qui définit la limite de dépenses mensuelles globalement pour toutes les ressources de votre ou vos espaces de travail sélectionnés qui correspondent aux balises de ressource.
  • Configurez un « seuil par utilisateur » qui définit une limite de dépenses mensuelles par utilisateur de votre compte
  • Configurez les adresses e-mail qui reçoivent des alertes lorsque les seuils sont dépassés.

Une fois créé, surveillez les alertes budgétaires

Lorsqu'un de vos budgets est dépassé, vous recevrez un e-mail de notification :

Analysez vos budgets actifs

La section Coût de votre console de compte vous permet de répondre aux e-mails d'alerte budgétaire ou de surveiller de manière proactive l'état de vos budgets actifs. Sur la page Budgets, vous voyez en un coup d'œil l'évolution de vos budgets :

Ouvrez n'importe quel budget pour voir l'évolution de vos dépenses d'IA :

Si vous avez configuré des seuils budgétaires par utilisateur, la page de détails du budget vous montrera l'évolution des dépenses d'IA individuelles des utilisateurs de votre organisation. Lorsque les utilisateurs dépassent leur seuil individuel, leur statut et leurs dépenses sont clairement affichés afin que vous puissiez agir rapidement :

Pour augmenter le seuil d'un budget, vous pouvez simplement modifier le budget et ajuster ses limites de dépenses.

Analysez en détail les dépenses d'IA de votre organisation

Les budgets Unity AI Gateway vous donnent un aperçu général des dépenses par utilisateur et par budget. Pour analyser plus en détail quels utilisateurs, modèles ou cas d'utilisation sont à l'origine de vos dépenses, vous pouvez utiliser les capacités de suivi des coûts existantes de Unity AI Gateway. Chaque requête est enregistrée dans les tables système de Unity Catalog avec les coûts DBU et pas seulement le nombre de jetons. Le débit provisionné, la disponibilité, l'utilisation par jeton et même les coûts des jetons des fournisseurs de modèles externes sont tous calculés automatiquement. Vous pouvez segmenter les données comme votre organisation suit les dépenses :

  • Identité : Agrégez par utilisateur ou principal de service — associez les dépenses aux personnes et aux systèmes qui les génèrent.
  • Espace de travail, point de terminaison et balises : Regroupez par équipe, environnement ou centre de coûts.
  • Modèle et fournisseur : Voyez quels modèles (Opus vs. Sonnet) et fournisseurs (Anthropic vs. OpenAI vs. open source) sont à l'origine des coûts.
  • Balises de requête : Attribution dynamique pour les plateformes SaaS agissant comme proxy pour les clients finaux.

Accédez au tableau de bord d'analyse des coûts en naviguant vers la page Unity AI Gateway dans votre espace de travail Databricks et en cliquant sur « Afficher le tableau de bord » :

Cela ouvre un tableau de bord d'analyse de l'utilisation et des coûts que vous pouvez entièrement personnaliser :

Une plateforme pour gouverner les données et l'IA

Les contrôles de dépenses d'IA sont une extension naturelle des capacités de gouvernance que vous utilisez déjà dans Databricks :

  • Unity AI Gateway est la passerelle d'IA centrale de votre organisation pour gérer et accéder aux LLM et MCP.
  • Unity Catalog est votre catalogue central pour enregistrer et découvrir les actifs de données et d'IA de votre organisation. Les autorisations d'accès, les journaux d'audit et les données d'utilisation résident tous dans Unity Catalog.
  • Databricks budgets offrent la base pour la surveillance et l'alerte des coûts. Avec cette version, Databricks budgets vous permettent désormais de configurer des budgets adaptés à l'IA pour les charges de travail d'IA de votre organisation.
  • Databricks vous offre un système unique et cohérent pour régir ce que vos agents peuvent faire, pour qui ils peuvent le faire et combien ils peuvent dépenser pour le faire. Commencez dès aujourd'hui!

    (Cet article de blog a été traduit à l'aide d'outils basés sur l'intelligence artificielle) Article original

    Recevez les derniers articles dans votre boîte mail

    Abonnez-vous à notre blog et recevez les derniers articles directement dans votre boîte mail.