Définissez des budgets d'IA au niveau de l'utilisateur, de l'espace de travail ou de l'organisation, et détectez rapidement les dépenses d'IA excessives.
par Kevin Stumpf
• Les charges de travail d'IA créent de nouveaux défis en matière de gestion des coûts, tels que les boucles de réessai incontrôlées ou l'expérimentation d'agents non maîtrisée, rendant les contrôles budgétaires cloud traditionnels insuffisants pour l'adoption moderne de l'IA.\n• Les contrôles de dépenses d'IA de Unity AI Gateway introduisent des alertes budgétaires proactives pour les utilisateurs, les espaces de travail, les cas d'utilisation et l'ensemble des comptes, aidant les organisations à surveiller et à maîtriser les coûts de l'IA avant qu'ils ne deviennent des risques commerciaux.\n• Combiné aux tables système de Unity Catalog et aux budgets Databricks, Unity AI Gateway offre une gouvernance unifiée pour l'utilisation de l'IA, la visibilité des coûts et la responsabilité opérationnelle pour les modèles, les agents, les MCP et les fournisseurs.
Aujourd'hui, nous annonçons les contrôles de dépenses d'IA dans Unity AI Gateway. Cette version étend la visibilité des coûts existante de Unity AI Gateway avec des alertes budgétaires proactives pour vous donner un contrôle total sur les dépenses d'IA de votre organisation - des agents de codage que vos développeurs utilisent quotidiennement, aux agents de production servant vos clients, en passant par les tâches par lots exécutées pendant la nuit :

Les charges de travail d'IA offrent une valeur disproportionnée - mais leur profil de coût est fondamentalement plus difficile à gérer que vos dépenses cloud traditionnelles :
Les employés de l'ingénierie, du support, des ventes et des opérations adoptent l'IA plus rapidement que toute autre technologie au cours de la dernière décennie, débloquant de nouveaux cas d'utilisation semaine après semaine. Mais cette adoption entraîne un défi de gestion : l'utilisation des modèles de fondation s'étend désormais à des dizaines d'équipes, des centaines d'utilisateurs et des milliers d'agents avec un mélange changeant de fournisseurs et de niveaux de modèles. Les contrôles de dépenses doivent s'appliquer uniformément à toutes les charges de travail d'IA, afin que votre organisation puisse s'appuyer en toute confiance sur l'IA sans se soucier des surprises sur la facture.
Bien que les contrôles de dépenses doivent s'appliquer uniformément, différentes parties de votre organisation ont besoin de contrôles de coûts différents. Une équipe de plateforme se soucie des totaux à l'échelle de l'espace de travail. Un responsable FinOps se soucie de la consommation mensuelle au niveau de l'organisation. Un responsable d'ingénierie se soucie des budgets d'expérimentation par développeur. Les contrôles de dépenses d'IA vous permettent de tout configurer à partir d'un seul endroit et sont profondément intégrés aux budgets existants de Databricks :
Pour suivre les dépenses d'IA de votre organisation, suivez ces étapes :

Lorsqu'un de vos budgets est dépassé, vous recevrez un e-mail de notification :

La section Coût de votre console de compte vous permet de répondre aux e-mails d'alerte budgétaire ou de surveiller de manière proactive l'état de vos budgets actifs. Sur la page Budgets, vous voyez en un coup d'œil l'évolution de vos budgets :

Ouvrez n'importe quel budget pour voir l'évolution de vos dépenses d'IA :

Si vous avez configuré des seuils budgétaires par utilisateur, la page de détails du budget vous montrera l'évolution des dépenses d'IA individuelles des utilisateurs de votre organisation. Lorsque les utilisateurs dépassent leur seuil individuel, leur statut et leurs dépenses sont clairement affichés afin que vous puissiez agir rapidement :

Pour augmenter le seuil d'un budget, vous pouvez simplement modifier le budget et ajuster ses limites de dépenses.
Les budgets Unity AI Gateway vous donnent un aperçu général des dépenses par utilisateur et par budget. Pour analyser plus en détail quels utilisateurs, modèles ou cas d'utilisation sont à l'origine de vos dépenses, vous pouvez utiliser les capacités de suivi des coûts existantes de Unity AI Gateway. Chaque requête est enregistrée dans les tables système de Unity Catalog avec les coûts DBU et pas seulement le nombre de jetons. Le débit provisionné, la disponibilité, l'utilisation par jeton et même les coûts des jetons des fournisseurs de modèles externes sont tous calculés automatiquement. Vous pouvez segmenter les données comme votre organisation suit les dépenses :
Accédez au tableau de bord d'analyse des coûts en naviguant vers la page Unity AI Gateway dans votre espace de travail Databricks et en cliquant sur « Afficher le tableau de bord » :

Cela ouvre un tableau de bord d'analyse de l'utilisation et des coûts que vous pouvez entièrement personnaliser :

Les contrôles de dépenses d'IA sont une extension naturelle des capacités de gouvernance que vous utilisez déjà dans Databricks :
Databricks vous offre un système unique et cohérent pour régir ce que vos agents peuvent faire, pour qui ils peuvent le faire et combien ils peuvent dépenser pour le faire. Commencez dès aujourd'hui!
(Cet article de blog a été traduit à l'aide d'outils basés sur l'intelligence artificielle) Article original
Abonnez-vous à notre blog et recevez les derniers articles directement dans votre boîte mail.