Nous sommes ravis d'annoncer Genie Code, le dernier né de la famille Databricks Genie. Au cours des six derniers mois, les outils de codage agentifs ont radicalement transformé le Data Engineering. Genie Code apporte cette même Transformations aux équipes de données. Genie Code peut effectuer de manière autonome des tâches complexes telles que la création de pipelines, le debugging des défaillances, le déploiement de tableaux de bord et la maintenance des systèmes de production.
Contrairement aux agents qui se concentrent uniquement sur l'écriture de code, Genie Code fonctionne également comme un agent de production proactif. Il surveille vos Lakeflow pipelines et vos modèles d'IA en arrière-plan, trie les échecs, gère les mises à niveau de routine de DBR et examine les anomalies avant même que votre équipe ne s'en aperçoive.
Pour ce faire, il s'intègre profondément à Unity Catalog afin de comprendre les données, la sémantique et les politiques de gouvernance de votre entreprise. Genie Code est plus de deux fois plus performant qu'un agent de codage de premier plan sur des tâches de Data Science réelles.
Les outils de codage agentifs ont transformé le génie logiciel, faisant passer les développeurs de la saisie semi-automatique au développement piloté par des agents. Avec une seule invite, les ingénieurs peuvent désormais échafauder des fonctionnalités, refactoriser du code et déployer des prototypes en quelques secondes. Cette évolution est due aux progrès des LLM et aux systèmes agentifs capables d'interpréter le contexte complexe des bases de code logicielles modernes.
La plupart des agents sur le marché se concentrent sur le code comme produit final. Cependant, pour les équipes de données, le code n'est qu'un moyen de manipuler et de comprendre les données sous-jacentes. C'est précisément la raison pour laquelle les agents centrés sur les logiciels ont souvent des difficultés avec le travail sur les données. Dans un écosystème de données, le contexte ne réside pas seulement dans le script, mais aussi dans les modèles d'utilisation, le lignage et la sémantique métier.
L'accès à ce contexte est vital, car les enjeux sont élevés. Les tableaux de bord orientent les décisions de l'entreprise, les pipelines alimentent les systèmes de production et les modèles de machine learning influencent les résultats du monde réel. Pour les équipes de données, la vitesse et l'effet de levier offerts par les agents doivent être associés à une précision, une reproductibilité et une gouvernance absolues.
Genie Code est un agent d'IA conçu spécifiquement pour les données. Il s'appuie sur Unity Catalog pour organiser automatiquement les données et le contenu les plus pertinents au fur et à mesure que vous travaillez. Il crée des index de recherche personnalisés, des instructions personnalisées, des bases de connaissances et extrait des modèles d'utilisation du lignage des données. Mieux encore, il devient plus intelligent à mesure que votre équipe l'utilise. Cette intégration profonde dans Unity Catalog est bien supérieure à tout système qui se contente de lire les données de l'extérieur.
Nous avons constaté de visu l'impact de Genie et de Genie Code chez Databricks, tant auprès des utilisateurs techniques que non techniques. Notre équipe Ventes l'utilise pour obtenir une vue d'ensemble complète de chaque client avant les réunions, en résumant en quelques secondes les principaux indicateurs de consommation, les tickets de support et les interactions récentes. Les chefs de produit utilisent Genie Code pour créer des tableaux de bord à partir d'un croquis de diagrammes et de graphiques dessiné à la main. Notre équipe financière effectue des analyses du budget par rapport aux dépenses réelles et des modélisations avancées du retour sur investissement. Notre équipe de direction répond aux questions relatives aux données en temps réel lors des discussions stratégiques, ce qui réduit les suivis et accélère les décisions complexes. Dans toute l'entreprise, ces outils ont changé notre façon de travailler avec les données.
Ce que fait Genie Code :
Avec Genie Code, les équipes de données passent de la simple sollicitation d'un copilote à la délégation de tâches réelles : créer des pipelines, debugging des pannes, livrer des tableaux de bord et maintenir les systèmes de production, de manière autonome et de bout en bout.
Chez SiriusXM, Genie Code prend en charge un large éventail de tâches, de la création de notebooks et de requêtes SQL complexes à l'analyse des relations entre les tables et au debugging de pipelines. Il agit comme un partenaire de développement pratique qui aide nos équipes de données à fournir un travail de haute qualité en moins de temps. — Bernie Graham, vice-président de l'ingénierie des données, Sirius XM
Genie Code n'est pas alimenté par un modèle unique. Il s'agit d'un système agentique qui dirige les tâches vers plusieurs modèles et outils, en sélectionnant automatiquement le meilleur modèle pour chaque job, qu'il s'agisse d'un LLM de pointe, d'un modèle open source ou d'un modèle personnalisé hébergé sur Databricks. Les utilisateurs n'ont ainsi plus besoin de changer manuellement de modèle ou de deviner lequel produira le meilleur résultat.
Genie Code est également profondément intégré aux APIs Databricks, ce qui lui permet d'identifier les bons assets, de rassembler un contexte riche et de générer des queries de meilleure qualité. Databricks Research ajuste continuellement le système, en évaluant les derniers modèles des principaux laboratoires d'IA ainsi que les modèles personnalisés exécutés sur la plateforme.
Lors de notre récente analyse comparative des performances sur des tâches réelles de Data Science et d'analytique collectées auprès d'utilisateurs internes, Genie Code a nettement surperformé un agent de codage de premier plan équipé des serveurs du Model Context Protocol (MCP) de Databricks.

Genie Code agit comme un ingénieur ML dédié et intégré à votre workflow. Demandez-lui d'« entraîner un modèle de prévision des ventes dans @sales_table» et il analysera l'ensemble du pipeline :
Une fois déployé sur Databricks Model Serving, Genie Code reste dans la boucle : il peut vérifier l'état des points de terminaison, analyser les traces et recommander des optimisations. Vous pouvez en savoir plus à ce sujet dans la section « Du code à la production : l'observabilité avec Genie Code » ci-dessous.

Genie Code change la façon dont nos équipes de données fonctionnent. Au lieu d'assembler manuellement des Notebooks, des pipelines et des modèles, nous pouvons confier des workflows complexes à un partenaire IA qui comprend nos données, notre gouvernance des données, notre contexte métier et nos bibliothèques internes telles que Repsol Artificial Intelligence Products. Il accélère tout, de la prévision de séries chronologiques au déploiement en production, sans sacrifier la rigueur ni le contrôle. — Emilio Martín Gallardo, data scientist principal, gestion de données et analytique, Repsol
Genie Code est votre data engineer expert, conçu pour vous aider à concevoir et à faire évoluer des pipelines de données fiables.

Genie Code nous a fait passer du codage assisté à une véritable Data Engineering agentique. Il peut analyser nos Lakeflow pipelines, proposer des modifications multifichiers avec des diffs, exécuter des runs avec des garde-fous et itérer sur les échecs jusqu'à ce que les problèmes soient résolus. On a moins l'impression d'utiliser une saisie semi-automatique que de collaborer avec un partenaire intégré à notre workflow. — Nishit Gajjar, responsable technique, fournisseur mondial de technologies d'infrastructure
Genie Code peut générer des visualisations, configurer des filtres et organiser des mises en page de tableaux de bord multi-pages, le tout avec des définitions sémantiques réutilisables. Il connecte ces définitions à des filtres, des calculs et des layouts qui montent en charge à mesure que les tableaux de bord se développent, aidant ainsi les équipes à avancer plus rapidement tout en maintenant la cohérence.

Avec Genie Code, nos équipes fournissent de l'analytique basée sur l'IA et des workflows automatisés en quelques semaines, et non en quelques mois. Les agents low-code nous aident à avancer plus rapidement tout en restant conformes à la gouvernance, ce qui permet aux équipes de projet et de Data Engineering d'obtenir des insights en langage naturel à partir de données complexes sans ralentir la livraison. — Russell Singer, architecte de données en chef, Bechtel Corporation
Fournissez un objectif de haut niveau, tel que « Identifier les risques de retard de vol et créer un tableau de bord de suivi ». Genie Code analyse les exigences, formule un plan en plusieurs étapes et l'exécute sur l'ensemble des Databricks Notebooks, des tableaux de bord d'AI/BI et de Lakeflow dans un seul fil de conversation.

Ce que nous constatons chez Danfoss, c'est que Genie Code modifie les rôles au sein d'une équipe data, soutenant ainsi notre orientation stratégique sur la digitalisation et l'IA. Les data scientists continuent de fournir une orientation et d'effectuer des révisions, mais les ingénieurs, les analystes et les experts du domaine peuvent désormais travailler activement dans des notebooks avec l'assistant et contribuer à des workflows d'analytique avancée. Cela transforme la Data Science en une activité d'équipe beaucoup plus collaborative. — Radu Dragusin, ingénieur principal, Données et IA, Danfoss
Genie Code utilise la popularité, le lignage, des exemples de code et les métadonnées d'Unity Catalog pour trouver les jeux de données les plus pertinents pour n'importe quelle analyse. Cette recherche contextuelle approfondie élimine l'effort manuel de recherche de données et garantit que votre travail est basé sur les tables les plus précises et les plus fréquemment utilisées au sein de votre organisation.

Je suis sincèrement fasciné. Genie Code donne un aperçu de la future manière de travailler avec les données. — Sameer Yasser, data engineer senior, Sundt Construction
Genie Code est une plateforme flexible conçue pour être adaptée aux normes spécifiques de votre équipe et à votre pile technologique externe. Il existe trois manières principales d'étendre ses capacités :
Par exemple, lorsqu'une tâche Jira vous est assignée pour entraîner un nouveau modèle de ML, Genie Code peut automatiquement en extraire le contexte, effectuer la tâche et mettre à jour le ticket avec les résultats.

Connectez Genie à vos outils internes Confluence, Google Drive, GitHub ou Notion via MCP afin qu'il puisse référencer les runbooks et les dictionnaires de données spécifiques à votre équipe lors de la résolution de problèmes.
Écrire du code n'est que la première étape. Le maintenir est le véritable défi. Genie Code agit comme un agent d'observabilité pour maintenir la santé de vos workflows de données et d'IA. Alors que des milliers de clients utilisent Databricks pour servir des applications d'IA sophistiquées, le debugging de ces modèles en production est souvent la partie la plus chronophage du cycle de vie.
Genie Code s'intègre désormais directement à Databricks Model Serving et MLflow 3.0 pour automatiser ce processus. Au lieu de rechercher manuellement dans les logs et les traces, vous pouvez utiliser Genie pour :


Genie Code est conçu pour fonctionner en arrière-plan afin que vos données restent saines même après avoir fermé votre ordinateur portable. Vous pouvez déployer plusieurs agents en parallèle pour gérer le travail opérationnel qui occupe généralement la semaine d'un data engineer. Ces agents en arrière-plan vont au-delà du support réactif pour assurer une maintenance pro-active en gérant des tâches répétitives telles que la réponse aux échecs de jobs et la gestion des mises à niveau de routine. Lorsqu'un pipeline tombe en panne, l'agent identifie la cause première et ne suggère un correctif qu'après l'avoir validé dans un environnement sandbox sécurisé.
Par exemple, si un pipeline de production échoue en raison d'une non-concordance de schéma, comme une colonne passant d'un INT (150) à STRING (« 150 USD »), Genie Code identifiera la défaillance et corrigera automatiquement le pipeline défectueux.
Les agents d'arrière-plan seront bientôt disponibles.
Genie Code est directement construit sur Unity Catalog. Cette intégration garantit que l'agent respecte les mêmes règles de sécurité et de gouvernance que le reste de la plateforme Databricks.
Lorsque Genie Code recherche des données, il n'affiche que les ressources auxquelles l'utilisateur est autorisé à accéder. Lorsqu'il crée un pipeline, il respecte le lignage et les contrôles d'accès existants.
Genie Code est en disponibilité générale dans votre workspace Databricks dès maintenant. Vous pouvez trouver le panneau Genie Code dans vos notebooks, votre éditeur SQL et votre éditeur Lakeflow Pipelines dès aujourd'hui — aucune configuration complexe n'est requise.
Si vous souhaitez en savoir plus sur Genie Code :
Nous avons hâte de voir ce que vous allez construire avec Genie Code et comment les agents autonomes vont remodeler la façon dont vos équipes data travaillent dans Databricks.
(Cet article de blog a été traduit à l'aide d'outils basés sur l'intelligence artificielle) Article original
