Pour les équipes qui développent aujourd'hui des applications d'IA, les bases de données serverless sont la nouvelle référence. Les équipes d'IA ont besoin d'une base de données qui s'adapte instantanément à la demande, qui ne coûte presque rien lorsqu'elle est inactive et qui reste proche des données de l'entreprise. Sinon, elles risquent de payer pour une infrastructure inutilisée, de créer des défis en matière de gouvernance, de sécurité et de conformité, et de consacrer un temps précieux à la gestion de la base de données.
Une base de données serverless est une base de données cloud qui adapte automatiquement le calcul et le stockage en fonction de la demande, facture l'utilisation réelle et réduit la planification de la capacité ainsi que la gestion de l'infrastructure. Dans un modèle serverless, des serveurs sont utilisés mais ils sont entièrement gérés par un fournisseur de services cloud ou un prestataire. Dans les systèmes les plus avancés, le calcul et le stockage sont découplés, de sorte que chacun s'adapte indépendamment et que vous ne payez que pour ce que chaque couche utilise.
Considérez la gestion des bases de données comme une progression :
Tous les produits qualifiés de « serverless » ne le sont pas sur le plan architectural et ne séparent pas nécessairement le calcul et le stockage. Certains sont simplement des clusters avec mise à l'échelle automatique (autoscaling) sur lesquels se greffe une facturation à l'usage. Il est important de comprendre cette différence lors de l'évaluation des options.
Une base de données serverless alloue du calcul à la demande, exécute des requêtes sur une couche de stockage partagée et facture en fonction de l'utilisation. Une plateforme serverless surveille les ressources nécessaires à une charge de travail et adapte automatiquement le calcul à la hausse si nécessaire, et à la baisse lorsque la demande diminue. La mise à l'échelle peut être verticale (plus de vCores par nœud), horizontale (plus de nœuds) ou les deux, selon la charge de travail.
Dans les architectures serverless modernes, le stockage est séparé du calcul, souvent dans un pool partagé qui maintient les données, les réplicas, les sauvegardes et la restauration à un instant dans le temps disponibles, que le calcul soit en cours d'exécution ou non.
Les bases de données provisionnées traditionnelles sont généralement dimensionnées en fonction de la demande prévue, mais de nombreuses charges de travail d'IA sont imprévisibles. Le trafic est volatil, les agents peuvent multiplier les requêtes sans avertissement et les pipelines restent souvent inactifs pendant le développement des modèles. Les bases de données serverless modernes qui découplent le calcul et le stockage sont particulièrement bien adaptées à ces scénarios d'IA courants, en adaptant efficacement la couche de calcul en fonction de la demande tout en maintenant la couche de stockage stable et toujours disponible. Les applications d'IA bénéficient également de la proximité des données opérationnelles avec la recherche vectorielle, les feature stores et les points de terminaison de modèles.
Les gains d'efficacité peuvent être significatifs. Selon une étude de 2025 publiée dans le European Journal of Computer Science and Information Technology, les chercheurs ont constaté que les entreprises utilisant des bases de données serverless ont signalé des réductions de coûts moyennes de 38 % par rapport aux bases de données provisionnées traditionnelles, et que les plateformes serverless peuvent générer des économies potentielles de 40 à 65 % pour les charges de travail d'inférence intermittentes, un cas de figure courant dans les applications d'IA.
La même étude indique que les organisations ayant adopté des bases de données serverless ont constaté une réduction de 65 % des tâches de gestion de l'infrastructure, tandis que 88 % ont fait état d'une amélioration de l'efficacité opérationnelle par rapport aux systèmes de bases de données traditionnels.
Ces critères devraient figurer sur la liste de contrôle de tout acheteur prenant des décisions concernant les bases de données serverless. Pour les cas d'usage de l'IA, le modèle de connexion, la latence et l'intégration de l'IA sont les aspects les plus importants à évaluer.
Toutes les bases de données qualifiées de « serverless » ne séparent pas le calcul du stockage au niveau de l'architecture. Certaines se contentent de superposer la mise à l'échelle automatique et la facturation à la consommation à un système traditionnellement couplé, ce qui limite leur capacité de réduction d'échelle, l'indépendance de croissance de chaque couche et leur rentabilité aux extrêmes de l'inactivité et de la demande de pointe.
Demandez aux fournisseurs si le calcul et le stockage sont découplés sur le plan architectural et si le stockage persiste indépendamment lorsque le calcul est réduit à zéro.
Les API de bases de données propriétaires peuvent offrir de la commodité grâce à des connexions simplifiées, des kits de développement logiciel (SDK) dédiés et une intégration étroite avec la plateforme. Au fil du temps, cependant, elles peuvent rendre les applications et les données plus difficiles et plus coûteuses à déplacer.
Recherchez des solutions qui prennent en charge les normes ouvertes et les interfaces couramment utilisées, telles que PostgresSQL, qui est largement adopté et pris en charge par un vaste écosystème de pilotes, de bibliothèques, d'ORM et d'outils. Lorsqu'une base de données serverless est basée sur Postgres, les équipes peuvent exploiter leurs compétences, flux de travail et codes existants sans avoir à tout reconstruire, et bénéficient d'une plus grande flexibilité pour adopter de nouvelles technologies, changer de fournisseur ou faire évoluer les architectures sans repartir de zéro.
Demandez aux fournisseurs si la base de données communique via un protocole réseau standard ou une API propriétaire.
Les charges de travail d'IA passent souvent la majeure partie de leur cycle de vie inactives. Les bases de données dotées d'une véritable capacité de réduction à zéro (scale-to-zero) peuvent ramener la consommation de calcul à zéro pendant ces périodes, éliminant ainsi les frais liés à la capacité inutilisée. Tous les produits qualifiés de « serverless » n'offrent pas cette capacité.
Lors de l'évaluation des offres de bases de données serverless, renseignez-vous sur l'unité de calcul facturable minimale et sur la rapidité avec laquelle le système peut monter en charge pour faire face à une augmentation soudaine de la demande.
Bien que la réduction à zéro puisse générer des économies substantielles, le délai de démarrage qui en résulte peut affecter la réactivité de l'application. La latence ajoutée lorsque le calcul reprend après un état de pause est appelée démarrage à froid (cold start). Pour les charges de travail d'IA sensibles à la latence, le maintien d'un seuil de capacité non nul est souvent un compromis délibéré qui équilibre la réactivité et le coût.
Dans votre évaluation, demandez les temps de préchauffage publiés pour des charges de travail réalistes.
La façon dont votre application gère les connexions à la base de données peut constituer un goulot d'étranglement majeur pour les charges de travail d'IA. Les agents d'IA et les fonctions serverless peuvent ouvrir des milliers de connexions simultanées, submergeant les modèles de connexion traditionnels. Les trois principaux modèles sont :
Pour les applications d'IA, vérifiez que le regroupement de connexions (connection pooling) est intégré à la plateforme plutôt que proposé comme un service distinct. La gestion d'un pooler externe peut ajouter de la complexité opérationnelle et créer un autre goulot d'étranglement potentiel à grande échelle.
La tarification du serverless semble simple : payez ce que vous utilisez. En pratique, la facturation peut être plus granulaire qu'il n'y paraît. De nombreux fournisseurs facturent l'utilisation du calcul, du stockage, des opérations d'I/O et du transfert de données, tandis que certains facturent également les connexions, les requêtes ou d'autres indicateurs d'utilisation. Modélisez des scénarios de faible et de forte utilisation pour comprendre le coût réel d'une charge de travail. Les coûts cachés à surveiller comprennent le préchauffage de la capacité réservée, les frais de réplica de lecture, les frais de rétention des sauvegardes et le transfert de données inter-régions.
Demandez des rapports détaillés sur la facturation et l'utilisation pour éviter les surprises.
La latence affecte directement la réactivité de l'application et l'expérience utilisateur, même en cas de légers ralentissements. Au-delà des temps de réponse moyens, évaluez la latence p95 et p99 — les temps de réponse subis respectivement par les 5 % et 1 % de requêtes les plus lentes — pour comprendre comment la base de données se comporte en conditions réelles. Ces indicateurs révèlent souvent des démarrages à froid, des délais de mise à l'échelle et des goulots d'étranglement de connexion que les temps de réponse moyens peuvent masquer.
Demandez aux fournisseurs des bancs d'essai (benchmarks) de performance sous une charge réaliste, et non dans des conditions idéales, et prêtez attention à ce qui se passe lors des phases de montée en charge. La mise à l'échelle automatique peut entraîner des augmentations temporaires de la latence, une perte de connexion ou une mise en attente des requêtes, ce qui peut nuire aux flux de travail d'IA transactionnels.
Les fonctionnalités de sécurité des bases de données protègent les données sensibles, restreignent l'accès et offrent la visibilité nécessaire à la sécurité et à la conformité. Des fonctionnalités telles que le chiffrement au repos et en transit, l'isolation du réseau via des clouds privés virtuels (VPC) ou des points de terminaison privés, l'intégration de la gestion des identités et des accès (IAM) et les journaux d'audit sont essentielles pour les charges de travail d'IA.
La gestion des clés de chiffrement est également importante dans les architectures serverless. Certaines organisations exigent des clés de chiffrement gérées par le client (CMK) afin de contrôler l'accès à leurs données plutôt que de le confier au fournisseur. Lorsqu'une base de données serverless se met en pause automatique, cette relation clé-données doit rester intacte, car une clé mal configurée ou révoquée peut rendre la base de données inaccessible lors de la reprise du calcul.
Si votre organisation gère des données réglementées, confirmez la prise en charge du BYOK (bring your own key) et testez le comportement de la rotation des clés tout au long des cycles de pause avant de vous engager avec un fournisseur.
À mesure que les agents d'IA gagnent en autonomie, la gouvernance devient de plus en plus importante. Une base de données serverless isolée du reste de la pile de données crée des zones d'ombre en matière de gouvernance. Les bases de données qui s'intègrent à votre infrastructure d'analytique et d'IA maintiennent la cohérence des politiques, des audits et des contrôles de gouvernance de bout en bout.
Recherchez des fonctionnalités qui permettent d'appliquer les politiques de manière cohérente sur l'ensemble des systèmes qui stockent, traitent et analysent les données de l'entreprise, telles que l'intégration d'un catalogue unifié, le contrôle d'accès au niveau des lignes et des colonnes, et le suivi du lignage des données opérationnelles et analytiques.
Votre base de données doit prendre en charge les charges de travail d'IA de manière native, plutôt que de nécessiter des systèmes distincts et une surcharge opérationnelle. Recherchez des fonctionnalités qui distinguent les bases de données prêtes pour l'IA des systèmes OLTP traditionnels, notamment la recherche vectorielle native, la prise en charge du stockage des embeddings aux côtés des données structurées, l'intégration avec les feature stores et un alignement étroit avec l'infrastructure de service de modèles.
Vérifiez si les données vectorielles et relationnelles résident dans la même base de données ou si elles nécessitent un magasin de vecteurs distinct, et recherchez des bases de données capables de servir à la fois de système d'enregistrement opérationnel et de couche de recherche pour l'IA.
En plus de lire les données, les agents d'IA en écrivent également, par exemple pour mettre à jour les dossiers clients, exécuter une migration de schéma ou tester un nouveau workflow par rapport aux données de production. Cependant, cette capacité présente le risque qu'une mauvaise écriture corrompe le jeu de données dont dépendent tous les autres workflows. Les environnements de staging traditionnels sont utiles, mais les copies complètes de bases de données sont lentes à créer, coûteuses à maintenir et obsolètes dès leur création.
Le branching de base de données crée une copie instantanée et isolée d'une base de données avec les mêmes schémas et données, mais sans le coût de la duplication. Au lieu de copier les données sous-jacentes, une branche partage le stockage avec le parent et n'écrit de nouvelles données que lorsque des modifications sont apportées. Cela signifie qu'un agent peut rapidement obtenir son propre environnement de qualité production, expérimenter librement avec des données réelles et supprimer la branche une fois la tâche terminée, sans aucun risque d'affecter la production. Pour les équipes d'IA, cela élimine l'un des plus grands obstacles opérationnels au déploiement sécurisé d'agents à grande échelle.
Les temps d'arrêt des bases de données perturbent les charges de travail d'IA, c'est pourquoi la fiabilité et la reprise après sinistre sont des critères d'évaluation essentiels. Vérifiez la prise en charge de la réplication multi-zones de disponibilité, de la récupération à un instant dans le passé, du basculement automatique et des engagements documentés en matière d'objectif de point de récupération (RPO) et d'objectif de temps de récupération (RTO). Confirmez que la base de données utilise des réplicas qui partagent le stockage avec la base principale — pour moins de latence et des coûts réduits — plutôt que de maintenir des copies indépendantes complètes.
Utilisez cette liste de contrôle pour vous guider et poser les bonnes questions aux fournisseurs.
Les décisions relatives aux bases de données que les équipes prennent aujourd'hui façonneront la manière dont leurs applications d'IA évoluent, se comportent et se mettent à l'échelle. De plus en plus, cela commence par une base serverless capable de monter rapidement en charge et de redescendre à zéro, de gérer les schémas de connexion créés par les agents d'IA et de prendre en charge des fonctionnalités natives pour l'IA comme la recherche vectorielle.
À mesure que les agents d'IA prennent en charge une plus grande partie de la logique applicative, la demande devient plus dynamique et la base de données doit être plus élastique pour suivre le rythme. Les plateformes qui séparent le calcul du stockage offrent la flexibilité, l'efficacité et la résilience qu'exigent les charges de travail d'IA modernes.
Les organisations qui investissent dans la bonne infrastructure peuvent avancer plus rapidement, répondre plus efficacement aux besoins de leurs clients et concentrer leurs ressources sur l'innovation plutôt que sur les opérations.
Databricks propose Lakebase, une base de données Postgres serverless entièrement gérée, conçue pour les applications et les agents d'IA. Lakebase sépare le calcul du stockage pour les données transactionnelles, un différenciateur architectural qui permet une véritable mise à l'échelle élastique, élimine les coûts de calcul inactif et maintient les données constamment disponibles, que le calcul soit en cours d'exécution ou non.
Lakebase est situé sur la même couche de stockage et de gouvernance que le data lakehouse, de sorte que les données opérationnelles, l'analytique et les charges de travail d'IA partagent une plateforme unique, éliminant ainsi le besoin de pipelines ETL pour déplacer les données entre les systèmes. La compatibilité avec Postgres permet aux équipes de continuer à utiliser les outils, pilotes, bibliothèques et pratiques de développement familiers dès le premier jour.
La gouvernance est gérée via Unity Catalog, ce qui permet de garantir que les contrôles d'accès, le lignage et l'audit restent cohérents à chaque niveau de la plateforme. Dans le cadre de l'infrastructure serverless plus large de Databricks, Lakebase est conçu pour démarrer rapidement, s'adapter automatiquement à la demande et réduire la surcharge opérationnelle grâce à une infrastructure gérée et des fonctionnalités de résilience intégrées.
Superhuman, la plateforme de messagerie basée sur l'IA, met cette architecture en pratique. L'entreprise a adopté Lakebase comme colonne vertébrale transactionnelle pour ses applications internes et ses services de production. Grâce à ce changement, l'intégration de nouvelles fonctionnalités et les projets de reverse-ETL qui prenaient auparavant des mois ont été réduits à quelques semaines ou heures, tandis que la charge d'astreinte des équipes d'ingénierie a considérablement diminué.
Découvrez comment Lakebase réunit Postgres serverless, la gouvernance et l'IA sur une seule plateforme.
Toutes les bases de données utilisent des serveurs, mais les systèmes serverless avancés séparent le calcul et le stockage et peuvent réduire le calcul à zéro en cas d'inactivité. D'autres produits qualifiés de « serverless » maintiennent un niveau minimum non nul de calcul facturable.
Oui. Un démarrage à froid correspond à la latence ajoutée lorsque le calcul reprend après un état de pause. Les charges de travail sensibles à la latence peuvent atténuer les démarrages à froid grâce à un seuil de calcul non nul ou à un préchauffage planifié. Les temps de préchauffage varient selon le fournisseur.
De nombreuses bases de données serverless fournissent un pooler de connexions intégré ou une API HTTP/de données pour gérer un grand nombre de connexions de courte durée. C'est particulièrement important pour les agents d'IA, les fonctions serverless et d'autres charges de travail à forte simultanéité qui peuvent générer des pics de connexion.
Les bases de données serverless peuvent être nettement moins chères pour les charges de travail imprévisibles ou comportant de longues périodes d'inactivité, car vous ne payez que pour les ressources consommées. Un déploiement provisionné est souvent plus rentable pour les charges de travail à débit constamment élevé fonctionnant en continu.
Oui. Les bases de données PostgreSQL serverless utilisent des protocoles réseau standards qui permettent aux applications, outils et codes existants de se connecter au nouveau niveau serverless sans modification.
Les critères abordés dans ce guide — mise à l'échelle à zéro, mise à l'échelle rapide, gestion des connexions adaptée aux agents, intégration gouvernée des données et fonctionnalités d'IA natives comme la recherche vectorielle — constituent également un filtre. Toutes les bases de données présentées comme "serverless" ne répondent pas à l'ensemble de ces critères. Certaines échoueront sur le découplage architectural. D'autres échoueront sur le modèle de connexion ou l'intégration de la gouvernance. Avant de vous engager sur une plateforme, modélisez les deux extrêmes de votre charge de travail : son coût à l'état inactif et son coût en période de pointe. Cet exercice mettra en lumière la réalité architecturale derrière l'étiquette plus rapidement que n'importe quelle présentation d'un fournisseur.
Il convient également de garder à l'esprit l'évolution plus globale. À mesure que les agents d'IA prennent en charge une plus grande part de la logique applicative, le comportement de la base de données devient un comportement d'infrastructure. Une ressource provisionnée de manière fixe ne peut pas s'adapter à un agent qui distribue des requêtes de manière imprévisible, reste inactif pendant des heures, puis repart en flèche. La base de données sous-jacente à vos applications d'IA doit se comporter de la même manière que votre IA : élastique, réactive et toujours active quand c'est nécessaire.
(Cet article de blog a été traduit à l'aide d'outils basés sur l'intelligence artificielle) Article original
Abonnez-vous à notre blog et recevez les derniers articles directement dans votre boîte mail.