Revenir au contenu principal
Connexion
      • Dévouvrir
        • For App Developers
          • Pour les cadres dirigeants
            • Pour les start-up
              • architecture de lakehouse
                • Databricks Recherche en IA
                • Clients
                  • Histoires à la une
                  • Partenaires
                    • Aperçu des partenaires
                      Explorez l'écosystème des partenaires de Databricks
                      • Partenaire vedette
                        Annonces des partenaires en vedette
                        • Programme de partenariat
                          Découvrez les avantages, les différents niveaux et comment devenir partenaire
                          • Fournisseurs de cloud
                            Databricks sur AWS, Azure et GCP
                            • Trouver un partenaire
                              Découvrez les partenaires Databricks qui répondent à vos besoins
                              • Solutions pour les partenaires
                                Trouvez des solutions personnalisées pour votre secteur d'activité et votre migration.
                              • Plateforme Databricks
                                • Présentation de la plateforme
                                  Plateforme unifiée pour les données, l'analytique et l'IA
                                  • Data Engineering
                                    ETL et orchestration pour les données en batch et en streaming
                                    • Développement d'applications
                                      Développez rapidement des applications de données et d'IA
                                      • Entreposage des données
                                        ETL et orchestration pour les données en batch et en streaming
                                        • Intelligence artificielle
                                          Développez et déployez des applications de ML et d'IA générative
                                          • Base de données
                                            Postgres pour les applications de données et les agents IA
                                            • Business Intelligence
                                              De l'analytique intelligente pour les données du monde réel
                                              • Gouvernance
                                                Gouvernance unifiée pour tous les assets de données, d'analytique et d'IA
                                                • Productivité professionnelle
                                                  Recherche unifiée, chat, tableaux de bord et applications
                                                  • Sécurité
                                                    Un SIEM agentique et ouvert, conçu pour l'ère de l'IA
                                                    • Plateforme de données clients
                                                      CDP agentique intégré à Databricks
                                                      • Partage
                                                        Le partage ouvert pour les données, l'analytique et l'IA
                                                      • Intégrations et données
                                                        • Marketplace
                                                          Marketplace ouverte pour les données, l'analytique et l'IA
                                                          • Intégrations IDE
                                                            Développez sur le lakehouse dans votre IDE habituel
                                                            • Contact partenaires
                                                              Découvrez et intégrez l'écosystème Databricks
                                                            • Tarifs
                                                              • Tarifs de Databricks
                                                                Découvrez la tarification des produits, les DBU et bien d'autres aspects
                                                                • Calculateur de coûts
                                                                  Estimez vos coûts de calcul sur n'importe quel cloud
                                                                • Open Source
                                                                  • Technologies open source
                                                                    En savoir plus sur les innovations qui sous-tendent la plateforme
                                                                  • Databricks pour les entreprises
                                                                    • Télécommunications
                                                                      • Médias et divertissement
                                                                        • Services financiers
                                                                          • Secteur public
                                                                            • Santé et sciences du vivant
                                                                              • Vente au détail
                                                                                • Production industrielle
                                                                                  • Découvrez tous les secteurs d'activité
                                                                                  • Solutions transversales
                                                                                    • AI Agents
                                                                                      • Gouvernance de l'IA
                                                                                        • Cybersécurité
                                                                                          • Marketing
                                                                                          • Migration et déploiement
                                                                                            • Migration des données
                                                                                              • Services professionnels
                                                                                              • Accélérateurs de solutions
                                                                                                • Explorez les Accélérateurs
                                                                                                  Parvenez plus vite aux résultats qui comptent
                                                                                                • Formation et certification
                                                                                                  • Vue d'ensemble des formations
                                                                                                    Découvrez des cursus parfaitement adaptés à vos besoins
                                                                                                    • Databricks Academy
                                                                                                      Inscrivez-vous à la plateforme de formation Databricks
                                                                                                      • Certification
                                                                                                        Faites reconnaître vos compétences et sortez du lot
                                                                                                        • Édition gratuite
                                                                                                          Découvrez gratuitement des outils professionnels de données et d’IA.
                                                                                                          • University Alliance
                                                                                                            Vous voulez devenir formateur Databricks ? Découvrez comment.
                                                                                                          • Événements
                                                                                                            • Sommet Data + IA
                                                                                                              • Data + AI World Tour
                                                                                                                • AI Days
                                                                                                                  • Agenda des événements
                                                                                                                  • Blog et podcasts
                                                                                                                    • BLOG DATABRICKS
                                                                                                                      Explorez notre actualité, nos annonces produits et bien d'autres sujets
                                                                                                                      • AI Blog
                                                                                                                        Découvrez nos travaux de recherche et d'ingénierie en IA
                                                                                                                        • Podcast Data Brew
                                                                                                                          Parlons données !
                                                                                                                          • Champions des données+podcast IA→
                                                                                                                            Bénéficiez d'insights de leaders à la pointe de l'innovation en matière de données
                                                                                                                          • Assistance
                                                                                                                            • Assistance client
                                                                                                                              • Documentation
                                                                                                                                • Communauté
                                                                                                                                • Explorez
                                                                                                                                  • Centre de ressources
                                                                                                                                    • Centre de démonstration
                                                                                                                                      • Centre d’architecture
                                                                                                                                      • Entreprise
                                                                                                                                        • Qui sommes-nous
                                                                                                                                          • Notre équipe
                                                                                                                                            • Databricks Ventures
                                                                                                                                              • Nous contacter
                                                                                                                                              • Recrutement
                                                                                                                                                • Travailler chez Databricks
                                                                                                                                                  • Postes à pourvoir
                                                                                                                                                  • Presse
                                                                                                                                                    • Presse
                                                                                                                                                      • Prix et distinctions
                                                                                                                                                      • Sécurité et confiance
                                                                                                                                                        • Sécurité et confiance
                                                                                                                                                    • Prêt à vous lancer ?
                                                                                                                                                    • Obtenir une démo
                                                                                                                                                    • Connexion
                                                                                                                                                    • Nous contacter
                                                                                                                                                    • Essayer Databricks
                                                                                                                                                    1. Tous les blogs
                                                                                                                                                    2. /
                                                                                                                                                      Un socle de données et d'IA
                                                                                                                                                    • Comment fonctionne la recherche vectorielle ?
                                                                                                                                                    • La recherche vectorielle en pratique
                                                                                                                                                    • Recherche vectorielle vs recherche par mots-clés
                                                                                                                                                    • Recherche vectorielle vs recherche sémantique
                                                                                                                                                    • Vecteurs denses vs vecteurs creux
                                                                                                                                                    • Qu'est-ce que la recherche hybride ?
                                                                                                                                                    • Cas d'usage courants de la recherche vectorielle
                                                                                                                                                    • Avez-vous besoin d'une base de données vectorielle pour la recherche vectorielle ?
                                                                                                                                                    • Compromis opérationnels et considérations de qualité
                                                                                                                                                    • AI Search sur la plateforme Databricks
                                                                                                                                                    • Foire aux questions
                                                                                                                                                    • Commencez à développer avec la recherche vectorielle gouvernée
                                                                                                                                                    • Comment fonctionne la recherche vectorielle ?
                                                                                                                                                    • La recherche vectorielle en pratique
                                                                                                                                                    • Recherche vectorielle vs recherche par mots-clés
                                                                                                                                                    • Recherche vectorielle vs recherche sémantique
                                                                                                                                                    • Vecteurs denses vs vecteurs creux
                                                                                                                                                    • Qu'est-ce que la recherche hybride ?
                                                                                                                                                    • Cas d'usage courants de la recherche vectorielle
                                                                                                                                                    • Avez-vous besoin d'une base de données vectorielle pour la recherche vectorielle ?
                                                                                                                                                    • Compromis opérationnels et considérations de qualité
                                                                                                                                                    • AI Search sur la plateforme Databricks
                                                                                                                                                    • Foire aux questions
                                                                                                                                                    • Commencez à développer avec la recherche vectorielle gouvernée
                                                                                                                                                    Un socle de données et d'IA

                                                                                                                                                    Qu'est-ce que la recherche vectorielle ?

                                                                                                                                                    par Équipe Databricks

                                                                                                                                                    • La recherche vectorielle récupère des informations basées sur le sens et le contexte plutôt que sur des correspondances exactes de mots-clés, en utilisant des embeddings pour identifier des textes, des images, des fichiers audio et d'autres contenus similaires.
                                                                                                                                                    • Elle surmonte les limites de la recherche par mots-clés uniquement, aidant les systèmes à reconnaître les synonymes, à effectuer des recherches dans plusieurs langues et formats, et à récupérer des informations pertinentes pour des cas d'usage tels que le RAG, la recherche d'entreprise, les recommandations et la détection d'anomalies.
                                                                                                                                                    • Les systèmes en production combinent souvent la recherche vectorielle et la recherche par mots-clés pour obtenir de meilleurs résultats, tandis que les services gérés comme Databricks AI Search ajoutent du reranking, du filtrage de métadonnées, des mises à jour automatiques d'index et de la gouvernance pour améliorer la pertinence et simplifier les opérations.

                                                                                                                                                    La recherche vectorielle est une technique de recherche qui trouve des résultats basés sur le sens, et non pas seulement sur la correspondance de mots-clés. Là où la recherche traditionnelle fait correspondre des mots exacts, la recherche vectorielle compare des embeddings. Ces représentations numériques capturent le sens du texte, des images, de l'audio et d'autres contenus.

                                                                                                                                                    Les résultats sont classés selon la proximité de leurs embeddings avec ceux de la requête, et non par les mots partagés. Cela fait de la recherche vectorielle une couche de récupération (retrieval) essentielle derrière les assistants IA modernes, les systèmes de recherche sémantique et la génération augmentée de récupération (RAG).

                                                                                                                                                    Ce guide explique le fonctionnement de la recherche vectorielle, sa comparaison avec la recherche par mots-clés et la recherche sémantique, des exemples et cas d'usage courants, ainsi que la manière de l'évaluer en pratique.

                                                                                                                                                    Comment fonctionne la recherche vectorielle ?

                                                                                                                                                    La recherche vectorielle fonctionne en trois étapes : la création d'embeddings, la construction d'un index et la mise en correspondance d'une requête avec cet index.

                                                                                                                                                    1. Créer des embeddings
                                                                                                                                                      Un modèle convertit chaque élément en un embedding, une représentation numérique qui capture son sens. Les documents, les descriptions de produits, les images et les clips audio peuvent tous être représentés de cette manière. Les éléments ayant des sens similaires ont tendance à avoir des embeddings similaires.
                                                                                                                                                    2. Construire un index
                                                                                                                                                      Ces embeddings sont stockés dans une structure conçue pour une recherche de similarité rapide. L'index permet d'effectuer des recherches efficaces parmi des millions d'éléments.
                                                                                                                                                    3. Faire correspondre la requête
                                                                                                                                                      Lorsqu'une requête arrive, elle est convertie en un embedding à l'aide du même modèle. Le système trouve ensuite les embeddings stockés les plus proches de la requête et renvoie les résultats associés.

                                                                                                                                                    La recherche de ces correspondances les plus proches est appelée recherche des plus proches voisins. L'approche la plus simple, la recherche des k plus proches voisins (k-NN), compare la requête à chaque élément de l'index et renvoie les k correspondances les plus proches. Bien que précise, elle devient trop lente à mesure que les ensembles de données atteignent des millions d'éléments.

                                                                                                                                                    La plupart des systèmes en production utilisent plutôt la recherche des plus proches voisins approximatifs (ANN). L'ANN utilise des index spécialisés pour identifier les correspondances probables sans comparer chaque élément. Elle sacrifie une infime part de précision pour obtenir des performances nettement plus rapides, rendant la recherche vectorielle pratique à grande échelle.

                                                                                                                                                    La recherche vectorielle en pratique

                                                                                                                                                    Une recherche simple illustre la différence entre la recherche vectorielle et la recherche par mots-clés.

                                                                                                                                                    Recherchez « chien ». Une recherche par mots-clés renvoie des résultats contenant ce mot exact. Une recherche vectorielle peut également renvoyer des résultats pour « chiot », « canidé » et « golden retriever ». Ces termes sont conceptuellement liés à « chien », même s'ils utilisent des mots différents. Le moteur de recherche recherche le concept, et non le mot exact.

                                                                                                                                                    La recherche vectorielle fonctionne également sur différents formats. Une requête textuelle comme « baskets rouges » peut renvoyer des images de produits qui correspondent à la description, même si l'image ne contient aucun texte. La recherche par mots-clés ne peut pas faire ce lien car elle repose sur la correspondance des mots. La recherche vectorielle récupère le contenu en fonction de la similarité sémantique, quel que soit le format.

                                                                                                                                                    Recherche vectorielle vs recherche par mots-clés

                                                                                                                                                    La recherche par mots-clés fait correspondre les mots. La recherche vectorielle fait correspondre le sens. Les deux approches ont leurs forces, c'est pourquoi la recherche vectorielle complète la recherche par mots-clés plutôt que de la remplacer.

                                                                                                                                                    La recherche par correspondance exacte reste le meilleur outil pour les requêtes structurées telles que les identifiants de commande, les codes de produits et les titres de documents connus.

                                                                                                                                                    AttributRecherche par mots-clésRecherche vectorielle
                                                                                                                                                    Correspondance surMots exactsSens et contexte
                                                                                                                                                    Gère les synonymesFaibleFort
                                                                                                                                                    Fonctionne dans plusieurs languesNonSouvent oui
                                                                                                                                                    Fonctionne sur les images et l'audioNonOui
                                                                                                                                                    Idéal pour les termes exacts (ID, codes)FortPlus faible
                                                                                                                                                    Méthode typiqueBM25 / TF-IDFRecherche des plus proches voisins

                                                                                                                                                    Les systèmes de recherche les plus performants combinent les deux approches. La section sur la recherche hybride ci-dessous explique comment.

                                                                                                                                                    Recherche vectorielle vs recherche sémantique

                                                                                                                                                    La recherche sémantique et la recherche vectorielle sont étroitement liées, mais elles ne sont pas identiques. La recherche sémantique est le résultat : aider les utilisateurs à trouver des informations pertinentes basées sur le sens et le contexte. La recherche vectorielle est l'une des techniques les plus courantes utilisées pour y parvenir.

                                                                                                                                                    Parce que la recherche sémantique décrit un résultat plutôt qu'une technologie spécifique, elle peut être implémentée de différentes manières. Dans de nombreux systèmes modernes, la recherche vectorielle est le moteur principal de la recherche sémantique.

                                                                                                                                                    Vecteurs denses vs vecteurs creux

                                                                                                                                                    Les vecteurs denses et les vecteurs creux sont conçus pour différents types de problèmes de recherche.

                                                                                                                                                    Les vecteurs denses capturent le sens général et le contexte. Ils aident les systèmes à reconnaître les idées, synonymes et concepts associés, même lorsque des mots différents sont utilisés. Générés par des modèles de machine learning, ils sont bien adaptés à la correspondance sémantique et multilingue.

                                                                                                                                                    Les vecteurs creux fonctionnent davantage comme la recherche par mots-clés traditionnelle. La plupart des valeurs sont nulles, avec des valeurs non nulles uniquement pour les termes qui apparaissent dans le contenu. Générés par des algorithmes tels que BM25, ils excellent dans la correspondance de termes exacts. Les codes de produits, les noms propres et les identifiants spécifiques sont les domaines de prédilection des vecteurs creux.

                                                                                                                                                    TypeCe qu'il captureIdéal pour
                                                                                                                                                    Vecteurs densesSens général et contexteCorrespondance sémantique, de synonymes et multilingue
                                                                                                                                                    Vecteurs creuxMots-clés spécifiques et leurs poidsTermes exacts, noms et codes

                                                                                                                                                    La combinaison de vecteurs denses et creux est la base de la recherche hybride. Cette combinaison offre souvent les résultats les plus fiables en production.

                                                                                                                                                    Qu'est-ce que la recherche hybride ?

                                                                                                                                                    La recherche hybride fusionne les résultats basés sur les vecteurs et ceux basés sur les mots-clés en un seul classement. C'est souvent le choix par défaut pratique pour les systèmes en production car elle combine la récupération basée sur le sens et la correspondance exacte dans une seule expérience de recherche. La recherche vectorielle peut manquer des codes de produits, des noms ou des identifiants exacts car ces termes ne se regroupent pas toujours étroitement dans l'espace d'embedding. La recherche par mots-clés peut manquer des résultats pertinents qui utilisent une formulation différente. La recherche hybride répond à ces deux défis en combinant les forces de chaque approche.

                                                                                                                                                    La plupart des systèmes de recherche hybride incluent également une étape de reclassement (reranking). Le reclassement est une seconde passe qui réorganise les résultats pour placer les meilleures correspondances en tête. Par conséquent, la recherche hybride offre souvent une pertinence plus fiable que l'une ou l'autre méthode seule. La plateforme Databricks prend en charge les index hybrides qui combinent recherche sémantique et recherche par mots-clés, avec un reclassement intégré.

                                                                                                                                                    Rapport

                                                                                                                                                    Le guide pratique de l'IA agentique pour l'entreprise

                                                                                                                                                    Lire la suite
                                                                                                                                                    image

                                                                                                                                                    Cas d'usage courants de la recherche vectorielle

                                                                                                                                                    La recherche vectorielle alimente des applications qui dépendent de la recherche de résultats pertinents plutôt que de correspondances exactes de mots-clés.

                                                                                                                                                    Génération augmentée de récupération (RAG)

                                                                                                                                                    La génération augmentée de récupération (RAG) aide les assistants IA à répondre aux questions en utilisant des informations récentes et pertinentes plutôt que de s'appuyer entièrement sur ce que le modèle sait déjà. Avant de répondre, l'assistant récupère le contenu pertinent dans une base de connaissances. La recherche vectorielle est la couche de récupération qui trouve ce contenu.

                                                                                                                                                    Les documents sont découpés en fragments plus petits (chunks) afin que le système puisse récupérer le passage le plus pertinent, et pas seulement le document le plus pertinent. Cette approche a fait de RAG l'une des applications de la recherche vectorielle qui connaît la croissance la plus rapide. En savoir plus sur RAG et les bases de données vectorielles.

                                                                                                                                                    Recherche sémantique de documents et recherche d'entreprise

                                                                                                                                                    Les bases de connaissances internes, les systèmes de tickets et les référentiels de documents deviennent plus utiles lorsque les utilisateurs effectuent des recherches par sens plutôt que par formulation exacte. Une requête comme « politique de congé parental » peut faire ressortir le bon document RH même s'il est intitulé « guide des prestations familiales ». La recherche vectorielle facilite la recherche des connaissances de l'entreprise sans nécessiter de formulation exacte.

                                                                                                                                                    Recommandations et recherche de similarité

                                                                                                                                                    Les moteurs de recommandation utilisent la recherche vectorielle pour trouver des produits, des articles, des vidéos et d'autres contenus conceptuellement similaires à ce qu'un utilisateur consulte déjà. Cela alimente des expériences familières telles que les recommandations « les clients qui ont aimé ceci ont également aimé ». Le système trouve simplement les éléments dont les embeddings sont les plus proches de l'élément actuel.

                                                                                                                                                    Recherche multimodale et multilingue

                                                                                                                                                    La recherche vectorielle peut établir des correspondances entre différents formats et langues. Une requête textuelle comme « chaussures de randonnée pour terrain humide » peut renvoyer des images de produits pertinentes, même si les images ne contiennent aucun texte. Une requête en anglais peut également récupérer des documents pertinents rédigés en espagnol. Cela rend la recherche vectorielle utile pour les organisations mondiales et les applications qui fonctionnent avec divers types de contenu.

                                                                                                                                                    Détection des fraudes et des anomalies

                                                                                                                                                    La recherche vectorielle peut aider à identifier des modèles inhabituels en trouvant des éléments qui s'écartent de la normale. Dans la détection des fraudes, les transactions qui semblent très différentes de l'activité typique peuvent être signalées pour examen. La même approche peut être utilisée pour détecter des anomalies dans le trafic réseau, les systèmes de fabrication et d'autres données opérationnelles.

                                                                                                                                                    Avez-vous besoin d'une base de données vectorielle pour la recherche vectorielle ?

                                                                                                                                                    Pas toujours. La bonne approche dépend de votre échelle, de vos exigences de performance et de votre infrastructure existante. Les organisations implémentent généralement la recherche vectorielle à l'aide d'une base de données vectorielle, d'un moteur de recherche doté de fonctionnalités vectorielles ou d'une bibliothèque de recherche de similarité. En savoir plus sur les bases de données vectorielles.

                                                                                                                                                    OptionDescriptionIdéal pour
                                                                                                                                                    Base de données vectorielleConçue spécifiquement pour les embeddings à grande échelleBesoins de volumes élevés et de faible latence
                                                                                                                                                    Moteur de recherche avec fonctionnalités vectoriellesAjoute des vecteurs à la recherche existanteRecherche par mots-clés déjà en place
                                                                                                                                                    BibliothèqueBoîte à outils de code pour la recherche de similaritéPetits projets, prototypage

                                                                                                                                                    Les services gérés peuvent réduire le temps de configuration, la charge opérationnelle et la maintenance continue. La plateforme Databricks comprend une base de données vectorielle intégrée via Databricks AI Search, qui combine recherche vectorielle, recherche par mots-clés, filtrage des métadonnées et réordonnancement dans un seul service. Elle s'intègre également aux fonctionnalités de gouvernance de l'AI telles que Unity Catalog, aidant les organisations à appliquer des contrôles cohérents aux applications AI.

                                                                                                                                                    Compromis opérationnels et considérations de qualité

                                                                                                                                                    L'implémentation de la recherche vectorielle dans un environnement de production n'est que la première étape. Pour garantir une fiabilité, des performances et une précision durables en production, ces systèmes nécessitent un ajustement et une maintenance continus dans plusieurs domaines opérationnels clés.

                                                                                                                                                    Coût et performances

                                                                                                                                                    Les grands index vectoriels consomment de la mémoire et des ressources de calcul, ce qui augmente les coûts d'infrastructure. À mesure que les ensembles de données se développent et que les volumes de requêtes augmentent, ces coûts augmentent également. Une recherche plus rapide et plus précise nécessite souvent plus de ressources, de sorte que les équipes doivent équilibrer les performances, la qualité et le coût.

                                                                                                                                                    Maintenir la fraîcheur de l'index

                                                                                                                                                    Les index vectoriels ne se mettent pas à jour automatiquement lorsque le contenu source change. Lorsque des documents sont ajoutés, modifiés ou supprimés, l'index doit être actualisé pour refléter ces changements. Sans mises à jour régulières, les résultats de recherche peuvent devenir obsolètes et passer à côté de nouvelles informations importantes.

                                                                                                                                                    Évaluer la qualité

                                                                                                                                                    Avant d'ajuster un système, créez un petit ensemble de tests contenant des requêtes représentatives avec des résultats connus comme corrects. Mesurer la qualité consiste à vérifier si les bons résultats apparaissent en tête de liste pour ces requêtes. Cela crée une base de référence pour évaluer les modifications futures.

                                                                                                                                                    Deux facteurs ont souvent un impact significatif sur la pertinence. Les filtres de métadonnées affinent les résultats par balises, dates ou catégories avant l'exécution du classement par similarité. Cela peut améliorer la précision lorsque la correspondance sémantique renvoie trop de résultats.

                                                                                                                                                    La qualité des embeddings dépend également du modèle utilisé pour les générer. Les modèles à usage général peuvent ne pas bien saisir la terminologie spécialisée. Pour les domaines utilisant un langage spécifique à un secteur, comme la santé, le droit ou les services financiers, un modèle adapté au domaine peut améliorer la qualité de la récupération.

                                                                                                                                                    AI Search sur la plateforme Databricks

                                                                                                                                                    Databricks AI Search est une base de données vectorielle gérée intégrée à la plateforme Databricks. Elle prend en charge la recherche sémantique, la recherche par mots-clés, le filtrage des métadonnées et le réordonnancement dans un seul service. Parce qu'elle s'intègre aux données, à la gouvernance et aux outils de productivité existants, les équipes peuvent concevoir des systèmes de récupération sans avoir à assembler des plateformes distinctes.

                                                                                                                                                    AI Search se connecte directement aux données que les organisations gèrent déjà dans Databricks, réduisant ainsi le besoin de déplacer ou de dupliquer les données. Elle s'intègre également aux fonctionnalités de gouvernance telles que Unity Catalog, permettant d'étendre les contrôles d'accès et les politiques de lignage existants aux charges de travail de recherche.

                                                                                                                                                    Foire aux questions

                                                                                                                                                    Comment la recherche vectorielle est-elle utilisée dans les applications RAG ?

                                                                                                                                                    Dans un système RAG, la requête de l'utilisateur est convertie en un embedding et comparée à une bibliothèque de fragments de documents dans un index vectoriel. Les correspondances les plus proches sont récupérées et transmises au modèle de langage en tant que contexte. Le modèle génère ensuite une réponse basée sur les propres données de l'organisation plutôt que de s'appuyer uniquement sur ses données d'entraînement.

                                                                                                                                                    Quand faut-il utiliser la recherche hybride plutôt que la recherche vectorielle seule ?

                                                                                                                                                    Lorsque les utilisateurs recherchent des identifiants spécifiques tels que des codes produits, des codes d'erreur ou des noms propres, la recherche sémantique seule peut passer à côté. Les termes exacts ne s'alignent pas toujours étroitement dans l'espace d'embedding. La recherche hybride combine les résultats vectoriels et par mots-clés, offrant à la fois une étendue sémantique et une précision de correspondance exacte dans un classement unique.

                                                                                                                                                    Qu'est-ce qui rend les résultats de recherche vectorielle plus précis ?

                                                                                                                                                    Plusieurs facteurs influencent la qualité de la récupération. La qualité du modèle d'embedding détermine la manière dont le sens est capturé. Les filtres de métadonnées restreignent l'espace de recherche avant l'exécution du classement par similarité. La fraîcheur de l'index garantit que les résultats reflètent le contenu actuel plutôt que des informations obsolètes.

                                                                                                                                                    Quels sont les principaux compromis de la recherche vectorielle ?

                                                                                                                                                    La recherche vectorielle nécessite plus de mémoire et de calcul que la recherche par mots-clés. Les grands index entraînent des coûts d'infrastructure réels. La recherche ANN est approximative par conception, ce qui crée un léger compromis de précision par rapport à une recherche exhaustive. Les index nécessitent également des actualisations régulières pour rester à jour à mesure que les données sources changent. La recherche hybride ajoute de la complexité mais fournit souvent des résultats plus fiables que l'une ou l'autre approche seule.

                                                                                                                                                    Comment Databricks AI Search prend-il en charge la recherche vectorielle ?

                                                                                                                                                    Databricks AI Search est une base de données vectorielle gérée et serverless intégrée à la plateforme Databricks. Elle prend en charge la recherche hybride, le filtrage des métadonnées et le réordonnancement intégré. Des pipelines de synchronisation automatisés maintiennent les index à jour au fur et à mesure que les données des tables Delta changent, tandis que Unity Catalog étend les contrôles de gouvernance aux charges de travail de recherche.

                                                                                                                                                    Commencez à développer avec la recherche vectorielle gouvernée

                                                                                                                                                    La recherche vectorielle aide les systèmes AI à trouver des informations pertinentes basées sur le sens plutôt que sur des mots-clés exacts. Cette fonctionnalité alimente tout, des applications RAG aux moteurs de recommandation en passant par la recherche d'entreprise.

                                                                                                                                                    À mesure que les systèmes AI dépendent de plus en plus de la récupération d'informations, la recherche hybride et une infrastructure de recherche fiable deviennent de plus en plus importantes. Pour en savoir plus, découvrez AI Search sur la plateforme Databricks.

                                                                                                                                                    (Cet article de blog a été traduit à l'aide d'outils basés sur l'intelligence artificielle) Article original

                                                                                                                                                    Recevez les derniers articles dans votre boîte mail

                                                                                                                                                    Abonnez-vous à notre blog et recevez les derniers articles directement dans votre boîte mail.

                                                                                                                                                    Sign up

                                                                                                                                                    Voir tous les blogs
                                                                                                                                                    databricks logo
                                                                                                                                                    Pourquoi choisir Databricks
                                                                                                                                                    Pourquoi choisir Databricks
                                                                                                                                                    • For App Developers
                                                                                                                                                    • Pour les cadres dirigeants
                                                                                                                                                    • Pour les start-up
                                                                                                                                                    • architecture de lakehouse
                                                                                                                                                    • Databricks Recherche en IA
                                                                                                                                                    Clients
                                                                                                                                                    • en vedette
                                                                                                                                                    Partenaires
                                                                                                                                                    • Aperçu des partenaires
                                                                                                                                                    • Programme de partenariat
                                                                                                                                                    • Trouver un partenaire
                                                                                                                                                    • Partenaire vedette
                                                                                                                                                    • Fournisseurs de cloud
                                                                                                                                                    • Solutions pour les partenaires
                                                                                                                                                    Pourquoi choisir Databricks
                                                                                                                                                    • For App Developers
                                                                                                                                                    • Pour les cadres dirigeants
                                                                                                                                                    • Pour les start-up
                                                                                                                                                    • architecture de lakehouse
                                                                                                                                                    • Databricks Recherche en IA
                                                                                                                                                    Clients
                                                                                                                                                    • en vedette
                                                                                                                                                    Partenaires
                                                                                                                                                    • Aperçu des partenaires
                                                                                                                                                    • Programme de partenariat
                                                                                                                                                    • Trouver un partenaire
                                                                                                                                                    • Partenaire vedette
                                                                                                                                                    • Fournisseurs de cloud
                                                                                                                                                    • Solutions pour les partenaires
                                                                                                                                                    Produit
                                                                                                                                                    Plateforme Lakehouse
                                                                                                                                                    • Présentation de la plateforme
                                                                                                                                                    • Développement d'applications
                                                                                                                                                    • Intelligence artificielle
                                                                                                                                                    • Business Intelligence
                                                                                                                                                    • Productivité professionnelle
                                                                                                                                                    • Plateforme de données clients
                                                                                                                                                    • Data Engineering
                                                                                                                                                    • Entreposage des données
                                                                                                                                                    • Base de données
                                                                                                                                                    • Gouvernance des données
                                                                                                                                                    • Sécurité
                                                                                                                                                    • Partage
                                                                                                                                                    Tarifs
                                                                                                                                                    • Vue d'ensemble des tarifs
                                                                                                                                                    • Calculatrice de tarifs
                                                                                                                                                    Open Source
                                                                                                                                                    Intégrations et données
                                                                                                                                                    • Marketplace
                                                                                                                                                    • Intégrations IDE
                                                                                                                                                    • Contact partenaires
                                                                                                                                                    Plateforme Lakehouse
                                                                                                                                                    • Présentation de la plateforme
                                                                                                                                                    • Développement d'applications
                                                                                                                                                    • Intelligence artificielle
                                                                                                                                                    • Business Intelligence
                                                                                                                                                    • Productivité professionnelle
                                                                                                                                                    • Plateforme de données clients
                                                                                                                                                    • Data Engineering
                                                                                                                                                    • Entreposage des données
                                                                                                                                                    • Base de données
                                                                                                                                                    • Gouvernance des données
                                                                                                                                                    • Sécurité
                                                                                                                                                    • Partage
                                                                                                                                                    Tarifs
                                                                                                                                                    • Vue d'ensemble des tarifs
                                                                                                                                                    • Calculatrice de tarifs
                                                                                                                                                    Intégrations et données
                                                                                                                                                    • Marketplace
                                                                                                                                                    • Intégrations IDE
                                                                                                                                                    • Contact partenaires
                                                                                                                                                    Solutions
                                                                                                                                                    Par secteur
                                                                                                                                                    • Communications
                                                                                                                                                    • Services financiers
                                                                                                                                                    • Santé et sciences du vivant
                                                                                                                                                    • Production industrielle
                                                                                                                                                    • Médias et divertissement
                                                                                                                                                    • Secteur public
                                                                                                                                                    • Vente au détail
                                                                                                                                                    • Tout afficher
                                                                                                                                                    Solutions transversales
                                                                                                                                                    • Agents IA
                                                                                                                                                    • Gouvernance de l'IA
                                                                                                                                                    • Cybersécurité
                                                                                                                                                    • Marketing
                                                                                                                                                    Migration des données
                                                                                                                                                    Services professionnels
                                                                                                                                                    Accélérateurs de solutions
                                                                                                                                                    Par secteur
                                                                                                                                                    • Communications
                                                                                                                                                    • Services financiers
                                                                                                                                                    • Santé et sciences du vivant
                                                                                                                                                    • Production industrielle
                                                                                                                                                    • Médias et divertissement
                                                                                                                                                    • Secteur public
                                                                                                                                                    • Vente au détail
                                                                                                                                                    • Tout afficher
                                                                                                                                                    Solutions transversales
                                                                                                                                                    • Agents IA
                                                                                                                                                    • Gouvernance de l'IA
                                                                                                                                                    • Cybersécurité
                                                                                                                                                    • Marketing
                                                                                                                                                    Ressources
                                                                                                                                                    Documentation
                                                                                                                                                    Assistance client
                                                                                                                                                    Communauté
                                                                                                                                                    Formation et certification
                                                                                                                                                    • Formation
                                                                                                                                                    • Certification
                                                                                                                                                    • Édition gratuite
                                                                                                                                                    • University Alliance
                                                                                                                                                    • Databricks Academy – Connexion
                                                                                                                                                    Événements
                                                                                                                                                    • Sommet Data + IA
                                                                                                                                                    • Data + AI World Tour
                                                                                                                                                    • AI Days
                                                                                                                                                    • Agenda complet
                                                                                                                                                    Blog et podcasts
                                                                                                                                                    • BLOG DATABRICKS
                                                                                                                                                    • AI Blog
                                                                                                                                                    • Podcast Data Brew
                                                                                                                                                    • Podcast Champions of Data & AI
                                                                                                                                                    Formation et certification
                                                                                                                                                    • Formation
                                                                                                                                                    • Certification
                                                                                                                                                    • Édition gratuite
                                                                                                                                                    • University Alliance
                                                                                                                                                    • Databricks Academy – Connexion
                                                                                                                                                    Événements
                                                                                                                                                    • Sommet Data + IA
                                                                                                                                                    • Data + AI World Tour
                                                                                                                                                    • AI Days
                                                                                                                                                    • Agenda complet
                                                                                                                                                    Blog et podcasts
                                                                                                                                                    • BLOG DATABRICKS
                                                                                                                                                    • AI Blog
                                                                                                                                                    • Podcast Data Brew
                                                                                                                                                    • Podcast Champions of Data & AI
                                                                                                                                                    Nous connaître
                                                                                                                                                    Entreprise
                                                                                                                                                    • Qui sommes-nous
                                                                                                                                                    • Notre leadership
                                                                                                                                                    • Databricks Ventures
                                                                                                                                                    • Nous contacter
                                                                                                                                                    Recrutement
                                                                                                                                                    • Postes à pourvoir
                                                                                                                                                    • Travailler chez Databricks
                                                                                                                                                    Presse
                                                                                                                                                    • Presse
                                                                                                                                                    • Prix et distinctions
                                                                                                                                                    Sécurité et confiance
                                                                                                                                                    Entreprise
                                                                                                                                                    • Qui sommes-nous
                                                                                                                                                    • Notre leadership
                                                                                                                                                    • Databricks Ventures
                                                                                                                                                    • Nous contacter
                                                                                                                                                    Recrutement
                                                                                                                                                    • Postes à pourvoir
                                                                                                                                                    • Travailler chez Databricks
                                                                                                                                                    Presse
                                                                                                                                                    • Presse
                                                                                                                                                    • Prix et distinctions
                                                                                                                                                    databricks logo

                                                                                                                                                    Databricks Inc.
                                                                                                                                                    160 Spear Street, 15th Floor
                                                                                                                                                    San Francisco, CA 94105
                                                                                                                                                    1-866-330-0121

                                                                                                                                                    Découvrez les offres d'emploi
                                                                                                                                                    chez Databricks

                                                                                                                                                    © Databricks 2026. All rights reserved. Apache, Apache Spark, Spark and the Spark logo are trademarks of the Apache Software Foundation.

                                                                                                                                                    • Avis de confidentialité
                                                                                                                                                    • |Conditions d'utilisation
                                                                                                                                                    • |Déclaration sur l'esclavage moderne
                                                                                                                                                    • |Vos droits de confidentialité en Californie
                                                                                                                                                    • |Vos choix de confidentialité