5. März 2024

Sinnvolle Produktempfehlungen mithilfe von Large Language Models

von Avinash Sooriyarchchi, Sam Sawyer, Colton Peltier und Bryan Smith

Sehen Sie sich unsere LLM Solution Accelerators für den Einzelhandel an, um weitere Details zu erfahren und die Notebooks herunterzuladen.

Produktempfehlungen sind ein Kernbestandteil des modernen Kundenerlebnisses. Wenn User auf eine Website zurückkehren, mit der sie zuvor interagiert haben, erwarten sie Empfehlungen, die sich auf diese früheren Interaktionen beziehen und ihnen helfen, dort anzuknüpfen, wo sie aufgehört haben. Wenn sich User für einen bestimmten Artikel interessieren, erwarten sie Vorschläge für ähnliche, relevante Alternativen, die ihnen helfen, genau das richtige Produkt für ihre Bedürfnisse zu finden. Und wenn Artikel in den Warenkorb gelegt werden, erwarten die User Vorschläge für zusätzliche Produkte, die ihr Einkaufserlebnis abrunden und verbessern. Richtig umgesetzt erleichtern diese Produktempfehlungen nicht nur den Einkaufsprozess, sondern geben den Kunden auch das Gefühl, vom Händler wahrgenommen und verstanden zu werden.

Es gibt zwar viele verschiedene Ansätze zur Erstellung von Produktempfehlungen, doch die meisten heute verwendeten Recommendation Engines stützen sich auf historische Interaktionsmuster zwischen Produkten und Kunden. Diese Muster werden durch den Einsatz hochentwickelter Verfahren auf der Grundlage großer Mengen händlerspezifischer Daten gelernt. Diese Engines sind erstaunlich robust darin, Muster aus erfolgreichen Kundeninteraktionen zu verstärken. Manchmal müssen wir jedoch mit diesen historischen Mustern brechen, um ein anderes Erlebnis zu bieten.

Stellen Sie sich ein Szenario vor, in dem ein neues Produkt eingeführt wurde, für das in unseren Daten nur eine begrenzte Anzahl von Interaktionen vorliegt. Empfehlungssysteme, die auf Erkenntnissen aus zahlreichen Kundeninteraktionen basieren, schlagen das Produkt unter Umständen erst dann vor, wenn genügend Daten vorliegen, um eine Empfehlung zu stützen.

Oder stellen Sie sich ein anderes Szenario vor, in dem ein einzelnes Produkt übermäßig viel Aufmerksamkeit auf sich zieht. In diesem Fall läuft das Empfehlungssystem Gefahr, in die Falle zu tappen, aufgrund der enormen Beliebtheit immer nur diesen einen Artikel vorzuschlagen – zum Nachteil anderer geeigneter Produkte im Sortiment.

Um diese und ähnliche Herausforderungen zu vermeiden, können Händler eine Taktik anwenden, die auf allgemein bekannten Mustern der Produktassoziation basiert. Ähnlich wie ein hilfsbereiter Verkaufsberater könnte diese Art von Empfehlungssystem die Artikel analysieren, an denen ein Kunde interessiert zu sein scheint, und zusätzliche Produkte vorschlagen, die zu dem Weg passen, den diese Produktkombinationen andeuten.

Nutzung eines Large Language Models für Empfehlungen

Stellen Sie sich das Szenario vor, in dem ein Kunde nach Winterschals, Mützen und Fäustlingen sucht. Offensichtlich bereitet sich dieser Kunde auf einen Ausflug bei kaltem Wetter vor. Nehmen wir an, der Händler hat vor Kurzem dicke Wollsocken und Winterstiefel in sein Sortiment aufgenommen. Während andere Empfehlungssysteme die Verbindung dieser Artikel mit den vom Kunden angesehenen Produkten aufgrund fehlender Interaktionen in den historischen Daten vielleicht noch nicht erkennen, verknüpft das Allgemeinwissen diese Artikel miteinander.

Diese Art von Wissen wird häufig von Large Language Models (LLMs) erfasst, die auf der Grundlage riesiger Mengen an allgemeinem Text trainiert wurden. In diesem Text werden Fäustlinge und Stiefel möglicherweise direkt miteinander verknüpft, weil Menschen beide Artikel anziehen, bevor sie nach draußen gehen. Zudem werden sie mit Begriffen wie „Kälte“, „Schnee“ und „Winter“ assoziiert, was die Beziehung stärkt und andere verwandte Artikel einbezieht.

Wenn das LLM dann gefragt wird, welche anderen Artikel mit einem Schal, einer Mütze und Fäustlingen in Verbindung gebracht werden könnten, wird all dieses in Milliarden von internen Parametern gespeicherte Wissen genutzt, um eine priorisierte Liste zusätzlicher Artikel vorzuschlagen, die wahrscheinlich von Interesse sind. (Abbildung 1)

Abbildung 1. Zusätzliche Artikel, die vom Llama2-70b-LLM vorgeschlagen werden, basierend auf dem Interesse eines Kunden an Winterschals, Mützen und Fäustlingen

Das Schöne an diesem Ansatz ist, dass wir uns nicht darauf beschränken müssen, das LLM nur die Artikel im Warenkorb isoliert betrachten zu lassen. Wir können berücksichtigen, dass ein Kunde, der diese Winterartikel im Süden von Texas kauft, andere Präferenzen hat als ein Kunde, der dieselben Artikel im Norden von Minnesota sucht, und diese geografischen Informationen in den Prompt des LLMs einfließen lassen. Wir können auch Informationen über Werbekampagnen oder Events integrieren, um das LLM anzuregen, Artikel vorzuschlagen, die mit diesen Aktivitäten in Verbindung stehen. Wiederum ähnlich wie ein Verkaufsberater im Geschäft kann das LLM eine Vielzahl von Eingaben abwägen, um zu einer sinnvollen und dennoch relevanten Auswahl an Empfehlungen zu gelangen.

Verbindung der Empfehlungen mit verfügbaren Produkten

Aber wie stellen wir den Bezug zwischen den allgemeinen Produktvorschlägen des LLMs und den spezifischen Artikeln in unserem Produktkatalog her? LLMs, die auf öffentlich zugänglichen Datensätzen trainiert wurden, verfügen in der Regel nicht über Kenntnisse der spezifischen Artikel im Sortiment eines Händlers. Das Training eines solchen Modells mit händlerspezifischen Informationen ist sowohl zeitaufwendig als auch kostenintensiv.

Die Lösung für dieses Problem ist relativ einfach. Mithilfe eines leichtgewichtigen Embedding-Modells – wie einem der vielen online frei verfügbaren Open-Source-Modelle – können wir die beschreibenden Informationen und andere Metadaten für jedes unserer Produkte in sogenannte Embeddings übersetzen. (Abbildung 2)

Abbildung 2. Ein stark abgekürztes Embedding für die Produktbeschreibung eines Paars Winterstiefel, erstellt mit dem Modell all-MiniLM-L6-v2.

Das Konzept eines Embeddings ist etwas technisch, aber kurz gesagt handelt es sich um eine numerische Darstellung von Text und wie dieser eine Reihe von erkannten Konzepten und Beziehungen innerhalb einer bestimmten Sprache abbildet. Zwei begrifflich ähnliche Artikel wie die allgemeinen Winterstiefel und die spezifischen Acme Troopers, die es dem Träger ermöglichen, bequem in wasserdichtem Canvas- und Leder-Obermaterial durch verschneite Straßen oder auf Bergpfaden zu stapfen, um dem schlimmsten Winter zu trotzen, weisen sehr ähnliche numerische Darstellungen auf, wenn sie durch ein entsprechendes LLM verarbeitet werden. Wenn wir die mathematische Differenz (Distanz) zwischen den mit den einzelnen Artikeln verknüpften Embeddings berechnen, stellen wir fest, dass sie nur geringfügig voneinander abweichen. Dies deutet darauf hin, dass diese Artikel eng miteinander verwandt sind.

Um dieses Konzept in die Praxis umzusetzen, müssen wir lediglich alle unsere spezifischen Produktbeschreibungen und Metadaten in Embeddings umwandeln und diese in einem durchsuchbaren Index speichern, der oft als Vector Store bezeichnet wird. Wenn das LLM allgemeine Produktempfehlungen ausspricht, übersetzen wir diese wiederum in eigene Embeddings und durchsuchen den Vector Store nach den am engsten verwandten Artikeln. So erhalten wir spezifische Produkte aus unserem Sortiment, die wir unseren Kunden präsentieren können. (Abbildung 3)

Abbildung 3. Konzeptueller Workflow für die Erstellung spezifischer Produktempfehlungen mithilfe eines LLMs

Zusammenführung der Lösung mit Databricks

Das hier vorgestellte Empfehlungsmuster kann eine hervorragende Ergänzung zu den von Unternehmen genutzten Empfehlungssystemen in Szenarien sein, in denen allgemeines Wissen über Produktassoziationen genutzt werden kann, um Kunden nützliche Vorschläge zu machen. Um die Lösung an den Start zu bringen, müssen Unternehmen in der Lage sein, sowohl auf ein Large Language Model als auch auf ein leichtgewichtiges Embedding-Modell zuzugreifen und die Funktionalität beider Modelle mit ihren eigenen, proprietären Informationen zusammenzuführen. Sobald dies geschehen ist, muss das Unternehmen in der Lage sein, all diese Ressourcen in eine Lösung zu verwandeln, die sich problemlos in alle kundenorientierten Schnittstellen integrieren und skalieren lässt, an denen diese Empfehlungen benötigt werden.

Über die Databricks Data Intelligence Platform können Unternehmen jede dieser Herausforderungen in einer einzigen, konsistenten und einheitlichen Umgebung bewältigen, die die Implementierung und Bereitstellung einfach und kostengünstig macht und gleichzeitig den Datenschutz gewährleistet. Mit der neuen AI Search-Funktion von Databricks können Entwickler auf einen integrierten Vektorspeicher mit zugehörigen Workflows zugreifen, die sicherstellen, dass die darin gespeicherten Embeddings stets aktuell sind. Über die neuen Foundation Model APIs können Entwickler mit minimalem Einrichtungsaufwand auf eine breite Palette von Open-Source- und proprietären Large Language Models zugreifen. Und dank der erweiterten Model Serving-Funktionen kann der End-to-End-Recommender-Workflow für die Bereitstellung hinter einem offenen und sicheren Endpunkt paketiert werden, was die Integration in eine Vielzahl moderner Anwendungen ermöglicht.

Aber verlassen Sie sich nicht nur auf unser Wort. Überzeugen Sie sich selbst. In unserem neuesten Solution Accelerator haben wir einen LLM-basierten Product Recommender entwickelt, der das hier gezeigte Muster implementiert und demonstriert, wie diese Funktionen zusammengeführt werden können, um vom Konzept zur operationalisierten Bereitstellung zu gelangen. Der gesamte Code ist frei verfügbar, und wir laden Sie ein, diese Lösung in Ihrer Umgebung zu erkunden – als Teil unseres Bestrebens, Unternehmen dabei zu unterstützen, das Potenzial ihrer Daten optimal zu nutzen.

Laden Sie die Notebooks herunter

(Dieser Blogbeitrag wurde mit KI-gestützten Tools übersetzt.) Originalbeitrag

Erhalten Sie die neuesten Beiträge in Ihrem Posteingang

Abonnieren Sie unseren Blog und erhalten Sie die neuesten Beiträge direkt in Ihren Posteingang.

Alle Blogs anzeigen

Nutzung eines Large Language Models für Empfehlungen

Verbindung der Empfehlungen mit verfügbaren Produkten

Zusammenführung der Lösung mit Databricks

Erhalten Sie die neuesten Beiträge in Ihrem Posteingang

Sign up