新しい製品の登録は、サプライヤーと小売業者の両方にとって複雑で時間のかかるプロセスです。小売業者はしばしば、不完全、誤った、または品質の低い製品情報に関する問題を報告しており、これがオンボーディングプロセスを妨げています。一方、サプライヤーは情報提供の重複や過剰な要求に圧倒されがちで、小売パートナーが要求する詳細な情報を提供するのに苦労しています。特にオンラインサイトでの製品数が急速に増加している中で、このプロセスを改善する必要性はますます高まっています。生成AIを活用することで、これを実現することができます。 生成型AIを用いて一般的な製品データの課題に取り組む この機会にどのようにアプローチするかは、製品オンボーディング中に直面する特定の課題によって異なります。最低限、製品名や説明などのさまざまな要素をチェックし、これらの詳細が一致しているか、もし一致していなければその理由を生成AIモデルに尋ねることができます。また、誤字、略語、他のセクションに含めるべき技術的な仕様などの一般的な問題を探し、モデルにこれらをクリーンアップしてもらうこともできます(図1)。 Gen AIを適用する前の説明 Gen AI適用後の説明 この58インチのガスグリルは、サテン仕上げのステンレススチール製で、4つのチューブバーナーと1つのサイドバーナーを備えています。60,000 BTUのLPガスで、耐久性のある鋳鉄製のグリルパネルを使用しています。調理面積は706平方インチで、後部ラックにはバンズなどを収納できます。サイズは64×21×37.5インチ、1年間の保証が付いています。 この58インチのガスグリルは、サテン仕上げのステンレススチール製で、4つのチューブバーナーとサイドバーナーを備え、60,000 BTUの出力を提供します。706平方インチの調理面積、収納用の後部ラック、耐久性のある鋳鉄製のグリルパネルが特徴です。 図1. Llama 3.1 8B Instructモデルにテキストをよりわかりやすくするよう依頼した後の、サンプル製品の前後の説明 さらに一歩進めて、モデルに製品に関連する画像を検査させ、アイテムの説明を抽出させ、その説明を使って他の要素と比較し、一貫性を再確認することもできます(図2)。 製品画像 生成された説明 画像の製品は、蓋、4つのバーナー、サイドシェルフ付きのステンレス製グリルです。グリルは、丸みを帯びた上部と平らな底部を持つ長方形の形状をしています。上部には4つのバーナーがあり、それぞれには炎の調整用のノブが付いています。サイドシェルフが追加の食品調理スペースや収納スペースを提供します。グリルは車輪付きのスタンドに支えられており、簡単に移動することができます。全体的なデザインは、アウトドアクッキングに適した高品質で耐久性のあるグリルを示しています。 図2. Llama 2.3 11B Visionモデルを使用して抽出した製品の画像と説明 検索をサポートするために、提供された説明と抽出した説明を使用して(そして関連する情報を)、モデルに依頼して検索結果を改善させることができます。 提案されたキーワード&フレーズ ステンレススチール | 58インチ | ガス | グリル | 四つのバーナー | サイドバーナー | 60,000-BTU | 706平方インチ | 鋳鉄 | グリルパネル | シルバー | サテン仕上げ | 調理スペース | リアラック | 収納 | アウトドアキッチン | パティオグリル | 大型グリル | ヘビーデューティグリル | 商業グレードのグリル | 高出力グリル 図3. Llama 3.1 8B Instructモデルを使用して図1と図2で説明されているグリルのために生成された検索用語。 また、モデルに画像から主要なプロパティを決定し、その情報を使用して、供給者が登録時に提供しなかった詳細を補完することもあります(図4)。 製品画像 抽出された色 シルバー 図 4. 製品の画像と、Llama 2.3 11B Visionモデルを使用して決定された主要な色 これらのモデルをこのように使用する際の主要な課題の一つは、出力が定義したフィールドの制約に必ずしも一致しない可能性があることです。例えば、家電製品の主な色として「Silver」を抽出した場合、色が「Grey」または「Metallic」というサポートされている選択肢に一致することを要求しているとき、制約に合わないことがあります。このような場合、モデルに許容される選択肢のリストを提供し、その中で最も一致するものを選ばせることができます。 さらに別のアプローチとして、さまざまなプロパティを使用してセマンティック検索を実施する方法があります。これは、テキストや画像を数値的なインデックスに変換し、概念的に似ているアイテムが近くに配置されるという生成的AI技術です。この技術を、事前に承認された高品質のアイテム詳細を使用して適用すれば、密接に関連するアイテムを特定し、それらから製品階層内の位置などの関連プロパティを取得することができます。 さまざまなアプローチを駆使することで、アプリケーションの構造をどう作成するかという選択肢もあります。初期の実装では、企業がバッチ処理を導入し、サプライヤーからの提出後にデータ入力を検証し修正することで、既存の製品オンボーディング手順を中断させないようにしています。プロンプトとモデルが信頼できる結果を提供できるように調整されると、新しいオンボーディングアプリケーションの開発に関心が高まり、生成的AIがデータ入力時に活用され、問題が発生すると同時に識別され、サプライヤーに代替案が提案されるようになります。 Databricksプラットフォームを使用してソリューションを構築する バッチ処理でもリアルタイムでも、これらの生成型AIワークフローの実装は、Databricks Data Intelligence Platformによって簡素化されます。Databricksは、さまざまなデータ形式をサポートしているため、構造化されたデータ入力と非構造化データ入力を簡単に処理することができます。そのオープンな性質から、プラットフォームは幅広い生成型AIモデルをサポートしており、その中でも最も人気のあるものの多くは、より簡単なアクセスのために事前に統合されています。ベクトルストアなどの周辺技術も事前に統合されており、実装を簡素化します。これは、セマンティック検索を可能にする特殊なデータベースです。 構築するアプリケーションに関して、Databricksはバッチ処理とリアルタイムのワークフローの両方をサポートしており、新しい情報が到着するときに裏でデータを処理することが可能です。対話型のユーザー向けアプリケーションが好ましい場合、プラットフォームの組み込みアプリケーション機能は、スケーラブルで統合されたソリューションの構築とデプロイメントを内部および外部の視聴者に対して簡素化します。 Databricks Data Intelligence Platformの幅広い機能は、製品オンボーディングソリューションを構築しようとする組織が、必要なパーツをどのように組み合わせるかに悩むことなく、実現したい詳細に集中できるようにします。 これを実際に見てみたいですか? 組織がDatabricks Data Intelligence Platform上で生成AIを使用して一般的な製品オンボーディングの問題を解決する方法を示すために、私たちは新しいソリューションアクセラレータを構築しました。Amazon Berkeley Objects (ABO) Datasetからの製品画像とメタデータを使用して、これらの技術がバッチ処理ワークフローでどのように使用され、多くの問題を特定し修正するかを示します。生成型AIモデルから一部の詳細を保留することで、行われている修正をスポットチェックし、選択したモデルが期待通りに動作していることを確認することができます。製品のオンボーディングの課題を解決するために生成型AIを使用することに興味がある組織に対して、私たちのコードを見直し、示された技術からインスピレーションを得て、彼らにとって機能する任意のコードを借りて、今日からDatabricksで製品オンボーディングソリューションの構築を始めることをお勧めします。 生成型AIを用いた製品オンボーディングのためのソリューションアクセラレータをダウンロードしてください。