メインコンテンツへジャンプ
リンデン・リー

リンデン・リー

リンデン・リー's posts

Abstract representation of LLM Inference token generation pipeline

Mosaic Research

March 20, 2024/1分未満

高速、安全、高信頼性:エンタープライズグレードのLLM推論

mixtral_social

プラットフォーム

December 21, 2023/1分未満

Mixtral 8x7B と Databricks モデルサーヴィングのご紹介

Integrating NVIDIA TensorRT-LLM with the Databricks Inference Stack

Mosaic Research

December 21, 2023/1分未満

NVIDIA TensorRT-LLMとDatabricks推論スタックを統合する

LLM Inference Performance Engineering: Best Practices

Mosaic Research

October 12, 2023/2分で読めます

LLM推論パフォーマンスエンジニアリング:ベストプラクティス