LLM 추론 성능 엔지니어링: 모범 사례April 10, 2024 작성자: Megha Agarwal, 아스판디르 쿠레시, Nikhil Sardana, Linden Li, Julian Quevedo, Daya Khudia in 모자이크 AI 연구 (번역: Youngkyong Ko) Original Blog Post 이 블로그에서 MosaicML 엔지니어링 팀은 프로덕션용으로 널리 사용되는 오픈 소스 대규모 언어 모델(LLM)을 활용하는 방법에 대한 모범...
새로운 파운데이션 모델 기능으로 생성형 AI 앱을 더 빠르게 구축하 기December 11, 2023 작성자: 아흐메드 빌랄, 아스판디르 쿠레시, 마가렛 첸, 지안웨이 시에, Sue Ann Hong, 블라디미르 콜로브스키, 민규 리, 앙킷 마투르 in 엔지니어링 블로그 지난 주 검색 증강 세대(RAG) 에 대한 발표에 이어, 모델 서빙에 대한 주요 업데이트를 발표하게 되어 기쁩니다. Databricks Model Serving은 이제 통합 인터페이스를...