メインコンテンツへジャンプ
Alkis Polyzotis

Alkis Polyzotis

Neoklis (Alkis) Polyzotis is a technical lead in the machine learning platform team at Databricks. Before Databricks, he worked at Google building data/model evaluation tools for TensorFlow Extended and a catalogue for Google's internal data lake. He also held a faculty position at UC Santa Cruz. He holds a PhD in Computer Sciences from the University of Wisconsin at Madison, and an engineering diploma from the National Technical University of Athens, in Greece.

Alkis Polyzotis's posts

Building Custom LLM Judges for AI Agent Accuracy

お知らせ

2025年11月4日/2分で読めます

AIエージェントの正確性を評価する“カスタムLLMジャッジ”の作り方

MLflow 3.0

お知らせ

2025年6月21日/3分で読めます

MLflow 3.0:生成AIを“安心して”構築・評価・本番運用できる、オールインワンプラットフォーム

AI Agents: Evaluation

お知らせ

2025年3月12日/6分で読めます

強化された エージェント評価機能 が登場!

Streamline AI Agent Evaluation with New Synthetic Data Capabilities

AI

2024年12月9日/2分で読めます

AIエージェント評価が進化!新たな合成データ機能で効率アップ

Databricks announces significant improvements to the built-in LLM judges in Agent Evaluation

データサイエンス・ML

2024年9月5日/1分未満

Databricksがエージェント評価の組み込みLLM判断に大幅な改善を発表

social card

データサイエンス・ML

2024年7月2日/3分で読めます

Mosaic AI Agent Framework および Agent Evaluation の発表

lakehouse-monitoring-social-card

データエンジニアリング

2023年12月12日/1分未満

レイクハウス・モニタリング: データとAIの品質監視のための統合ソリューション

image

データサイエンス・ML

2023年10月31日/2分で読めます

MLflow 2.8「LLM-as-a-judge」メトリクス、およびRAGアプリケーションのLLM評価におけるベストプラクティス(パート2)を発表

Announcing Inference Tables: Simplified Monitoring and Diagnostics for AI models

製品

2023年10月18日/1分未満

「推論テーブル」の発表: AIモデルのモニタリングと診断を簡素化

Best Practices for LLM Evaluation of RAG Applications

機械学習

2023年9月12日/3分で読めます

RAG アプリケーションにおける LLM 評価のベストプラクティス