Ir al contenido principal
Matei Zaharia

Matei Zaharia

Follow Matei Zaharia

Matei is the CTO and co-founder of Databricks and an Associate Professor of Computer Science at UC Berkeley. He started the Apache Spark project during his Ph.D. program at UC Berkeley in 2009 and has worked on other widely used data and AI software, including MLflow, Delta Lake, and DBRX. His most recent research is about combining large language models (LLMs) with external data sources, such as search systems, and improving their efficiency and result quality. Matei’s research was recognized through the 2014 ACM Doctoral Dissertation Award and the U.S. Presidential Early Career Award for Scientists and Engineers (PECASE).

Matei Zaharia's posts

Spark Declarative Pipelines: Why Data Engineering Needs to Become End-to-End Declarative

Anuncios

23 de febrero de 2026/7 min de lectura

Pipelines declarativos de Spark: por qué la ingeniería de datos necesita volverse declarativa de extremo a extremo

Data Intelligence Platforms

Anuncios

15 de noviembre de 2023/9 min de lectura

Plataforma de Inteligencia de Datos

Predictive Optimization: Faster Queries, Cheaper Storage, No Sweat

Soluciones

26 de octubre de 2023/5 min de lectura

Presentamos la Optimización predictiva: consultas más rápidas, almacenamiento más económico y sin esfuerzo

Almacenamiento de datos

28 de junio de 2023/6 min de lectura

Presentamos las capacidades de Lakehouse Federation en Unity Catalog

Latency goes subsecond in Apache Spark Structured Streaming

Transmisión de datos

15 de mayo de 2023/14 min de lectura

La latencia baja a menos de un segundo en Apache Spark Structured Streaming

Hello Dolly: Democratizing the magic of ChatGPT with open models

Noticias

24 de marzo de 2023/11 min de lectura

Hello Dolly: democratizando la magia de ChatGPT con modelos abiertos

Announcing General Availability of Delta Sharing

Anuncios

26 de agosto de 2022/7 min de lectura

Anuncio de la disponibilidad general de Delta Sharing

db-233-clean-rooom-og

Anuncios

28 de junio de 2022/8 min de lectura

Presentación de salas limpias de datos para el lakehouse

acm-sigmod-blog-og-new

Noticias

15 de junio de 2022/6 min de lectura

Apache Spark y Photon reciben premios SIGMOD

Data Intelligence Platforms

Producto

14 de enero de 2022/8 min de lectura

Los tres principales casos de uso de intercambio de datos con Delta Sharing

Delta-Sharing-Social

Anuncios

26 de mayo de 2021/8 min de lectura

Presentamos Delta Sharing: un protocolo abierto para compartir datos de forma segura

spark-og2

Anuncios

18 de junio de 2020/11 min de lectura

Presentamos Apache Spark 3.0

Mostrando 1 - 12 de 13 resultados