Revenir au contenu principal
Reynold Xin

Reynold Xin

Follow Reynold Xin

Reynold oversees technical contributions to Apache® Spark™ at Databricks, initiating efforts such as DataFrames and Project Tungsten. To demonstrate Spark’s scalability and performance, he lead the efforts in the 2014 Daytona GraySort contest and set the 2014 world record, beating the previous record held by Hadoop with 30X higher per-node efficiency. Prior to Databricks, he was a PhD student at the UC Berkeley AMPLab, where he focused on scalable data processing. He wrote the highest cited papers in SIGMOD 2011, 2013, and 2015, and won Best Demo Award at VLDB 2011 and SIGMOD 2012.

Reynold Xin's posts

Databricks Lakebase is generally available

Produit

3 février 2026/7 min de lecture

La place de marché de Databricks est désormais configurée pour un usage général.

Lakebase Holiday Upgrade includes branching, autoscaling, and a host of other features

Produit

16 décembre 2025/8 min de lecture

Mise à jour de Lakebase pour les fêtes

Databricks Free Edition Hackathon

Plateforme

16 décembre 2025/4 min de lecture

Annonce des gagnants du premier Hackathon Databricks Free Edition

Data Intelligence Platforms

Annonces

15 novembre 2023/9 min de lecture

Data Intelligence Platform

Predictive Optimization: Faster Queries, Cheaper Storage, No Sweat

Solutions

26 octobre 2023/5 min de lecture

Présentation de l'optimisation prédictive : des requêtes plus rapides, un stockage moins cher, sans effort

acm-sigmod-blog-og-new

Actualités

15 juin 2022/6 min de lecture

Apache Spark et Photon reçoivent des prix SIGMOD

tpc-benchmark-ds-blog-og

Entreposage des données

2 novembre 2021/13 min de lecture

Databricks établit un record officiel de performance pour l'entreposage des données

The initial release of Databricks SQL offered significant performance benefits -- up to 6x price/performance -- compared to traditional cloud data warehouses as per the TPC-DS 30 TB scale benchmark

Produit

8 septembre 2021/7 min de lecture

Nouvelles améliorations des performances de Databricks SQL

spark-og2

Annonces

18 juin 2020/10 min de lecture

Présentation d'Apache Spark 3.0

Plateforme

30 janvier 2020/9 min de lecture

Qu'est-ce qu'un lakehouse ?