La recherche chez Databricks

Quand la recherche rencontre le monde réel

Vous êtes en bonne compagnie

Apache Spark. Lakehouse. Mosaic MPT-7B. Tous ces systèmes ont été développés par les ingénieurs d'exception qui composent les équipes de Databricks.

Nos fondateurs et nos collaborateurs ont tous contribué de façon déterminante à l'avancée des systèmes distribués, de l'intelligence artificielle et de l'analytique des données.

Vous voulez avoir un impact ? Aujourd'hui, nous sommes à la recherche de docteurs tels que vous. Vous avez faim de vérité, les données vous passionnent et vous aimez travailler à partir de principes premiers ? Votre place est chez Databricks.

REJOIGNEZ-NOUS

Publications

Parcourez nos dernières publications en collaboration avec l'Université de Californie à Berkeley, Stanford et d'autres grandes institutions

Hide filters

Domaine de recherche

Trier: A-Z

Affichage de 1 - 12 sur 48 des résultats

IA et ML

Accélérer le cycle de vie de l'apprentissage automatique avec MLflow

Matei Zaharia, Andrew Chen, Aaron Davidson, Ali Ghodsi, Sue , Andrew Chen, Aaron Davidson, Ali Ghodsi, Sue Ann Hong, Andy Konwinski, Siddharth Murching, Tomas Nykodym, Paul Ogilvie, Mani Parkhe, Fen Xie, Corey Zumar, Databricks Inc.

Obtenir le PDF

Applications

ADAM : Formats génomiques et modèles de traitement pour cloud Monter en charge Computing

Matt Massie, Frank Nothaft, Christopher Hartl, Christos Kozanitis, André Schumacher, Anthony D. Joseph, David A. Patterson

Obtenir le PDF

Systèmes distribués

Améliorer les performances de MapReduce dans les environnements hétérogènes

Matei Zaharia, Andy Konwinski, Anthony D. Joseph, Randy Katz, Ion Stoica

Obtenir le PDF

Systèmes distribués

Apache Spark : Un moteur unifié pour le traitement des Big Data

Matei Zaharia, Reynold Xin, Patrick Wendell, Tathagata Das, Michael Armbrust, Ankur Dave, Xiangrui Meng, Josh Rosen, Shivaram Venkataraman, Michael J. Franklin, Ali Ghodsi, Joseph Gonzalez, Scott Shenker, Ion Stoica

Obtenir le PDF

Applications

app.build: A Production Framework for Scaling Agentic Prompt-to-App Generation with Environment Scaffolding

Evgenii Kniazev, Arseny Kravchenko, Igor Rekun, James Broadhead, Nikita Shamgunov, Pranav Sah, Pratik Nichite, Ivan Yamshchikov

Get the PDF

Systèmes distribués

ASAP : Extraction rapide et approximative de motifs de graphes à Monter en charge

Anand Padmanabha Iyer, Zaoxing Liu, Xin Jin,, Shivaram Venkataraman, Vladimir Braverman, Ion Stoica

Obtenir le PDF

Systèmes distribués

Au-dessus des clouds : Une vue de cloud Computing

Michael Armbrust, Armando Fox, Rean Griffith, Anthony D. Joseph, Randy Katz, Andy Konwinski, Gunho Lee, David Patterson, Ariel Rabkin, Ion Stoica, Matei Zaharia

Obtenir le PDF

IA et ML

BlackIce: A Containerized Red Teaming Toolkit for AI Security Testing

Caelin Kaplan, Alexander Warnecke, Neil Archibald

Get the PDF

Applications

C3 : Internet-Monter en charge Control Plane for Video Quality Optimization (Plan de contrôle pour l'optimisation de la qualité vidéo)

Aditya Ganjam, Junchen Jiang, Xi Liu, Vyas Sekar, Faisal Siddiqui, Ion Stoica, Jibin Zhan, Hui Zhang

Obtenir le PDF

IA et ML

Calculs matriciels et optimisation dans Apache Spark

Reza Bosagh Zadeh, Xiangrui Meng, Alexander Ulanov, Burak Yavuz, Li Pu, Shivaram Venkataraman, Evan Sparks, Aaron Staple, Matei Zaharia

Obtenir le PDF

Applications

CellIQ : Analyse en temps réel du réseau cellulaire à Monter en charge

Anand Padmanabha Iyer, Li Erran Li, Ion Stoica

Obtenir le PDF

Systèmes distribués

Chord : Un service de recherche pair-à-pair évolutif pour les applications Internet

D. Karger, H. Balakrishnan, I. Stoica, M.F. Kaashoek, R. Morris

Obtenir le PDF

Affichage de 1 - 12 sur 48 des résultats

Développez votre carrière au-delà du monde universitaire

Nous recherchons des doctorants doués pour le développement de systèmes évolutifs, fiables et performants

Databricks simplifie radicalement l'intégralité du cycle de vie des données sur notre plateforme lakehouse ouverte qui unifie les données, l'analytique et l'IA. Vous pourrez contribuer à des avancées révolutionnaires dans divers domaines, de l'ingestion de données à l'IA générative, en passant par le machine learning. Vous pourrez aussi prendre part aux projets open source les plus utilisés en analytique de données. Si ce travail vous passionne, nous avons sans doute une place pour vous au sein de l'une de nos équipes spécialisées en ingénierie.

Explore Databricks teams

Caching Team

Build the next-generation sharding, load balancing and caching solutions for Databricks to enable low latency, efficiency and scalability in our systems.

Photon Team

Build Databricks’ high-performance native (C++), vectorized SQL execution engine, which powers petabytes of query processing at Databricks per day.

Query Optimization Team

Build systems that optimize diverse workloads. Innovate with all variety of techniques — from traditional to ML — to outperform specialized data warehouses.

Lakestore Team

Build best-in-class storage systems with the usability and performance of data warehouses, and the flexibility and scalability of data lakes for all data workloads.

See open roles

Explore Databricks AI teams

Research Science

Drive ambitious research projects that:

Push the limits of existing technology
Explore new approaches that go beyond the state of the art

Survey publications and develop methods for efficient neural network training.

Engineering

Design and implement our ML infrastructure and generative AI platform. Establish development best practices. Help develop infrastructure and platforms that analyze ML training jobs, predict performance and cost, and run them across various hardware.

See open roles

L'équipe

Rencontrez des collaborateurs de Databricks, co-auteurs de nos récentes publications

La vie d'un ingénieur logiciel après un doctorat en informatique à Stanford

Shoumik Palkar nous parle de créativité au travail, de validation de la réussite personnelle et du réseau de collègues et de mentors chez Databricks.

Lire l'article