Skip to main content

Investigación en Databricks y MosaicML

Donde la investigación se encuentra con el mundo real

Join our team

Estás en buena compañía

Apache Spark™ Lakehouse Mosaic MPT-7B. Estos sistemas fueron desarrollados por el tipo especial de ingenieros que encontrarás aquí, donde Databricks y MosaicML han unido fuerzas.

Nuestros líderes tienen una trayectoria comprobada en lograr avances en sistemas distribuidos, IA generativa, LLM y análisis de datos.

Ahora buscamos PhD que quieran generar un impacto. Si buscas la verdad, te basas en los datos y trabajas a partir de primeros principios, este es tu lugar.

Publicaciones

Explora nuestros artículos recientes en colaboración con UC Berkeley, Stanford y otras universidades líderes

Showing 1 - 12 of 46 results

Applications

A Cloud-Compatible Bioinformatics Pipeline for Ultrarapid Pathogen Identification From Next-Generation Sequencing of Clinical Samples

Samia N. Naccache, Scot Federman, Narayanan Veeeraraghavan, Matei Zaharia, Deanna Lee, Erik Samayoa, Jerome Bouquet, Alexander L. Greninger, Ka-Cheung Luk, Barryett Enge, Debra A. Wadford, Sharon L. Messenger, Gillian L. Genrich, Kristen Pellegrino, Gilda Grard, Eric Leroy, Bradley S. Schneider, Joseph N. Fair, Miguel A. Martínez, Pavel Isa, John A. Crump, Joseph L. DeRisi, Taylor Sittler, John Hackett, Jr., Steve Miller, Charles Y. Chiu

Get the PDF
Distributed Systems

Above the Clouds: A View of Cloud Computing

Michael Armbrust, Armando Fox, Rean Griffith, Anthony D. Joseph, Randy Katz, Andy Konwinski, Gunho Lee, David Patterson, Ariel Rabkin, Ion Stoica, Matei Zaharia

Get the PDF
AI and ML

Accelerating the Machine Learning Lifecycle With MLflow

Matei Zaharia, Andrew Chen, Aaron Davidson, Ali Ghodsi, Sue , Andrew Chen, Aaron Davidson, Ali Ghodsi, Sue Ann Hong, Andy Konwinski, Siddharth Murching, Tomas Nykodym, Paul Ogilvie, Mani Parkhe, Fen Xie, Corey Zumar, Databricks Inc.

Get the PDF
Applications

ADAM: Genomics Formats and Processing Patterns for Cloud Scale Computing

Matt Massie, Frank Nothaft, Christopher Hartl, Christos Kozanitis, André Schumacher, Anthony D. Joseph, David A. Patterson

Get the PDF
Distributed Systems

Apache Spark: A Unified Engine for Big Data Processing

Matei Zaharia, Reynold Xin, Patrick Wendell, Tathagata Das, Michael Armbrust, Ankur Dave, Xiangrui Meng, Josh Rosen, Shivaram Venkataraman, Michael J. Franklin, Ali Ghodsi, Joseph Gonzalez, Scott Shenker, Ion Stoica

Get the PDF
Distributed Systems

ASAP: Fast, Approximate Graph Pattern Mining at Scale

Anand Padmanabha Iyer, Zaoxing Liu, Xin Jin,, Shivaram Venkataraman, Vladimir Braverman, Ion Stoica

Get the PDF
Applications

C3: Internet-Scale Control Plane for Video Quality Optimization

Aditya Ganjam, Junchen Jiang, Xi Liu, Vyas Sekar, Faisal Siddiqui, Ion Stoica, Jibin Zhan, Hui Zhang

Get the PDF
Applications

CellIQ : Real-Time Cellular Network Analytics at Scale

Anand Padmanabha Iyer, Li Erran Li, Ion Stoica

Get the PDF
Distributed Systems

Chord: A Scalable Peer-to-Peer Lookup Service for Internet Applications

D. Karger, H. Balakrishnan, I. Stoica, M.F. Kaashoek, R. Morris

Get the PDF
AI and ML

Clipper: A Low-Latency Online Prediction Serving System

Daniel Crankshaw, Xin Wang, Giulio Zhou, Michael J. Franklin, Joseph E. Gonzalez, Ion Stoica

Get the PDF
AI and ML

Compute-Efficient Deep Learning: Algorithmic Trends and Opportunities

Brian R. Bartoldson, Bhavya Kailkhura, Davis Blalock

Get the PDF
AI and ML

DAWNBench: An End-to-End Deep Learning Benchmark and Competition

Cody Coleman, Deepak Narayanan, Daniel Kang, Tian Zhao, Jian Zhang, Luigi Nardi, Peter Bailis, Kunle Olukotun, Chris Ré, Matei Zaharia

Get the PDF

Showing 1 - 12 of 46 results

Build your career

Desarrolla tu carrera más allá de la academia

Se buscan PhDs con experiencia en el desarrollo de sistemas escalables, confiables y de alto rendimiento

En Databricks y MosaicML, reunimos a expertos en análisis de datos, aprendizaje profundo, sistemas distribuidos e infraestructura de IA. Juntos, estamos simplificando radicalmente todo el ciclo de vida de los datos en nuestra arquitectura de lakehouse abierta que unifica datos, análisis e IA.

Si este trabajo te entusiasma, podríamos tener un lugar para ti en uno de nuestros equipos especializados de ingeniería e investigación.

Explora los equipos de Databricks

Equipo de Caching

Desarrolla las soluciones de última generación de sharding, balanceo de carga y almacenamiento en caché para Databricks para permitir una baja latencia, eficiencia y escalabilidad en nuestros sistemas.

Equipo Photon

Construir el motor de ejecución de SQL nativo (C++), vectorizado y de alto rendimiento de Databricks, que impulsa el procesamiento de petabytes de consultas en Databricks cada día.

Equipo de Optimización de Consultas

Desarrolla sistemas que optimicen diversas cargas de trabajo. Innova con una variedad de técnicas, desde las tradicionales hasta el ML, para superar a los almacenes de datos especializados.

Equipo de Lakestore

Desarrolla los mejores sistemas de almacenamiento de su clase con la usabilidad y el rendimiento de los almacenes de datos, y la flexibilidad y escalabilidad de los lagos de datos para todas las cargas de trabajo de datos.

Explora los equipos de MosaicML

Investigación Científica

Impulsa proyectos de investigación ambiciosos que:

  • Supera los límites de la tecnología existente
  • Explora nuevos enfoques que superen el estado del arte.

Analiza publicaciones y desarrolla métodos para el entrenamiento eficiente de redes neuronales.

Ingeniería

Diseña e implementa nuestra infraestructura de ML y plataforma de AI generativa. Establecer las mejores prácticas de desarrollo. Ayuda a desarrollar infraestructura y plataformas que analizan los trabajos de entrenamiento de ML, predicen el rendimiento y el costo, y los ejecutan en diverso hardware.

Nuestros investigadores e ingenieros con publicaciones

Conoce a los empleados que están detrás de nuestras publicaciones recientes


La vida como ingeniero de software después de un PhD en Sistemas Informáticos en Stanford

Conoce las opiniones de Shoumik Palkar sobre la creatividad en el trabajo, la validación del éxito personal y la red de compañeros y mentores en Databricks.

Leer artículo