Databricks Runtime es el conjunto de artefactos de software que se ejecutan en los clústeres de máquinas administrados por Databricks. Incluye Spark, pero también agrega varios componentes y actualizaciones que mejoran sustancialmente la usabilidad, el rendimiento y la seguridad del análisis de big data. Las principales diferencias son:
- Mejor rendimiento con DBIO: El módulo de I/O de Databricks, o DBIO, aprovecha el stack integrado verticalmente para mejorar significativamente el rendimiento de Spark en la nube.
- Seguridad más sólida con DBES: El módulo Databricks Enterprise Security, o DBES, agrega características como el cifrado de datos en reposo y en movimiento, el control de acceso detallado a los datos y la auditoría para satisfacer el cumplimiento estándar (p. ej., HIPAA, SOC2) y los requisitos de seguridad más estrictos que se esperarían de las grandes empresas.
- Complejidad operativa significativamente menor: Con características como el escalado automático de los recursos informáticos y el almacenamiento local, ponemos Spark en "piloto automático" y reducimos notablemente la complejidad operativa y el costo de administración.
- Lanzamientos rápidos y acceso anticipado a nuevas características: En comparación con las versiones de código abierto ascendentes, la oferta de SaaS de Databricks facilita ciclos de lanzamiento más rápidos, lo que ofrece a nuestros clientes las últimas características y correcciones de errores que aún no están disponibles en las versiones de código abierto.

DATABRICKS RUNTIME SUPERA A OTROS MOTORES DE CÓMPUTO
Recursos adicionales