Ir al contenido principal

Spark gestionado

Prueba Databricks gratis

¿Qué es Managed Spark?

Un servicio gestionado de Spark le permite aprovechar las herramientas de datos de código abierto para el procesamiento por lotes, las consultas, la transmisión y el aprendizaje automático. Con este tipo de automatización podrás crear clústeres rápidamente bajo demanda, gestionarlos con facilidad y apagarlos cuando la tarea esté completa. Los usuarios también pueden dimensionar los clústeres según la carga de trabajo, los requisitos de rendimiento o en función de los recursos existentes. Además, tendrás acceso a clústeres Spark totalmente gestionados que podrás escalar dinámicamente hacia arriba y hacia abajo en solo unos segundos.  Y esto se puede hacer incluso mientras se procesan los trabajos. Además, los usuarios podrán desactivar los clústeres cuando ya no los necesiten, lo que les permitirá ahorrar dinero. Los proveedores de Spark gestionados crean clústeres temporales en lugar de hacer provisiones y mantener un clúster para todos tus trabajos. Normalmente, utilizan un grupo de máquinas con un nodo maestro y trabajadores. Las organizaciones pueden centrarse en extraer valor de sus datos en lugar de gastar sus recursos valiosos en operaciones. Spark gestionado

Ventajas de usar un servicio gestionado de Apache Spark:

Gestión automatizada de clústeres

El despliegue gestionado, el registro y la monitorización según las necesidades de tu trabajo te permiten centrarte en tus datos, en lugar de centrarte en el clúster. Tus clústeres serán estables, escalables y rápidos.

Clústeres redimensionables

La creación y configuración de clústeres Spark requiere muchos recursos, pero esto ya no es motivo de preocupación, ya que los clústeres se pueden crear y escalar rápidamente. Los nodos se apagan cuando ya no son necesarios. Todo se hace según sea necesario.

Herramientas para desarrolladores

Por lo general, se proporcionan varias formas de administrar un clúster.

Configuración automática o manual

El hardware y software en los clústeres se configuran automáticamente para ti y también permiten el control manual.

Simplicidad de la gestión

Ya no tendrás que preocuparte por gestionar el clúster o la asignación de recursos ni establecer prioridades mediante herramientas como el administrador de recursos YARN.

Rentabilidad

Los usuarios solo pagan por los recursos de cómputo que se consumen durante el proceso.

Recursos adicionales

Volver al glosario