Ir al contenido principal

¿Qué es Spark administrado?

Servicio Spark automatizado que permite la creación rápida, el escalamiento dinámico y la gestión de clústeres a pedido para que los usuarios puedan centrarse en el análisis de datos en lugar de en las operaciones.

4 Personas Analytics AIBI

Summary

  • Ofrece gestión automatizada de clústeres con implementación, registro y monitorización configurada para las necesidades de cada trabajo, manteniendo clústeres estables, escalables y rápidos mientras los usuarios se concentran en los datos en lugar de la infraestructura.
  • Permite crear y escalar clústeres redimensionables rápidamente bajo demanda, con nodos que se desactivan cuando no se utilizan, eliminando el aprovisionamiento y la configuración que consumen muchos recursos mediante el aprovisionamiento temporal de clústeres según sea necesario.
  • Ofrece configuración automática o manual de hardware y software, simplificando la gestión sin preocuparse por la asignación de recursos de YARN, con modelos de precios rentables de pago solo por el cómputo consumido.

¿Qué es Managed Spark?

Un servicio gestionado de Spark le permite aprovechar las herramientas de datos de código abierto para el procesamiento por lotes, las consultas, la transmisión y el aprendizaje automático. Con este tipo de automatización podrás crear clústeres rápidamente bajo demanda, gestionarlos con facilidad y apagarlos cuando la tarea esté completa. Los usuarios también pueden dimensionar los clústeres según la carga de trabajo, los requisitos de rendimiento o en función de los recursos existentes. Además, tendrás acceso a clústeres Spark totalmente gestionados que podrás escalar dinámicamente hacia arriba y hacia abajo en solo unos segundos.  Y esto se puede hacer incluso mientras se procesan los trabajos. Además, los usuarios podrán desactivar los clústeres cuando ya no los necesiten, lo que les permitirá ahorrar dinero. Los proveedores de Spark gestionados crean clústeres temporales en lugar de hacer provisiones y mantener un clúster para todos tus trabajos. Normalmente, utilizan un grupo de máquinas con un nodo maestro y trabajadores. Las organizaciones pueden centrarse en extraer valor de sus datos en lugar de gastar sus recursos valiosos en operaciones. Spark gestionado

LÍDER 5X

Gartner®: Databricks, líder en bases de datos en la nube

Ventajas de usar un servicio gestionado de Apache Spark:

Gestión automatizada de clústeres

El despliegue gestionado, el registro y la monitorización según las necesidades de tu trabajo te permiten centrarte en tus datos, en lugar de centrarte en el clúster. Tus clústeres serán estables, escalables y rápidos.

Clústeres redimensionables

La creación y configuración de clústeres Spark requiere muchos recursos, pero esto ya no es motivo de preocupación, ya que los clústeres se pueden crear y escalar rápidamente. Los nodos se apagan cuando ya no son necesarios. Todo se hace según sea necesario.

Herramientas para desarrolladores

Por lo general, se proporcionan varias formas de administrar un clúster.

Configuración automática o manual

El hardware y software en los clústeres se configuran automáticamente para ti y también permiten el control manual.

Simplicidad de la gestión

Ya no tendrás que preocuparte por gestionar el clúster o la asignación de recursos ni establecer prioridades mediante herramientas como el administrador de recursos YARN.

Rentabilidad

Los usuarios solo pagan por los recursos de cómputo que se consumen durante el proceso.

Recursos adicionales

No te pierdas ninguna publicación de Databricks.

Suscríbete a nuestro blog y recibe las últimas publicaciones en tu bandeja de entrada.

¿Qué sigue?

4 Personas Analytics AIBI 3a

Fundamentos de Data + AI

17 min de lectura

O que é Narrativa de Dados?

4 Personas Analytics AIBI 2a

Fundamentos de Data + AI

16 min de lectura

O que é Extrair, Carregar e Transformar (ELT)?