Build Data Pipelines with Lakeflow Spark Declarative Pipelines - Spanish
Este curso presenta a los usuarios los conceptos y habilidades esenciales necesarios para crear canalizaciones de datos utilizando Lakeflow Spark Declarative Pipelines (SDP) en Databricks para la ingestión y el procesamiento incremental por lotes o en streaming a través de múltiples tablas de streaming y vistas materializadas. Diseñado para ingenieros de datos que se inician en Spark Declarative Pipelines, el curso ofrece una visión general completa de los componentes básicos, como el procesamiento incremental de datos, las tablas de streaming, las vistas materializadas y las vistas temporales, destacando sus propósitos específicos y sus diferencias.
Entre los temas tratados se incluyen:
- Desarrollo y depuración de canalizaciones ETL con el editor de múltiples archivos en Spark Declarative Pipelines utilizando SQL (con ejemplos de código Python).
- Cómo Spark Declarative Pipelines realiza un seguimiento de las dependencias de datos en una canalización a través del gráfico de la canalización.
- Configuración de los recursos informáticos de la canalización, los activos de datos, los modos de activación y otras opciones avanzadas.
A continuación, el curso presenta las expectativas de calidad de los datos en Spark Declarative Pipelines, guiando a los usuarios a través del proceso de integración de las expectativas en las canalizaciones para validar y garantizar la integridad de los datos. A continuación, los alumnos explorarán cómo poner en producción una canalización, incluidas las opciones de programación y la habilitación del registro de eventos de la canalización para supervisar su rendimiento y estado.
Por último, el curso trata cómo implementar la captura de datos modificados (CDC) utilizando la sintaxis AUTO CDC INTO dentro de Spark Declarative Pipelines para gestionar dimensiones que cambian lentamente (SCD tipo 1 y tipo 2), preparando a los usuarios para integrar CDC en sus propias canalizaciones.
⇾ Conocimientos básicos de la plataforma de inteligencia de datos Databricks, incluidos Databricks Workspaces, Apache Spark, Delta Lake, la arquitectura Medallion y Unity Catalog.
⇾ Experiencia en la ingesta de datos sin procesar en tablas Delta, incluido el uso de la función SQL read_files para cargar formatos como CSV, JSON, TXT y Parquet.
⇾ Competencia en la transformación de datos mediante SQL, incluido el uso de consultas de nivel intermedio y conocimientos básicos sobre uniones SQL.
Outline
Introducción a la ingeniería de datos en Databricks.
⇾ Ingeniería de datos en Databricks.
⇾ ¿Qué son las canalizaciones declarativas de Lakeflow Spark?
⇾ Configuración del curso y creación de una canalización.
⇾ Descripción general del proyecto del curso.
Fundamentos de las canalizaciones declarativas de Lakeflow Spark.
⇾ Descripción general de los tipos de conjuntos de datos.
⇾ Desarrollo simplificado de canalizaciones.
⇾ Configuración común de canalizaciones
⇾ Desarrollo de una canalización sencilla
⇾ Garantizar la calidad de los datos con expectativas
Creación de canalizaciones declarativas de Lakeflow Spark
⇾ Descripción general de las uniones de streaming
⇾ Implementación de una canalización en producción
⇾ Descripción general de la captura de datos modificados (CDC)
⇾ Captura de datos modificados con AUTO CDC INTO
⇾ Descripción general de funciones adicionales
Upcoming Public Classes
Date | Time | Language | Price |
|---|---|---|---|
Dec 15 | 08 AM - 12 PM (America/Denver) | Spanish | $750.00 |
Public Class Registration
If your company has purchased success credits or has a learning subscription, please fill out the Training Request form. Otherwise, you can register below.
Private Class Request
If your company is interested in private training, please submit a request.
Registration options
Databricks has a delivery method for wherever you are on your learning journey
Self-Paced
Custom-fit learning paths for data, analytics, and AI roles and career paths through on-demand videos
Register nowInstructor-Led
Public and private courses taught by expert instructors across half-day to two-day courses
Register nowBlended Learning
Self-paced and weekly instructor-led sessions for every style of learner to optimize course completion and knowledge retention. Go to Subscriptions Catalog tab to purchase
Purchase nowSkills@Scale
Comprehensive training offering for large scale customers that includes learning elements for every style of learning. Inquire with your account executive for details

