Ir al contenido principal

Data Analysis with Databricks - Spanish

Este curso ofrece una introducción completa a Databricks SQL. Los alumnos aprenderán a importar datos, escribir consultas, crear visualizaciones y paneles de control, y configurar alertas. Este curso te preparará para presentarte al examen de Certificación de Analista de Datos Asociado de Databricks.


Este curso consta de dos módulos de cuatro horas de duración.

SQL Analytics on Databricks

En este curso, aprenderá cómo usar Databricks de manera efectiva para el análisis de datos, con un enfoque específico en Databricks SQL. Como analista de datos Databricks, sus responsabilidades incluirán encontrar datos relevantes, analizarlo para aplicaciones potenciales y transformarlo en formatos que proporcionen valiosas perspectivas comerciales. 

También comprenderá su papel en la gestión de objetos de datos y cómo manipularlos dentro de la Plataforma de Inteligencia de Datos de Databricks, utilizando herramientas como Notebooks, SQL Editor y Databricks SQL. 

Además, aprenderá sobre la importancia de Unity Catalog en la gestión de activos de datos y la plataforma en general. Finalmente, el curso proporcionará una descripción general de cómo Databricks facilita la optimización del rendimiento y le enseñará cómo acceder a Query Insights para comprender los procesos que ocurren detrás de escena al ejecutar análisis de SQL en Databricks.


AI/BI for Data Analysts

Este curso enseña a los analistas de datos a diseñar, crear, publicar y operar AI/BI Dashboards en Databricks. Los AI/BI Dashboards combinan datos gobernados por Unity Catalog con visualizaciones interactivas, filtros e integración con Genie, para que los usuarios de negocio puedan explorar respuestas sin escribir código.


El curso sigue una única implementación de extremo a extremo. Comienzas con tablas de origen en Unity Catalog y terminas con un dashboard de varias páginas publicado y supervisado. En el camino, aprenderás cómo los dashboards encajan en la familia de productos AI/BI de Databricks y dónde intervienen Genie, los conjuntos de datos, las visualizaciones y los filtros dentro del flujo de trabajo.


Nota: Databricks Academy está pasando a un formato basado en cuadernos para las sesiones presenciales en el entorno de Databricks, dejando de utilizar presentaciones de diapositivas para las clases. Puedes acceder a los cuadernos de las clases en el entorno de laboratorio de Vocareum.


Languages Available: English | 日本語 | Português BR | 한국어

Skill Level
Associate
Duration
8h
Prerequisites

El contenido se ha elaborado para participantes que cuenten con las siguientes habilidades, conocimientos y capacidades: 


• Conocimientos prácticos sobre el uso de SQL para el análisis de datos. 

• Estar familiarizado con el proceso de creación, almacenamiento y gestión de datos.

• Conocimientos básicos de análisis estadístico.

• Comprender la estructura y las características definitorias de formatos de datos específicos, como CSV, JSON, TXT y Parquet.

• Estar familiarizado con la interfaz de usuario de la plataforma Databricks Data Intelligence.

• Familiaridad básica con el workspace de Databricks. Sabes navegar por la interfaz del workspace, abrir y usar notebooks, y asociar un SQL warehouse u otro recurso de cómputo.

• Familiaridad básica con Unity Catalog. Comprendes el espacio de nombres de tres niveles (catálogo, esquema, tabla) y puedes encontrar una tabla en el explorador de catálogos.

• Conocimiento práctico de SQL, incluidos los joins. Puedes leer y escribir instrucciones SELECT con WHERE, GROUP BY y agregaciones, y unir dos tablas mediante una clave común.

Outline

Análisis SQL en Databricks


Descubrimiento de datos

• Uso de Unity Catalog como herramienta de descubrimiento de datos

• Comprensión de la propiedad de los objetos de datos

• Uso de Unity Catalog para localizar e inspeccionar conjuntos de datos


Importación de datos

• Ingesta de datos en Databricks

• Carga de datos en Databricks mediante la interfaz de usuario

• Exploración programática e ingesta de datos en Unity Catalog

• Importación de datos a Databricks


Ejecución de SQL

• Databricks SQL y almacenes de datos de Databricks SQL

• El editor SQL unificado

• Manipular y transformar datos con Databricks SQL

• Crear vistas con Databricks SQL

• Manipular y analizar una tabla


Análisis de consultas

• Databricks Photon y optimización en Databricks

• Información sobre consultas

• Prácticas recomendadas para el análisis SQL


IA/BI para analistas de datos


• Demostración - OBLIGATORIA - Configuración y exploración de datos

• Introducción a los paneles de control de AIBI

• Demostración: Diseño de conjuntos de datos para paneles de control

• Demostración: Visualizaciones de la página 1: indicadores clave de rendimiento (KPI) y tendencias anuales

• Demostración: Visualizaciones de la página 1: desglose por provincias

• Laboratorio: Práctica - Creación de un panel de control: datos de taxis de Nueva York

• Demostración: Código Genie para paneles de control: creación de la página 2

• Demostración: cómo añadir filtros a tu panel de control

• Demostración: cómo publicar y compartir tu panel de control

• Demostración: cómo ejecutar tu panel de control en producción

• resumen y próximos pasos

• Laboratorio: cómo ampliar y compartir tu panel de control de taxis

• Bonus: Apéndice A - Extra: descripción general del almacenamiento en caché de paneles de control

Inscripción a clases públicas

Si su empresa ha adquirido créditos de servicio (Success Credits) o cuenta con una suscripción de aprendizaje, por favor complete el formulario de Solicitud de Capacitación. De lo contrario, puede registrarse a continuación.

Solicitud de clase privada

Si su empresa está interesada en capacitación privada, envíe una solicitud.

Ver todas nuestras opciones de inscripción

Registration options

Databricks ofrece modalidades de aprendizaje para acompañarlo en todo su recorrido.

Runtime

A tu propio ritmo

Rutas de aprendizaje personalizadas para roles y trayectorias profesionales de datos, analítica e IA, con videos a pedido.

Regístrese ahora

Instructors

Instruido por expertos

Cursos públicos y privados impartidos por instructores expertos en sesiones de medio día o dos días.

Regístrese ahora

Learning

Aprendizaje combinado (Blended Learning)

Sesiones semanales dirigidas por un instructor, junto con opciones a tu propio ritmo, para todos los estilos de aprendizaje, optimizando la finalización y la retención del conocimiento. Visite la pestaña “Catálogo de suscripciones” para comprar.

Comprar ahora

Scale

Skills@Scale

Oferta de capacitación integral para clientes a gran escala que incluye elementos para todos los estilos de aprendizaje. Consulte con su ejecutivo de cuenta para obtener más detalles.

Próximas clases públicas

Data Engineer

Data Ingestion with Lakeflow Connect - Spanish

Este curso proporciona una introducción completa a Lakeflow Connect, una solución escalable y simplificada para ingerir datos en Databricks desde una amplia gama de fuentes. Comenzará explorando los diferentes tipos de conectores de Lakeflow Connect (estándar y administrados) y aprenderá varias técnicas de ingesta de datos, incluida la ingesta Batch, Batch incremental y transmisión. También revisará los beneficios clave de usar tablas Delta y la arquitectura Medallion.

A continuación, desarrollará habilidades prácticas para ingerir datos del almacenamiento de objetos en la nube mediante los conectores estándar de Lakeflow Connect. Esto incluye trabajar con métodos como CREATE TABLE AS SELECT (CTAS), COPY INTO y Auto Loader, con énfasis en los beneficios y consideraciones de cada enfoque. También aprenderá a anexar columnas de metadatos a las tablas de nivel bronce durante la ingesta en el Databricks Data Intelligence Platform. A continuación, el curso cubre cómo controlar los registros que no coinciden con el esquema de la tabla mediante la columna de datos rescatados, junto con estrategias para administrar y analizar estos datos. También explorará técnicas para ingerir y aplanar datos JSON semiestructurados.

A continuación, explorará cómo realizar la ingesta de datos de nivel empresarial mediante los conectores administrados de Lakeflow Connect para incorporar datos de bases de datos y aplicaciones de software como servicio (SaaS). El curso también presenta Partner Connect como una opción para integrar herramientas de socios en sus flujos de trabajo de ingesta.

Finalmente, el curso concluye con estrategias de ingesta alternativas, que incluyen operaciones MERGE INTO y aprovechar el Databricks Marketplace, equipándolo con una base sólida para respaldar los casos de uso de ingeniería de datos modernos.

Paid
4h
Lab
instructor-led
Associate
Data Engineer

Build Data Pipelines with Lakeflow Spark Declarative Pipelines - Spanish

Este curso presenta a los usuarios los conceptos y habilidades esenciales necesarios para crear canalizaciones de datos utilizando Lakeflow Spark Declarative Pipelines (SDP) en Databricks para la ingestión y el procesamiento incremental por lotes o en streaming a través de múltiples tablas de streaming y vistas materializadas. Diseñado para ingenieros de datos que se inician en Spark Declarative Pipelines, el curso ofrece una visión general completa de los componentes básicos, como el procesamiento incremental de datos, las tablas de streaming, las vistas materializadas y las vistas temporales, destacando sus propósitos específicos y sus diferencias.

Entre los temas tratados se incluyen:

- Desarrollo y depuración de canalizaciones ETL con el editor de múltiples archivos en Spark Declarative Pipelines utilizando SQL (con ejemplos de código Python).

- Cómo Spark Declarative Pipelines realiza un seguimiento de las dependencias de datos en una canalización a través del gráfico de la canalización.

- Configuración de los recursos informáticos de la canalización, los activos de datos, los modos de activación y otras opciones avanzadas.

A continuación, el curso presenta las expectativas de calidad de los datos en Spark Declarative Pipelines, guiando a los usuarios a través del proceso de integración de las expectativas en las canalizaciones para validar y garantizar la integridad de los datos. A continuación, los alumnos explorarán cómo poner en producción una canalización, incluidas las opciones de programación y la habilitación del registro de eventos de la canalización para supervisar su rendimiento y estado.

Por último, el curso trata cómo implementar la captura de datos modificados (CDC) utilizando la sintaxis AUTO CDC INTO dentro de Spark Declarative Pipelines para gestionar dimensiones que cambian lentamente (SCD tipo 1 y tipo 2), preparando a los usuarios para integrar CDC en sus propias canalizaciones.

Paid
4h
Lab
instructor-led
Associate

¿Preguntas?

Si tiene alguna pregunta, consulte nuestra página de Preguntas frecuentes (FAQ).