APACHE SPARK™ 선언적 파이프라인

신뢰할 수 있는 데이터 파이프라인을 간편하게 실행

자동화된 안정성과 기본 내장 데이터 품질로 batch및 스트리밍 ETL을 간소화합니다.

TOP 팀들은 지능형 데이터 파이프라인으로 성공합니다

SQL을 사용하여 ETL 파이프라인 구축 방법 알아보기

SQL을 사용하여 배치 및 실시간 ETL 파이프라인을 구축하세요. 데이터 엔지니어링 지원이 필요하지 않습니다.

지금 읽기

장점

데이터 파이프라인의 모범 사례, 코딩화

필요한 데이터 변환을 간단히 선언하십시오 - Spark 선언형 파이프라인이 나머지를 처리합니다.

효율적인 수집

프로덕션에 바로 사용할 수 있는 ETL 파이프라인을 구축하는 첫 단계는 수집입니다. Spark Declarative Pipelines는 데이터 엔지니어, Python 개발자, 데이터 과학자 및 SQL 분석가를 위한 효율적인 데이터 수집을 가능하게 합니다. Databricks에서 Apache Spark™이 지원하는 어떤 소스든지 데이터를 로드하십시오, 배치, 스트리밍 또는 CDC이든 상관없습니다.

지능형 변환

몇 줄의 코드만으로 Spark Declarative Pipelines는 배치 또는 스트리밍 데이터 파이프라인을 구축하고 실행하는 가장 효율적인 방법을 결정하며, 비용이나 성능을 자동으로 최적화하면서 복잡성을 최소화합니다.

자동화된 작업

Spark 선언형 파이프라인은 기본적으로 최고의 사례를 코딩화하여 ETL 개발을 단순화하고 본질적인 운영 복잡성을 자동으로 제거합니다. Spark 선언형 파이프라인을 사용하면 엔지니어들은 파이프라인 인프라의 운영 및 유지보다는 고품질의 데이터 제공에 집중할 수 있습니다.

기능

데이터 파이프라이닝을 단순화하기 위해 구축됨

데이터 파이프라인을 구축하고 운영하는 것은 어려울 수 있지만, 그렇게 되지 않아도 됩니다. Spark 선언형 파이프라인은 강력한 단순성을 위해 만들어졌으므로, 몇 줄의 코드만으로 강력한 ETL을 수행할 수 있습니다.

Spark의 통합 API를 활용하여 배치 및 스트림 처리 사이를 쉽게 전환할 수 있습니다.

자세히

Spark의 통합 API를 활용하여 배치 및 스트림 처리 사이를 쉽게 전환할 수 있습니다.

자세히

Spark 선언적 파이프라인은 스트리밍 테이블과 물리화 된 뷰를 포함한 전체 증분 데이터 파이프라인을 선언함으로써 파이프라인 성능을 최적화하는 것을 쉽게 만듭니다.

자세히

Spark 선언형 파이프라인은 광범위한 소스와 싱크를 지원합니다. 어떤 소스에서든 데이터를 로드하십시오 - 클라우드 저장소, 메시지 버스, 변경 데이터 피드, 데이터베이스, 기업 앱을 포함하여.

자세히

기대치는 테이블에 도착하는 데이터가 데이터 품질 요구사항을 충족하도록 보장하고, 각 파이프라인 업데이트에 대한 데이터 품질에 대한 통찰력을 제공합니다.

자세히

컨텍스트 전환 없이 IDE에서 데이터 엔지니어링을 위한 파이프라인을 개발하세요. 한 UI에서 DAG, 데이터 미리보기 및 실행 통찰을 확인하세요. 자동완성, 인라인 오류 및 진단을 사용하여 쉽게 코드를 개발합니다.

자세히

기타 기능

통합 거버넌스 및 스토리지

Unity Catalog와 오픈 테이블 형식의 기초적인 레이크하우스 표준에 기반을 두고 있습니다.

자세히

Serverless compute

데이터 수집에 대해 최대 5배 더 나은 가격/성능과 복잡한 변환에 대해 98%의 비용 절감을 제공합니다.

자세히

작업 오케스트레이션

별도의 Apache Spark™ 작업 시리즈를 수동으로 정의하는 대신, 변환을 정의하고 Spark 선언형 파이프라인이 올바른 순서로 실행되도록 합니다.

자세히

오류 처리 및 실패 복구

데이터 파이프라인 실행 중에 발생하는 오류에서 원활하게 복구합니다.

자세히

CI/CD 및 버전 관리

개발, 테스트 및 프로덕션 환경에서 파이프라인을 격리하기 위한 설정을 쉽게 지정할 수 있습니다.

자세히

파이프라인 모니터링 및 관찰 가능성

데이터 계보, 업데이트 이력 및 데이터 품질 보고를 포함한 내장 모니터링 및 관찰 기능.

자세히

유연한 새로고침 스케줄링

파이프라인의 요구 사항에 따라 지연 시간 또는 비용을 쉽게 최적화하세요.

자세히

사용 사례

데이터 파이프라인을 간소화하세요

소스, 변환, 목적지를 간단하게 만듭니다

선언형 프로그래밍은 몇 줄의 코드로 데이터 인텔리전스 플랫폼에서 ETL의 힘을 활용할 수 있음을 의미합니다.

시작하기

추가 도구 없이 강력한 실시간 사용 사례를 활용하십시오

제어가 가능한 자동 새로 고침 설정으로 한 곳에서 배치 및 스트리밍 파이프라인을 구축하여 실행하면 시간을 절약하고 운영 복잡성을 낮출 수 있습니다. 스트리밍 데이터를 사용하면 분석 및 AI의 정확도와 실천 가능성을 즉시 개선할 수 있습니다.

시작하기

데이터 엔지니어링의 모범 사례를 데이터 웨어하우싱 세계에 원활하게 도입

Spark 선언형 파이프라인을 사용하면, 데이터 웨어하우스 사용자는 접근 가능한 SQL 인터페이스를 통해 선언형 ETL의 전체 힘을 활용할 수 있습니다. SQL 분석가들에게 최소한의 설정이나 의존성으로 비즈니스를 위한 신선한 데이터를 제공하는 저코드, 인프라 없는 데이터 파이프라인을 제공하세요.

시작하기

Spark 선언형 파이프라인 데모 탐색

모든 데모 보기

제품 둘러보기

Spark 선언형 파이프라인 제품 투어

demo center lakeflow declarative pipelines

동영상

Spark Declarative Pipelines 실시간 에비오닉스 데모

동영상

AI 시대의 지능형 데이터 엔지니어링

The Serverless Real Time Lakehouse in Action

동영상

서버리스, 실시간 레이크하우스의 실제 사례

가격

사용량 기반 가격 책정으로
지출 통제

사용 제품에 대해 초 단위로 지불합니다.

가격 살펴보기

더 자세히 알아보기

데이터 인텔리전스 플랫폼에서 다른 통합된 지능형 제공을 탐색하세요.

LakeFlow Connect

어떤 소스에서든 효율적인 데이터 수집 커넥터와 데이터 인텔리전스 플랫폼과의 기본 통합은 통합된 거버넌스와 함께 분석 및 AI에 쉽게 접근할 수 있게 해줍니다.

Lakeflow 작업

ETL, 분석 및 머신러닝 파이프라인에 대한 다중 작업 워크플로우를 쉽게 정의, 관리 및 모니터링합니다. 데이터 팀은 다양한 지원 작업 유형, 심층적인 관측 기능 및 높은 안정성을 기반으로 모든 파이프라인을 보다 효과적으로 자동화 및 오케스트레이션하고 생산성을 높일 수 있습니다.

Lakeflow 작업

레이크하우스 스토리지

레이크하우스의 모든 형식과 유형의 데이터를 통합하여 모든 분석 및 AI 작업에 사용합니다.

Unity Catalog

업계 유일의 통합된 오픈 거버넌스 솔루션을 통해 모든 데이터 자산을 원활하게 관리하십시오. 이 솔루션은 Databricks Data Intelligence Platform에 내장되어 있습니다.

Data Intelligence Platform

Databricks Data Intelligence Platform을 통해 데이터 및 AI 워크로드를 지원하는 방법에 대해 자세히 알아보세요

다음 단계 수행

Spark 선언형 파이프라인 문서를 탐색하세요

AWS, Microsoft Azure 또는 Google Cloud Platform 환경에서 Spark 선언형 파이프라인을 사용하기 시작하는 데 필요한 모든 것.

무료 체험 시작

Databricks Platform의 모든 기능을 무료로 테스트 드라이브해 보세요.

SPARK DECLARATIVE PIPELINES FAQ

데이터 및 AI 기반 기업이 될 준비가 되셨나요?

변화의 첫 걸음 내딛기

무료 시험판 사용해 보기 영업팀에 문의

신뢰할 수 있는 데이터 파이프라인을 간편하게 실행