수집

학습할 내용

Databricks의 Auto Loader를 사용하면 새로운 배치 및 실시간 데이터 파일이 도착하는 대로 곧장 Delta Lake 테이블에 증분식으로, 효율적인 형태로 수집할 수 있으므로 여기에 항상 가장 온전하고 최신 상태인 데이터를 포함하도록 보장됩니다. Auto Loader는 계속 실행하거나 "triggerOnce" 모드에서 데이터를 일괄 처리하는 간단하고 유연한 도구입니다. SQL 사용자는 단순한 "COPY INTO" 명령을 사용해 새 데이터를 자동으로 Delta Lake 테이블에 가져올 수 있으며, 이미 처리된 파일이 무엇인지 계속 확인할 필요가 없습니다.

권장

<p>Auto Loader를 사용한 데이터 수집</p>

온디맨드 비디오

Auto Loader를 사용한 데이터 수집

<p>Kafka에서 Databricks로 데이터 가져오기</p>

온디맨드 비디오

Kafka에서 Databricks로 데이터 가져오기

<p>Delta Live Tables 및 Databricks Workflows를 사용하여 데이터 스트리밍</p>

온디맨드 비디오

Delta Live Tables 및 Databricks Workflows를 사용하여 데이터 스트리밍