데이터 흐름(Data Flow)
데이터 흐름이란 무엇인가요?
데이터 흐름은 시스템 아키텍처를 통해 한 프로세스나 구성 요소에서 다른 프로세스나 구성 요소로 데이터가 이동하는 것을 의미합니다. 이는 컴퓨터 시스템, 애플리케이션 또는 네트워크 내에서 데이터가 입력, 처리, 저장 및 출력되는 방식을 설명합니다. 데이터 흐름은 모든 IT 시스템의 효율성, 신뢰성, 보안에 직접적인 영향을 미치므로, 출력을 최적화하기 위해 시스템을 적절히 구성하는 것이 중요합니다.
데이터 흐름 시스템 내에서 데이터가 이동하고 처리되는 방식을 정의하는 핵심 구성 요소에는 여러 가지가 있습니다.
- 데이터 소스. 데이터 흐름은 정형 데이터, 비정형 데이터, 스크립트 소스, 고객 입력 등 특정 소스에서 데이터를 수집하는 것으로 시작됩니다. 이러한 소스는 데이터 흐름을 시작하고 데이터 흐름 시스템을 가동합니다.
- 데이터 변환. 데이터가 시스템에 수집되면 데이터는 분석이나 데이터 사이언스에 사용할 수 있는 구조나 형식으로 변환될 수 있습니다. 데이터 변환은 시스템 전체에 서 데이터가 처리되거나 수정되는 방식을 정의하는 데이터 변환 규칙에 따라 이루어집니다. 이렇게 하면 데이터가 비즈니스 프로세스와 결과에 적합한 형식으로 유지됩니다.
- 데이터 싱크. 수집 및 변환된 데이터의 최종 목적지는 데이터 싱크입니다. 데이터 싱크는 데이터 시스템의 엔드포인트로, 데이터가 데이터 흐름 과정에서 더 이상 전송되지 않고 데이터가 사용되는 곳입니다. 여기에는 감사 또는 분석을 위해 데이터가 기록되는 데이터베이스, 레이크하우스, 보고서 또는 로그 파일이 포함될 수 있습니다.
- 데이터 흐름 경로. 데이터 흐름도는 데이터가 소스, 프로세스, 목적지 간에 이동하는 경로 또는 채널을 정의합니다. 이러한 경로에는 물리적 네트워크 연결이나 논리적 경로(예: API 호출)가 포함될 수 있으며, 안전하고 효율적인 데이터 전송을 위한 프로토콜과 채널도 포함됩니다.