작성자: Milos Colic
이 블로그는 오래되었습니다. Databricks Lakehouse 내에서 지리공간 데이터를 저장하고 처리하는 최신 접근 방식은 이 Spatial SQL 블로그를 참조해 주세요.
지리공간 데이터는 지도, 지도 제작 및 최근에는 디지털 콘텐츠를 통해 수세기 동안 혁신을 주도해 왔습니다. 예를 들어, 가장 오래된 지도는 매머드 엄니 조각에 새겨진 것으로 발견되었으며 기원전 약 25000년으로 거슬러 올라갑니다. 이는 지리공간 데이터가 사회가 의사 결정을 내리는 데 사용하는 가장 오래된 데이터 소스 중 하나임을 의미합니다. 공간 분석의 탄생으로 불리는 최근의 예는 1832년 샤를 피케(Charles Picquet)가 지리공간 데이터를 사용하여 파리의 콜레라 발병을 분석한 것입니다. 수십 년 후인 1854년 존 스노우(John Snow)는 런던의 콜레라 발병에 대해 동일한 접근 방식을 따랐습니다. 이 두 사람은 지리공간 데이터를 사용하여 당시 가장 어려운 문제 중 하나를 해결하고 수많은 생명을 구했습니다. 20세기에는 지리 정보 시스템(GIS)의 개념이 1967년 캐나다 오타와에서 산림농촌개발부(Department of Forestry and Rural Development)에 의해 처음 소개되었습니다.
오늘날 우리는 클라우드 컴퓨팅 산업 혁명의 한가운데에 있습니다. 슈퍼컴퓨팅 규모를 모든 조직에서 사용할 수 있으며, 스토리지와 컴퓨팅 모두에 대해 사실상 무한하게 확장 가능합니다. 데이터 메시 및 데이터 마켓플레이스와 같은 개념이 데이터 커뮤니티 내에서 플랫 폼 연합 및 상호 운용성과 같은 질문에 답하기 위해 등장하고 있습니다. 이러한 개념을 지리공간 데이터, 공간 분석 및 GIS 시스템에 어떻게 적용할 수 있을까요? 데이터 제품의 개념을 채택하고 지리공간 데이터를 제품으로 설계함으로써 가능합니다.
이 블로그에서는 최신이고 강력한 확장 가능한 지리공간 데이터 제품을 설계하는 방법에 대한 관점을 제공할 것입니다. Databricks Lakehouse Platform을 사용하여 오늘날과 미래의 가장 어려운 문제를 해결하는 데 가장 가치 있는 자산 중 하나인 지리공간 제품의 잠재력을 최대한 발휘하는 방법을 논의할 것입니다.
가장 광범위하고 간결한 "데이터 제품"의 정의는 DJ Patil(미국 최초의 최고 데이터 과학자)이 Data Jujitsu: The Art of Turning Data into Product에서 다음과 같이 말한 것입니다. "데이터를 사용하여 최종 목표를 촉진하는 제품". 이 정의의 복잡성(Patil이 스스로 인정한 대로)은 대시보드, 보고서, Excel 스프레드시트, 심지어 이메일을 통해 공유되는 CSV 추출물을 포함하여 가능한 제품의 폭넓은 범위를 포함하기 위해 필요합니다. 제공된 예는 품질, 견고성 및 거버넌스 측면에서 빠르게 저하됨을 알 수 있습니다.
성공적인 제품과 실패한 제품을 구별하는 개념은 무엇일까요? 포장인가요? 내용인가요? 내용의 품질인가요? 아니면 시장에서의 제품 채택률인가요? Forbes는 성공적인 제품의 10가지 필수 요소를 정의합니다. 이를 요약하는 좋은 프레임워크는 가치 피라미드입니다.

가치 피라미드는 제품의 각 측면에 우선순위를 부여합니다. 우리가 제품에 대해 묻는 모든 가치 질문이 동일한 비중을 갖는 것은 아닙니다. 출력이 유용하지 않다면 다른 측면은 중요하지 않습니다. 출력은 실제로 제품이 아니라 유용한 결과 풀에 대한 데이터 오염물이 됩니다. 마찬가지로 확장성은 단순성과 설명 가능성이 해결된 후에만 중요합니다.
가치 피라미드는 데이터 제품과 어떤 관련이 있을까요? 각 데이터 출력은 데이터 제품이 되기 위해 다음을 수행해야 합니다.