하둡 데이터로부터 다차원 큐브를 미리 계산하여 페타바이트 규모의 데이터 세트에서 1초 미만의 쿼리 속도를 제공하는 분산형 OLAP 엔진
작성자: Databricks 직원
Apache Kylin은 인터랙티브 분석 빅 데이터에 적합한 분산형 오픈 소스 온라인 분석 처리(Online Analytics Processing, OLAP) 엔진입니다. Apache Kylin은 하둡/Spark에서 SQL 인터페이스와 다차원 분석(OLAP)을 제공하기 위해 고 안되었습니다. 또한 ODBC 드라이버, JDBC 드라이버 및 REST API를 사용해 BI 툴과 손쉽게 통합할 수도 있습니다. 이 엔진은 2014년에 eBay에서 만들어 단 1년만인 2015년에 Apache Software Foundation에서 Top Level Project로 인정받았으며 2015년과 2016년 연속으로 최우수 오픈 소스 빅데이터 툴 상을 받기도 했습니다. 지금은 전 세계 수천 곳의 기업에서 빅데이터용 중요 분석 애플리케이션으로 쓰이고 있습니다. 여타 OLAP 엔진은 데이터 볼륨 때문에 고전하지만, Kyliln은 밀리초 단위로 쿼리 응답을 지원합니다. Kylin은 페타바이트급으로 확장되는 Dataset를 상대로 1초 미만의 쿼리 레이턴시를 제공합니다. 다양한 차원 조합을 사전 연산하여 엄청난 속도를 달성하며, Hive 쿼리를 통해 집계 데이터를 측정하고 그 결과로 HBase를 채웁니다.