고객 사례

리그 오브 레전드를 위한 최적의 게임 내 환경 제작

50%

EMR보다 빠른 데이터 처리 속도

업종: 게임
클라우드: AWS

Databricks에서는 사용하기 간편한 관리형 솔루션을 제공합니다. 덕분에 저희는 사내에 보유한 데이터 전체에 무제한 액세스할 수 있어서 데이터 팀이 게이밍 환경을 개선하는 것처럼 정말 중요한 사안에 집중할 수 있습니다."

– Colin Borys, Riot Games 선임 데이터 사이언티스트

Riot Games는 월별 활성 사용자 수가 1억 명이 넘는 세계 최상위권 PC 게임 업체로, 충실한 고객 기반을 위해 노력을 아끼지 않으며, 세계에서 가장 플레이어 중심적인 게임 기업이 되고자 하는 사명을 품고 있습니다. 데이터 포인트만 해도 5천억 개가 넘고, 데이터 규모는 26PB를 넘어 계속 성장 중인 이 기업의 데이터 팀은 전반적인 게이밍 경험을 개선하기 위해 데이터를 더욱 효율적이고 확장할 수 있는 방식으로 활용할 방안이 절실했습니다. Riot Games에서는 Databricks 레이크하우스 플랫폼을 선택했고, 이제 플레이어별로 콘텐츠와 구매 추천을 제공하고 게임 내 부정행위를 제재하며 네트워크 성능을 최적화하여 고객 참여율을 높이고 이탈률은 낮추고 있습니다.

데이터 인사이트 확보에 역부족인 레거시 인프라

데이터 인사이트 확보에 역부족인 레거시 인프라

Riot Games에서는 주로 EMR에 의존하고 있었는데, 이는 네트워크와 엔지니어링 인프라가 비교적 강력한 편이기는 했지만 급속히 늘어나는 데이터와 에코시스템을 효율적으로 확장하는 면에서는 만족스럽지 않았습니다. 인프라가 분절되어 있고 워크플로가 비효율적인 탓에 수동 프로세스가 많았고 협업이 저하되었으며 네트워크 문제를 정확히 선제적으로 짚어내기란 불가능에 가까웠습니다. 주로 사용하는 툴과 데이터가 분리되어 있었기 때문에 데이터 액세스와 수집이 비효율적이었고, 길고 불안정한 프로세스를 거쳐야 했습니다. 즉 우선 편집자가 데스크톱 편집기에서 SQL 쿼리를 만든 다음 이를 Hive로 전송합니다. 이 작업은 보통 적어도 처음 한 번은 실패하는 편이었고, 그 뒤로 계속 실패하는 경우도 있었습니다. 이를 성공할 때까지 반복한 끝에 데이터를 쿼리로 가져와(아주 느린 EMR을 통해) 수동으로 다시 데스크톱 시스템으로 가져와서 심층 검토하는 방식이었습니다.

네트워크 성능과 연결 문제의 원인을 파악하기 위한 인사이트를 얻는 과정도 그만큼 힘겹기는 마찬가지였습니다. Riot Games에서는 200,000여 개 도시와 ISP 구성을 아우르는 페타바이트급 스트리밍 네트워크 데이터를 수동으로 모니터링하고 있었습니다. 게임 경험에 악영향을 미치는 문제점을 파악하기는 불가능한 것이나 마찬가지였고, 이 점은 사용자에게 중대한 영향을 미쳤습니다. 전반적으로 이러한 데이터 방해물 때문에 데이터 사이언스 팀이 함께 협력하여 전사적으로 데이터를 파악하기 어려웠습니다. Riot Games에서 성능 강화를 위해 필요한 머신 러닝(ML) 모델을 빌드하고 게임 내에서 개인별 맞춤 상품을 제안하며 확장 가능한 효율성을 확보하려면 데이터를 현대화해야만 했습니다.

한 플랫폼에서 데이터 사이언스와 엔지니어링 지원

한 플랫폼에서 데이터 사이언스와 엔지니어링 지원

Riot Games에서는 Databricks 레이크하우스 플랫폼을 이용해 분석과 머신 러닝에 사용할 데이터 액세스를 중앙집중화하고 민주화(democratize)하고 있습니다. 이 플랫폼은 완전 관리형 클라우드 인프라로, 데이터 사이언스와 엔지니어링의 성능, 안정성 및 확장성 요구 사항에 모두 부합하기 때문에 DevOps에서 큰 수고를 들이지 않고도 한결 간편하게 파이프라인과 모델 교육을 확장할 수 있습니다. Databricks는 여러 부서에서 차출된 팀원으로 꾸린 팀 전체를 대상으로 단일 플랫폼에서 분석 워크플로를 간소화하여 쿼리, 디버깅, 탐색, 스트리밍 및 배치 데이터 탐색, ML 모델 빌드 및 배포 등 다양한 용도로 활용하게 해줍니다.

Delta Lake는 데이터를 모두 연결하여 데이터 엔지니어링 팀에서 안정적이고 성능 수준에 맞는 ETL 파이프라인을 빌드하도록 지원합니다. 이것을 사용 사례를 지원하는 다양한 분석 및 머신 러닝 워크로드에 주입하는 것입니다. 데이터 팀원들은 Databricks의 대화형 워크스페이스에서 공유형 노트북 환경을 토대로 협업을 진행하며 빠른 속도로 실시간 모델 반복 재현을 할 수 있습니다. 데이터 사이언티스트가 데이터에 손쉽게 액세스하고 쿼리를 생성하며 탐색, 디버깅과 모델 교육까지 할 수 있도록 권한이 부여되며, 이 모든 일에 단 하나의 대화형 인터페이스를 이용합니다. 전체 자동화 기능 중에는 작업 예약, 모니터링과 클러스터 관리 등이 대표적입니다. DevOps에서 크게 수고를 들이지 않아도 작업 스케줄러가 대화형 및 ETL 워크로드를 둘 다 실행할 수 있으므로 시간과 리소스가 한층 절약됩니다.

혁신적인 성능 강화로 게이밍 환경 개선

혁신적인 성능 강화로 게이밍 환경 개선

Riot Games에서는 데이터 처리와 데이터 사이언스 생산성을 개선하여 다양한 사용 사례를 제공함으로써 더 나은 게이밍 경험을 보장하고 있습니다. 가장 주목할 만한 성과로는, Delta Lake를 사용하면서 ETL 처리 성능이 EMR 대비 50%나 빨라졌고, 덕분에 혁신의 속도가 한결 빨라졌습니다. 다운스트림 데이터 흐름이 원활해지면서 Riot Games 추천 엔진은 120여 가지 타입의 캐릭터를 매핑하고 여러 가지 독특한 스킨을 총망라하여 총 수천 가지에 이르는 다양한 조합과 수십억 개의 게임플레이 데이터 포인트를 확보했습니다. 따라서 이제 게임 플레이어가 원하는 콘텐츠를 전보다 수월하게 찾을 수 있으므로, Riot Games의 전환율 면에서도 유익한 결과를 얻고 있습니다.

Databricks에서는 Riot Games 데이터 팀에서 네트워크 지연으로 인한 게임플레이 지연 발생을 예측할 모델을 빌드, 배포하는 과정을 도왔습니다. 스트리밍 아키텍처가 실시간으로 이상을 탐지하고 네트워크 운영 알림을 제공합니다. 이제 Riot Games에서는 문제점이 플레이어를 방해하기 전에 한발 앞서 문제를 해결할 수 있으므로 게임 내 환경 수준이 높아졌습니다. 근본 원인 인사이트가 놀랄 만큼 정확하고, 모델에 새로운 데이터가 끊임없이 스트리밍되어 수집되므로 네트워크 성능 또한 전반적으로 대폭 개선되었습니다.

Databricks는 TensorFlow와 같은 최신 딥러닝 프레임워크와 통합되므로 Riot Games에서는 딥러닝 모델도 간편하게 개발하여 교육할 수 있었습니다. 현재 Riot Games에서는 게임플레이 중 욕설 사용 현황을 실시간으로 탐지할 수 있습니다. 따라서 "악성 사용자"를 격리할 수 있으므로 게임 전체에서 부정행위를 줄이는 데 도움이 됩니다. 적절한 환경을 조성하면서 고객 만족도가 높아지고 유지율과 생애 가치가 상승했고, 나아가 전반적인 게임 내 경험에도 좋은 방향으로 기여하게 되었습니다. Riot Games에서는 앞으로도 Databricks 레이크하우스 플랫폼을 활용하여 데이터 사이언티스트와 엔지니어를 지원하며 새롭고 혁신적인 기회를 잘 포착해 리그 오브 레전드 플레이어 경험을 꾸준히 개선하고자 합니다.