2026년 4월 2일

잘 관리된 데이터 레이어에서 시작하는 에이전트 기반 분석

통합 의미론, 계보, 개방형 거버넌스가 이제 신뢰할 수 있는 AI 및 확장 가능한 분석의 기반이 되는 이유

AI는 분산된 지표, 갇힌 의미론, 약한 거버넌스가 이제 의사 결정을 늦추고 신뢰를 훼손하는 레거시 BI가 숨겨온 것을 드러내고 있습니다.
계보와 개방형 표준을 기반으로 구축된 통합 의미론 계층은 대규모에서 신뢰할 수 있는 AI 및 분석을 가능하게 합니다.
데이터 기반을 올바르게 구축한 조직은 거버넌스 절충 없이 더 빠르게 이동하고, 비용을 절감하며, 인사이트를 민주화합니다.

AI가 경영진이 데이터를 다루는 방식을 바꾸면서 분석은 대시보드 시대를 넘어 훨씬 더 역동적인 운영 모델로 나아가고 있습니다. 자연어 인터페이스, AI 기반 인사이트, 에이전트 워크플로우는 정보에 대한 더 넓은 접근성을 약속하지만, 이는 또한 많은 조직이 수년간 겪어온 문제를 드러냅니다. 바로 파편화된 정의, 일관성 없는 측정 기준, 그리고 AI 규모에 맞게 설계되지 않은 거버넌스 모델입니다.

실제로 이것이 무엇을 의미하는지 자세히 알아보기 위해 저는 Databricks의 아시아 태평양 및 일본 지역 필드 엔지니어링 부사장인 Nick Eayrs와 이야기를 나누었습니다. 거의 25년간 여러 지역에서 리더십을 발휘해 온 Eayrs는 데이터 인사이트가 조직 내에서 어떻게 가속화될 수 있는지, 그리고 에이전트 분석의 새로운 시대에 성공하기 위해 무엇이 필요한지에 대한 폭넓은 시각을 가지고 있습니다. 이러한 배경 덕분에 그는 데이터 및 AI 전략이 시장, 운영 모델, 기업 성숙도 수준 전반에 걸쳐 어떻게 전개되는지에 대한 폭넓은 시각을 갖게 되었습니다.

우리 대화의 핵심은 AI가 시맨틱과 거버넌스의 필요성을 없애는 것이 아니라 오히려 훨씬 더 중요하게 만든다는 그의 확신이었습니다. 그의 관점에서 조직은 그 아래의 데이터 계층, 즉 비용과 복잡성으로 인해 무너지지 않고 인텔리전스를 확장할 수 있게 해주는 비즈니스 정의, 계보, 액세스 제어 및 개방형 표준을 수정하기 전까지는 신뢰할 수 있는 AI 결과를 얻을 수 없을 것입니다.

AI가 분석의 규칙을 다시 쓰고 있습니다

Catherine Brown: AI가 기존 BI와는 다르게 분석에 시맨틱 및 거버넌스 압력을 가하는 이유는 무엇인가요?

Nick Eayrs: 기존 BI는 실제로 정적 대시보드와 사전 정의된 보고서의 세계였습니다. 비즈니스 사용자는 상당히 복잡한 인터페이스를 탐색해야 했고, 후속 질문이 있거나 더 깊이 탐색하고 싶다면 일반적으로 전문가의 지원이 필요했습니다. 진정한 셀프 서비스는 거의 없었습니다.

기존 BI의 기반이 되는 시맨틱 계층 또한 비교적 정적이고 변경이 느렸습니다. 비즈니스에서 수익, 이탈 또는 고객 평생 가치에 대한 새로운 정의가 필요하다면, 일반적으로 IT 또는 전문 팀에 다시 가서 시맨틱 계층을 업데이트하고 보고서를 다시 빌드해야 했습니다. 이는 매우 미리 결정된 모델이었습니다.

AI는 이 모든 것을 완전히 바꿉니다. 더 이상 정적일 필요도 없고, 순전히 기술적인 설명에 머무를 필요도 없습니다. 기존 BI는 종종 후방 거울 분석입니다. 즉, 무슨 일이 일어났는지 알려줍니다. AI를 사용하면 무슨 일이 일어날지 예측하고, 왜 그런 일이 발생했는지 묻고, 다음에 무엇을 해야 할지 이해하기 시작할 수 있습니다. 훨씬 더 많은 데이터를 직접 추론하고 실시간으로 인사이트를 생성할 수 있습니다.

하지만 이 세계에서 시맨틱이 사라지는 것은 아닙니다. 오히려 더 중요해집니다. AI와 에이전트는 여전히 그 아래의 데이터에 의해 정보를 얻습니다. 이는 '쓰레기를 넣으면 쓰레기가 나온다'는 오래된 원칙으로 돌아갑니다. 제품, 서비스, 분류 체계 및 용어에 대한 올바른 비즈니스 맥락을 갖춘 신뢰할 수 있고 고품질의 데이터가 많을수록 AI 경험은 더 좋아질 것입니다.

누군가가 “왜 3분기 목표를 달성하지 못했습니까?”라고 묻는다면, 시스템은 해당 조직에서 “목표”가 무엇을 의미하는지, 사용자가 어떤 기간을 참조하는지, 그리고 해당 측정 기준이 어떻게 정의되는지를 이해해야 합니다. 이러한 시맨틱 맥락이 없으면 시스템은 추측만 할 뿐입니다. 일반적인 답변을 생성할 수는 있지만 신뢰할 수 있는 답변은 아닙니다.

여기에는 또 다른 중요한 점이 있습니다. Databricks의 관점에서 시맨틱 계층은 개방적이고 상호 운용 가능해야 합니다. 기존 BI 공급업체는 종종 시맨틱 모델을 자체 도구에 잠그는데, 이는 모든 것이 해당 인터페이스를 통해 흘러야 함을 의미합니다. 이것이 주요 제약이 됩니다. AI 및 에이전트 경험을 확장하고 싶다면 APJ의 강력한 맞춤형 사례는 Takeda입니다. 올바른 데이터 기반과 보호 장치가 마련되어 있다면 상업, R&D, 제조 및 백오피스 기능 전반에 걸쳐 여러 AI 사용 사례를 구축할 수 있었습니다.

Catherine: AI가 분석에 가하는 거버넌스 압력에 대해 좀 더 구체적으로 이야기해 주시겠어요?

Nick: BI 측과 AI 측 모두에서 거버넌스는 신뢰, 계보, 추적 가능성으로 귀결됩니다.

대시보드나 비즈니스 인텔리전스 인사이트를 생성하는 경우, 어떻게 구축되었는지 이해해야 합니다. 어떤 하위 데이터가 사용되었나요? 측정 기준은 어떻게 정의되었나요? 이를 알지 못하면 보고 있는 것을 신뢰할 수 없습니다.

AI 측에서도 마찬가지입니다. 해당 출력이 어떻게 파생되었는지 이해할 수 없다면 모델, 에이전트 또는 에이전트 애플리케이션의 출력을 신뢰하지 않을 것입니다. 어떤 테이블에서 나왔나요? 어떤 기능이 사용되었나요? 어떤 모델이 추론을 제공했나요? 이러한 종단 간 계보는 필수적입니다.

규정 준수 차원도 있습니다. 고도로 규제된 산업에서는 조직이 이러한 추적 가능성을 증명해야 하는 경우가 점점 더 많아질 것입니다. AI 기반 결정이 소비자, 시민 또는 환자에게 외부적으로 노출되는 경우, 이를 뒷받침하고 어떻게 생성되었는지 감사할 수 있어야 합니다. AI는 신뢰와 추적 가능성에 대한 기대치가 높아짐에 따라 분석에 더 많은 압력을 가하고 있습니다.

파편화된 측정 기준이 의사결정을 늦추고 있습니다

Catherine: 가장 흔하게 충돌하는 측정 기준 패턴은 무엇이며, 이는 조직에 어떤 비용을 초래하나요?

Nick: 가장 큰 문제는 파편화입니다. 대부분의 조직은 시스템 내에 여러 BI 도구를 보유하고 있으며, 각 도구는 자체 시맨틱 모델과 비즈니스 측정 기준에 대한 자체 해석을 가질 수 있습니다. 이는 단일 진실 공급원이 없고 조정되지 않는 중복된 논리가 많이 발생한다는 것을 의미합니다.

한 대시보드는 수익을 한 가지 방식으로 정의할 수 있습니다. 다른 도구는 다르게 정의할 수 있습니다. 재무팀의 누군가는 Excel에서 다른 버전을 사용하고 있을 수 있습니다. 그 시점에서 신뢰는 매우 빠르게 무너지기 시작합니다. 사람들은 더 이상 결정 자체에 대해 토론하는 것이 아니라 어떤 숫자가 옳은지에 대해 토론하기 때문에 의사결정이 느려집니다.

기존 BI 모델이 AI 규모에서 실패하는 이유

Catherine: 도구에 갇힌 대시보드 논리가 AI 규모에서 왜 무너지는가요?

Nick: 기존 BI 도구는 종종 소스 시스템에서 데이터를 추출하고, 특정 보고 결과를 위해 집계하고, 독점 저장소로 이동한 다음, 그 위에 독점 시맨틱 및 대시보드를 계층화합니다. 모든 것이 도구에 잠깁니다.

AI 시대에는 사용자가 항상 후속 질문을 하기 때문에 이것이 심각한 문제가 됩니다. 더 깊이 들어가고 싶어합니다. 해당 논리를 다른 시스템에 노출하고 싶어합니다. 데이터 과학자나 머신러닝 팀이 이를 기반으로 구축하기를 원합니다. 모든 것이 하나의 독점 계층에 갇혀 있다면 잘 작동하지 않습니다. 소스로 계속 돌아가서 더 많은 데이터를 가져오고, 다시 변환하고, 논리를 다시 빌드해야 합니다. 반복적이고 비용이 많이 듭니다.

대신 모든 것이 개방형 데이터 형식과 개방형 인터페이스를 기반으로 구축된다면 BI, AI, 노트북, 에이전트 및 데이터 과학 팀 모두 동일한 거버넌스 기반에서 작업할 수 있습니다. 데이터를 한 번 저장하고 처리합니다. 누구나 자연어로 상호 작용할 수 있습니다. 누구나 이를 기반으로 구축할 수 있습니다. 이것이 규모에 훨씬 더 나은 모델입니다.

또한 기존 방식에는 상당한 엔지니어링 부담이 있습니다. 파편화된 시스템을 정렬하기 위해 많은 동기화 파이프라인과 많은 사용자 지정 코드를 유지 관리해야 합니다. 이러한 복잡성은 정당화하기가 매우 어렵습니다.

머신 판독 가능한 시맨틱 계층은 어떤 모습인가

Catherine: 머신 판독 가능한 시맨틱 계층은 실제로 어떤 모습인가요?

Nick: 첫째, 비즈니스 측정 기준은 기본 기둥으로 취급되어야 합니다. 이는 수익, 이탈 또는 고객 평생 가치와 같은 항목의 정의가 명시적으로 정의되고, 인증되고, 조직 전체에서 재사용 가능해야 함을 의미합니다.

둘째, 이러한 측정 기준은 표준 언어, 주로 SQL을 통해 액세스할 수 있어야 하며, BI 도구뿐만 아니라 AI 인터페이스, 노트북 및 에이전트에서도 소비할 수 있어야 합니다. 액세스 가능하고 재사용 가능하지 않으면 문제를 해결한 것이 아닙니다.

셋째, 개방성과 상호 운용성이 필요합니다. 비즈니스 로직 전체를 시스템에서 다시 가져올 수 없는 시스템으로 푸시하고 싶지 않습니다. 개방형 표준은 옵션과 안전한 종료 전략을 제공하므로 시스템이나 공급업체를 변경해야 할 때 유용합니다.

또한 AI 기반 거버넌스가 필요합니다. 에이전트 세계에서는 수천 개의 모델이나 에이전트가 시맨틱 계층과 항상 상호 작용할 수 있습니다. 모든 것이 수동으로 이루어진다면 메타데이터, 주석 및 비즈니스 측정 기준을 최신 상태로 유지하는 것은 엄청난 과제입니다. AI는 이러한 메타데이터를 생성하고 유지 관리하는 데 도움을 줄 수 있으므로 시맨틱 계층은 규모에 맞게 사용할 수 있습니다.

그리고 물론, 에이전트와 애플리케이션이 API 및 자연어 인터페이스를 통해 해당 계층과 상호 작용할 수 있도록 대화형 및 맥락적 인텔리전스가 필요합니다.

Catherine: 평가는 어디에 포함되나요? 데이터 인증이 먼저 이루어지고, 그 후에 AI 계층과 평가가 이루어지나요?

Nick: 네. 데이터 기반이 먼저입니다. AI가 해당 데이터를 잘 사용하기 전에 메타데이터, 비즈니스 로직, 주석 및 비즈니스 측정 기준이 마련되어 있어야 합니다.

그런 다음 그 위에 AI 또는 에이전트 계층을 구축합니다. 그 후, 평가 프레임워크가 적용되어 출력이 예상과 일치하는지 확인하고 시스템이 수행하는 작업을 개선합니다. 그러나 평가 계층은 기반을 올바르게 설정하는 것을 대체할 수 없습니다. 그것은 이러한 기반에 의존합니다.

좌석당 BI 모델이 채택과 가치를 제한하는 이유

Catherine: 각 좌석별 BI 모델이 채택 및 가치 창출을 적극적으로 제한하는 경우는 언제인가요?

Nick: 데이터 및 AI 민주화의 목표는 조직 내 모든 지식 근로자에게 인텔리전스를 제공하는 것입니다. 좌석별 모델은 이러한 목표에 직접적으로 반합니다.

이는 조직이 어떤 사용자, 팀 또는 비즈니스 단위에 액세스 권한을 부여할지 선택하도록 강제하기 때문에 민주화를 제약합니다. 또한 라이선스 가용성에 따라 어떤 프로젝트를 진행할지 결정해야 하므로 혁신을 제약합니다.

이는 가치 창출에도 영향을 미칩니다. 최고의 결과는 종종 다양한 팀이 비즈니스 문제를 중심으로 협력할 때 나옵니다. 이러한 팀 중 일부만 시스템에 액세스할 수 있다면 협업을 제한하고 조직의 가치 창출 능력을 제한하게 됩니다.

다른 문제는 효율성입니다. 소비 기반 모델에서는 사용한 만큼 지불합니다. 사용량이 증가하면 증가한 사용량에 대해 지불합니다. 사용량이 0으로 떨어지면 0을 지불합니다. 이는 과소 사용되거나 과도하게 프로비저닝될 수 있는 좌석 라이선스에 대해 지불하는 것보다 훨씬 합리적인 모델입니다.

Catherine: 일부 조직에서는 라이선스 제한이 효과적으로 거버넌스 계층 역할을 한다고 주장할 수 있습니다. 이에 대해 어떻게 생각하시나요?

Nick: 라이선스를 제한하여 데이터 액세스를 거버넌스하려고 하면 실패할 것입니다. 그것은 잘못된 제어 지점입니다.

좋은 거버넌스는 플랫폼 및 데이터 계층에서 시작됩니다. 역할 기반 및 속성 기반 제어, ID 시스템과 통합된 인증 및 권한 부여, 데이터 자산의 명확한 분리 및 분류로 시작됩니다. 권한 및 정책 적용을 미리 해결합니다.

이를 제대로 수행하면 액세스를 광범위하게 배포하면서도 사람들이 올바른 정보만 볼 수 있도록 보장할 수 있습니다. 좌석 라이선스를 거버넌스 메커니즘으로 사용하는 것은 확장 가능하지 않으며 기본 거버넌스 작업을 대체할 수 없습니다.

신뢰를 개선하고 비용을 절감하는 가장 빠른 방법

Catherine: 조직이 신뢰를 개선하고 분석 비용을 동시에 절감하기 위해 할 수 있는 가장 빠른 아키텍처 이동은 무엇인가요?

Nick: 가장 중요한 이동은 강력한 거버넌스 기반에 기반한 통합 의미 계층을 구축하는 것입니다.

이는 카탈로그 결정에서 시작됩니다. 데이터 및 AI 자산을 어떻게 거버넌스할 것인가? 카탈로그가 있으면 의미를 정의하고 비즈니스 메트릭을 인증하고 단일 진실 공급원을 만들 수 있습니다. Databricks 모델에서 해당 진실 공급원은 개방적이고 상호 운용 가능하며 이는 매우 중요합니다.

이를 수행하면 몇 가지 일이 발생합니다. 계보, 거버넌스, 감사 가능성 및 인증된 정의가 있으므로 신뢰를 얻습니다. 불필요한 중복 및 반복 ETL을 피하므로 단순화됩니다. 누군가 새로운 질문을 할 때마다 논리를 다시 구축할 필요가 없으므로 IT 부담이 줄어듭니다.

구현 패턴은 상당히 명확합니다. 첫째, 데이터 기반을 올바르게 설정합니다. 둘째, 의미 계층을 구축하고 비즈니스 메트릭을 인증합니다. 셋째, AI를 계층화한 다음 평가 프레임워크를 사용하여 해당 출력을 모니터링하고 개선합니다. 이 순서가 중요합니다. NTT Docomo는 좋은 예입니다. Databricks Lakehouse, Unity Catalog 및 워크플로를 사용하여 로그 분석을 자동화함으로써 월 66시간의 수동 처리 시간을 6시간으로 줄이고 분석 효율성을 90% 향상했습니다. 이는 거버넌스와 기반이 훨씬 빠른 의사 결정을 가능하게 하는 강력한 예입니다.

APJ가 데이터 및 AI 수익화에 더 빠르게 움직이는 이유

Catherine: APJ 기업들은 데이터 계층을 AI에 수익화하는 데 있어 어떤 점을 다르게 또는 더 빠르게 하고 있나요?

Nick: APJ는 매우 다양한 시장입니다. 매우 다른 국가, 언어, 성숙도 수준 및 규제 환경을 다루고 있습니다. 그러나 일반적인 패턴 중 하나는 조직이 디지털 트랜스포메이션에 매우 빠르게 움직이는 경향이 있으며, 해당 지역의 많은 정부가 명확한 국가 AI 전략을 가지고 있다는 것입니다.

고객으로부터 우리가 보는 것은 종종 거버넌스 및 데이터 기반 계층으로 시작한 다음, 기반이 마련되면 AI 네이티브 애플리케이션으로 빠르게 전환한다는 것입니다. 이 순서가 중요합니다.

금융 서비스와 같은 산업에서도 이러한 패턴을 볼 수 있습니다. 고객은 거버넌스된 데이터 계층 위에 분석을 통합한 다음 액세스를 민주화합니다.

또 다른 예는 일본의 Net One Systems입니다. 기반을 마련한 후 다른 시스템과 통합된 AI 기반 지식 도구를 구축하여 지원 쿼리에 대한 응답 시간을 75% 단축하고 연간 10,000시간의 노동력을 절감했습니다.

APJ에서 특히 독특한 점 중 하나는 다국어 차원입니다. 고객은 일본어, 중국어, 광둥어, 태국어 및 기타 현지 언어로 기능을 구축하고 있습니다. 이는 강력하지만 기본 데이터 계층이 이를 지원할 만큼 충분히 거버넌스되고 구조화되어 있어야만 작동합니다.

APJ 고객은 기반을 빠르게 올바르게 설정한 다음 그 위에 AI 우선 애플리케이션 개발로 신속하게 전환하는 경향이 있습니다. 많은 경우 다른 지역보다 빠르게 움직이고 있습니다.

마무리 생각

Nick의 요점은 기술적이고 전략적입니다. AI로부터 가치를 창출하는 조직은 분석, 의미 및 거버넌스를 별도의 대화로 취급하지 않습니다. 그들은 그것들을 하나의 기반으로 취급합니다. 경영진에게는 이것이 중요한 이유는 보상이 단순히 더 나은 아키텍처가 아니기 때문입니다. 더 빠른 의사 결정, 통찰력에 대한 더 넓은 액세스, 그리고 규모에 따른 더 낮은 분석 비용입니다. AI는 파편화된 데이터 계층을 수정하지 않습니다. 그것을 드러낼 것입니다. 실험에서 신뢰할 수 있는 인텔리전스로 가장 빠르게 전환하는 회사는 메트릭을 명확하게 정의하고, 중앙에서 거버넌스하고, 분석 및 AI가 동일한 진실 위에 구축할 수 있을 만큼 개방적으로 만드는 회사입니다.

효과적인 운영 모델 구축에 대해 자세히 알아보려면 Databricks AI Maturity Model을 다운로드하세요.

(이 글은 AI의 도움을 받아 번역되었습니다. 원문이 궁금하시다면 여기를 클릭해 주세요)