주요 컨텐츠로 이동

밀집 텐서란 무엇인가요?

표준 다차원 배열은 모든 요소를 ​​메모리에 저장하여 빠른 순차 접근을 제공하지만 대규모 환경에서는 상당한 저장 공간을 차지합니다.

10 Personas Data Management
데이터 + AI 기초Less than a minute

작성자: Databricks 팀

Summary

  • 모든 요소를 ​​연속적인 메모리 블록에 명시적으로 저장하여 표준 행렬 연산, 합성곱 및 순차적 접근 패턴에 최적화된 알고리즘에 효율적입니다.
  • 이미지, 오디오 신호, 완전 연결 신경망 레이어와 같이 대부분의 값이 0이 아니고 모든 요소를 ​​계산에 사용하는 고밀도 데이터에 적합합니다.
  • TensorFlow, PyTorch, NumPy와 같은 프레임워크에서 기본 텐서 표현 방식으로, CPU, GPU, TPU에서 고밀도 선형 대수 연산을 위한 하드웨어 최적화를 활용합니다.

밀집 텐서는 인접한 순차적 메모리 블록에 값을 저장하는데, 이곳에 모든 값이 표시됩니다. 텐서, 즉 다차원 어레이는 매우 다양한 다차원 데이터 분석 애플리케이션에서 사용됩니다. 텐서 연산을 수행할 줄 아는 소프트웨어 제품은 많습니다. 예를 들어 MATLAB 스위트의 경우, 다양한 오픈 소스 타사 툴박스로 보강되기까지 했습니다. MATLAB 단독으로 다양한 요소 관련 이진수 밀집 텐서 연산을 지원할 수 있습니다. 밀집(dense)계층은 완전히 연결된 계층으로, 모든 뉴런이 하나도 빠짐없이 이전 계층의 모든 뉴런에서 입력을 받으므로 높은 밀도로(densely) 연결되어 있습니다. 이는 다시 말해 밀집(dense)계층에 속한 모든 뉴런이 이전 계층의 모든 뉴런에 완전히 연결된다는 뜻입니다. 밀집 텐서 계층Dense는 보통 네트워크 끝을 지향하여 사용되며, 경우에 따라 여러 번 쓰일 때도 있습니다. 고성능 밀집 텐서 애플리케이션에 다층 인프라를 구축하려 할 때 가장 자주 쓰이는 라이브러리 중에 dten이라는 것이 있는데, 이것은 밀집 텐서를 저장, 조작하는 기능으로 잘 알려져 있습니다. 이 라이브러리는 정식 스토리지 형식으로 밀집 텐서를 저장하고 여러 스토리지 형식을 오가며 병렬식으로 변환하는 데 주안점을 둡니다. 또한 여러 가지 방식으로 텐서를 행렬 형태로 표시하도록 지원하기도 합니다. 이 라이브러리는 범용이며 높은 수준의 유연성을 제공합니다. 텐서는 주어진 행렬의 다차원 일반화라고 간주해도 됩니다. 수학적으로, 행렬 형태로 표시한다는 것은 단순히 텐서를 개념적(또는 논리적)으로 재구성하는 것에 불과합니다.

추가 자료

5X 리더

Gartner®: Databricks 클라우드 데이터베이스 리더

게시물을 놓치지 마세요

관심 있는 카테고리를 구독하고 최신 게시물을 받은편지함으로 받아보세요

다음은 무엇인가요?

4 Personas Analytics AIBI 3a

데이터 + AI 기초

1분 이내 소요

데이터 스토리텔링이란 무엇인가요?

10 Personas Data Management

데이터 + AI 기초

1분 이내 소요

데이터 엔지니어링이란 무엇인가요?