주요 컨텐츠로 이동
<
Page 6
>

델타 유니폼: 레이크하우스 상호운용성을 위한 범용 포맷

오픈 데이터 레이크하우스를 도입할 때 데이터에 가장 적합한 포맷을 선택하는 문제에 부딛히게 됩니다. 선택 가능한 포맷에는 Linux Foundation Delta Lake , Apache Iceberg...

구조화된 스트리밍에서 복수 상태 저장 연산자 사용하기

August 11, 2023 작성자: Angela Chu, Jungtaek Lim in
데이터 엔지니어링의 세계에는 ETL이 탄생할 때부터 사용되어 온 작업이 있습니다. 필터링과 조인(Join), 집계를 거쳐 마지막으로 결과를 저장하는 작업입니다. 이러한 데이터 작업은 오랜 시간동안...

Unity Catalog의 레이크하우스 페더레이션 기능을 소개합니다

레이크하우스 페더레이션 기능은 현재 퍼블릭 프리뷰(public preview) 단계입니다! 데이터 사용자들은 데이터 파편화, 데이터 통합에 소요되는 시간과 비용, 여러 시스템에 걸친 데이터 거버넌스 관리의...

데이터브릭스 SQL용 Materialized 뷰 및 스트리밍 테이블 소개

이제 Materialized 뷰와 스트리밍 테이블을 AWS 및 Azure의 Databricks SQL 에서 공개적으로 사용할 수 있게 되었다는 기쁜 소식을 알려드리게 되어 기쁩니다. 스트리밍 테이블은...

Delta Lake 3.0을 통해 새로운 Universal Format과 Liquid Clustering을 소개합니다

우리는 Linux Foundation 오픈 소스 Delta Lake 프로젝트 의 다음 주요 릴리즈인 델타 레이크 3.0을 지금 미리보기 로 체험해 보실 수 있게 되어...

Apache Spark의 새로운 프로그래밍 언어인 영어를 소개합니다

개요 우리는 Spark 환경을 더욱 풍부하게 만들어주는 혁신적인 도구인 Apache Spark용 영문 SDK를 공개하게 되어 기쁘게 생각합니다. 208개 국가 및 지역에서 연간 10억...

새로운 MLflow Experiment UI로 모델 개발 가속화

MLflow는 모델 개발 및 실험을 위한 최고의 플랫폼입니다. 수천 개의 데이터 사이언티스트가 매일 MLflow Experiment Tracking을 사용하여 parameter, 성능 메트릭 및 원본 정보를...

Hugging Face 트랜스포머 파이프라인을 사용한 NLP 시작하기

February 6, 2023 작성자: 폴 오길비, 매디 도슨 in
자연어 처리(NLP)의 발전은 기업이 텍스트 데이터에서 가치를 창출할 수 있는 전례 없는 기회를 열어주었습니다. 자연어 처리는 텍스트 요약, 명명된 엔터티 인식(예: 사람과 장소)...

Databricks에서 PyTorch Lightning(파이토치 라이트닝)으로 딥 러닝 가속화

PyTorch Lightning은 PyTorch 코드를 간소화하고 딥 러닝 워크로드를 부트스트랩할 수 있는 좋은 방법입니다. 그러나 레이크하우스의 모든 데이터를 사용하여 적시에 결과를 얻기 위해 워크로드를...

Databricks SQL 서버리스 이제 AWS에서 사용 가능합니다

Databricks SQL 이제 서버리스가 일반적으로 제공됩니다. 자세한 내용은 블로그를 참조하세요. 데이터 + AI 서밋, AWS의 퍼블릭 프리뷰에서 Databricks SQL (DBSQL)을 위한 서버리스를 발표하게...