엔지니어링 블로그 | Databricks Blog

Page 6

Apache Spark의 새로운 프로그래밍 언어인 영어를 소개합니다

개요 우리는 Spark 환경을 더욱 풍부하게 만들어주는 혁신적인 도구인 Apache Spark용 영문 SDK를 공개하게 되어 기쁘게 생각합니다. 208개 국가 및 지역에서 연간 10억...

MLflow는 모델 개발 및 실험을 위한 최고의 플랫폼입니다. 수천 개의 데이터 사이언티스트가 매일 MLflow Experiment Tracking을 사용하여 parameter, 성능 메트릭 및 원본 정보를...

자연어 처리(NLP)의 발전은 기업이 텍스트 데이터에서 가치를 창출할 수 있는 전례 없는 기회를 열어주었습니다. 자연어 처리는 텍스트 요약, 명명된 엔터티 인식(예: 사람과 장소)...

PyTorch Lightning은 PyTorch 코드를 간소화하고 딥 러닝 워크로드를 부트스트랩할 수 있는 좋은 방법입니다. 그러나 레이크하우스의 모든 데이터를 사용하여 적시에 결과를 얻기 위해 워크로드를...

Databricks SQL 이제 서버리스가 일반적으로 제공됩니다. 자세한 내용은 블로그를 참조하세요. 데이터 + AI 서밋, AWS의 퍼블릭 프리뷰에서 Databricks SQL (DBSQL)을 위한 서버리스를 발표하게...

Databricks는 수천 명의 고객이 머신러닝(ML)을 프로덕션에 도입할 수 있도록 지원해 왔습니다. Shell은 160개 이상의 활성 AI 프로젝트를 통해 수백만 달러를 절약하고 있습니다. Comcast는...

2021년 11월 2일, NVIDIA는 Databricks SQL 레이크하우스 플랫폼을 통해 가장 빠른 데이터 웨어하우스에 대한 공식 세계 기록을 세웠다 고 발표했습니다. 이러한 결과는 공식...

Databricks에서 이 노트북을 사용해 보세요 변경 데이터 캡처(CDC) 는 많은 고객이 Databricks에서 구현하는 사용 사례이며, 이 주제에 대한 이전 심층 분석 은 여기에서...

경제적인 유전체 서열 분석과 AI 지원 의료 이미지 영상이 등장하면서 정밀 의료에 대한 관심이 상당히 늘어났습니다. 정밀 의료에서는 데이터와 AI를 활용하여 최적의 치료...

Petastorm은 Apache Parquet 형식의 데이터 세트에서 딥 러닝 모델을 단일 머신 또는 분산 학습 및 평가할 수 있는 Uber의 인기 있는 오픈 소스...