Perguntas frequentes sobre a Databricks
Básico
A empresa sabe que os dados escondem um verdadeiro tesouro, e a missão da sua equipe é encontrá-lo. Mas é difícil brincar de detetive com um monte de ferramentas mal projetadas e uma infraestrutura difícil de instalar. Você quer se tornar o herói que consegue entender tudo o que acontece na empresa, mas passa a maior parte do tempo lutando com suas ferramentas.
Projetamos a Databricks para simplificar o big data. O Apache Spark™ deu um grande passo nessa direção ao fornecer uma estrutura unificada para projetar pipelines de dados. A Databricks leva esse conceito além, fornecendo uma plataforma de nuvem sem necessidade de gerenciamento construída com base no Spark e apresentando 1) clusters Spark totalmente gerenciados, 2) um workspace interativo para exploração e visualização, 3) um agendador de pipelines de produção e, por fim, 4) uma plataforma para alimentar seus aplicativos favoritos baseados em Spark. Então, em vez de ser uma dor de cabeça, os dados finalmente permitem que você se concentre em encontrar soluções que tenham um efeito imediatamente mensurável em seus negócios.
Disponibilidade
Técnico
Atualmente, a Databricks oferece suporte ao envio de arquivo baseado em navegador, busca de dados do Azure Blob Storage, AWS S3, Azure SQL Data Warehouse, Azure Data Lake Storage, armazenamentos de dados NoSQL como Cosmos DB, Cassandra, Elasticsearch, JDBC, HDFS, Sqoop e várias outras fontes de dados compatíveis nativamente com o Apache Spark.
Implantação
Até o momento, a Databricks está disponível no Microsoft Azure, na Amazon AWS e no Google Cloud.
Segurança
Os dados dos usuários da Databricks são lidos e persistem em seus próprios repositórios de dados, com suas próprias credenciais.