Hoje, estamos introduzindo a Prévia Pública dos Pacotes de Ativos Databricks na área de trabalho. Isso facilitará o trabalho de cientistas de dados, analistas e engenheiros de dados ou IA de maneira interativa no espaço de trabalho com as melhores práticas, como controle de versão, testes e CI/CD. Os membros da equipe podem colaborar diretamente usando pastas Git na interface da área de trabalho e não precisam usar um CLI.
Gerenciar estrutura, controle de versão e implantação segura são fundamentais para qualquer fluxo de trabalho de engenharia de dados confiável. Pacotes de Ativos Databricks facilitam isso permitindo que você defina trabalhos, pipelines, notebooks e configurações como código - implantáveis em diferentes ambientes e prontos para integração com CI/CD.
Milhares de equipes de engenharia de dados já usam pacotes para produzir seus fluxos de trabalho, aplicar melhores práticas e colaborar através do Git. Mas um pedido consistente se destacou:
"Posso usar isso diretamente no espaço de trabalho, sem precisar do CLI ou do VS Code?"
Hoje, estamos cumprindo essa solicitação.
Esta atualização estende ferramentas que muitas equipes já conhecem: a área de trabalho, pastas Git, e pacotes de ativos. Agora, você pode desenvolver e implantar pacotes totalmente dentro do Databricks: basta abrir uma pasta Git, definir seu pacote e implantá-lo com um clique. A etapa clara de Implantar garante que a promoção de mudanças de desenvolvimento para produção seja intencional, seja acionada por um usuário da área de trabalho ou por meio de CI/CD.
No total, você pode:
Isso simplifica o processo de desenvolvimento dentro das pastas Git. Isso traz estrutura para como o trabalho progride do desenvolvimento para a produção, alinhando-se com as práticas padrão de software e tornando o processo acessível a uma gama mais ampla de usuários.
Ao trabalhar em uma pasta Git, os usuários podem iterar rapidamente em alterações não confirmadas. Trabalhos de desenvolvimento, pipelines e outros recursos definidos no pacote referenciam automaticamente os arquivos mais recentes - não é necessário sincronização manual. Este comportamento é alimentado por source_linked_deployment
, que está habilitado por padrão no modo de desenvolvimento permitindo uma iteração e feedback mais rápidos.
Continuamos a melhorar a experiência. Atualizações futuras ir ão:
Seja você está construindo pipelines de dados, treinando modelos ou criando painéis, os pacotes de ativos em pastas Git oferecem um caminho colaborativo e estruturado para passar da ideia à produção - tudo dentro do espaço de trabalho do Databricks.
Alternativamente, você pode clonar um repositório existente com pacotes ou exemplos existentes, como https://github.com/databricks/bundle-examples.
Nota: Certifique-se de que a pré-visualização esteja habilitada para uso (veja abaixo)
Saiba mais: documentação.
(This blog post has been translated using AI-powered tools) Original Post