Ir para o conteúdo principal

Como a HP Industrial Print Transformou sua Plataforma de Dados com o Databricks SQL

How HP Industrial Print Transformed Its Data Platform with Databricks SQL

Summary

A HP Industrial Print modernizou sua plataforma de dados migrando de uma arquitetura isolada e rígida para a Databricks Data Intelligence Platform, permitindo um onboarding mais rápido, governança aprimorada e compartilhamento de dados contínuo com clientes que produziram dados por meio de interações no aplicativo. Essa transformação aumentou o desempenho do pipeline em 40% e abriu novas oportunidades de receita por meio de produtos de dados escaláveis e monetização.

A Unidade de Negócios de Soluções de Software de Impressão Industrial (IPSS) da HP sempre esteve na interseção de hardware e software de ponta. O portfólio deles oferece software sofisticado e produtos analíticos, com fluxo de trabalho para impressoras digitais, monitoramento e analítica. Mas à medida que a demanda por impressão de alta velocidade, flexível e automatizada crescia, crescia também a necessidade de uma plataforma de dados mais inteligente e escalável. Apesar de robusta, a infraestrutura de dados legada da HP limitava sua capacidade de agir rapidamente, colaborar amplamente e capitalizar totalmente seus dados. É por isso que o PicPay recorreu à Databricks.

O papel dos dados na HP Industrial Print

Para entender a importância dessa transformação, vale a pena observar como os dados fluem na HP Industrial Print. Quando os clientes fazem pedidos de impressão, de tudo, desde embalagens personalizadas até gráficos de grande formato, a HP encaminha essas solicitações por meio de seu aplicativo exclusivo, PrintOS Site Flow. Esse sistema conecta o cliente a um da rede global de Provedores de Serviços de Impressão (PSPs) da HP, que atende ao pedido. À medida que o job avança do onboarding à impressão, embalagem e envio, os PSPs escaneiam códigos de barras e atualizam os status, criando uma rica transmissão de dados operacionais. Esses dados incluem pedidos, atribuições de provedores, especificações de materiais e Timestamp.

A partir dessa base, a HP extrai percepções para orientar as decisões de negócios. Os dashboards ajudam os PSPs a gerenciar as cargas de trabalho e o desempenho. As equipes de analítica internas usam os dados para monitorar o engajamento do cliente, otimizar as cadeias de suprimentos e garantir a precisão do faturamento. A HP também capacita seus parceiros ao expor esses dados para que os PSPs possam fazer sua própria analítica abrangente.

Em resumo, os dados são tanto uma espinha dorsal operacional quanto um ativo estratégico para a HP Industrial Print. Mas os sistemas que o sustentavam não estavam acompanhando.

Os desafios da arquitetura legada

Na configuração anterior, os dados fluíam do MongoDB através de um pipeline baseado em Kubernetes executado no Amazon EKS. Os datasets transformados chegavam ao Amazon Redshift para análise interna e ao Amazon RDS para atender a aplicações externas. Embora funcional, a arquitetura trazia certas desvantagens.

O compartilhamento de dados entre as unidades de negócios da HP era complicado e demorado, exigindo frequentemente pipelines personalizados ou exportações manuais de dados. A falta de uma arquitetura medallion significava que era um desafio rastrear a linhagem de dados ou reprocessar data histórica quando a lógica ou as regras de negócio mudavam. A governança era gerenciada em silos, o que levava a políticas de acesso inconsistentes.

Talvez o mais crítico é que essa arquitetura sufocava a inovação. A HP tinha ideias para novos produtos de dados — serviços que combinam dados internos e externos para fornecer percepções mais profundas ou gerar receita — mas não tinha a agilidade e a visibilidade para implementá-los.

Uma abordagem moderna de Lakehouse com o Databricks SQL

A nova arquitetura da HP, construída na Databricks Data Intelligence Platform, mudou completamente a equação. Os dados ainda são ingeridos do MongoDB, mas agora chegam a uma camada bronze no Amazon S3. A partir daí, os Jobs do Databricks transformam os dados por meio das camadas silver e ouro, aplicando verificações de qualidade e lógica de negócios em um ambiente otimizado para desempenho e escalabilidade.

Com o Unity Catalog, a HP agora consegue organizar os dados por finalidade de negócio e prontidão, implementando um controle de acesso granular e mantendo a linhagem e a auditabilidade completas. As equipes podem ver não apenas onde os dados estão, mas como eles fluem — quais transformações foram aplicadas, quem os acessou e quais produtos dependem deles.

Essa base permitiu rápidos ganhos em agilidade e desempenho. As equipes internas agora usam os warehouses do Databricks SQL para alimentar dashboards, executar análise ad hoc e até mesmo gerar query usando o Databricks Assistant com tecnologia de AI. Dashboards que antes ficavam lentos sob carga agora têm um desempenho consistente, mesmo durante os picos de ingestão de dados.

Igualmente transformador foi o impacto no compartilhamento de dados. Em vez de depender da replicação do RDS, a HP agora usa o Delta Sharing para compartilhar datasets ao vivo com PSPs externos de forma segura. Os parceiros não estão mais vinculados a uma ferramenta ou banco de dados específico. Eles podem conectar qualquer ferramenta de BI compatível com o Delta Sharing, incluindo o Apache Superset, para acessar dados atualizados sem replicação. Isso não apenas simplificou a arquitetura, mas também reduziu significativamente as despesas operacionais.

O mais interessante é que o Delta Sharing e as tabelas do sistema permitiram que a HP rastreasse os padrões de uso por parceiros e por dataset. Ao estabelecer essa visibilidade essencial, agora estamos posicionados para executar a estratégia de preços baseada no consumo que a HP Industrial Print pretende seguir. Essa estrutura nos permitirá personalizar os serviços com base no uso real e monetizar produtos de dados de alto valor de forma escalável e sustentável.

diagrama de arquitetura

Impacto nos negócios: velocidade e oportunidade

A mudança para o Databricks melhorou a arquitetura técnica, mudando a forma como a HP faz negócios. Ao remover sistemas redundantes e simplificar o compartilhamento de dados, isso permite que a plataforma de dados IPSS da HP elimine os silos de dados e habilite a organização de dados em camadas (Hot/Warm/Cold). O desempenho do pipeline melhorou em 40% e, ao contrário de antes, permaneceu estável mesmo quando os volumes de dados aumentaram. Além disso, a moderna plataforma de dados agora potencializa as cargas de trabalho de AI da Industrial Print.

O onboarding de clientes, que antes levava dias devido à configuração manual e ao provisionamento do banco de dados, agora leva menos de cinco horas. Isso permite que a HP coloque novos Provedores de Serviços de Impressão online mais rapidamente e com menos atrito.

Mas além dessas melhorias mensuráveis, a mudança mais significativa foi cultural. Com o Databricks, os dados não estão mais presos em silos ou escondidos atrás de barreiras de infraestrutura. Eles são acessíveis, governáveis e acionáveis. As equipes de negócios e técnicas da HP podem colaborar mais livremente, experimentar mais rapidamente e construir de forma mais inteligente — seja criando novos dashboards, testando um modelo de preços, ou combinando dados de várias unidades de negócios para descobrir novas percepções.

Olhando para o futuro

Modernizar sua plataforma de dados foi mais do que um projeto de infraestrutura para a HP. Foi uma evolução estratégica. Com o Databricks, a HP Industrial Print otimizou as operações, reduziu os custos com silos de dados e abriu modelos de negócios totalmente novos ao introduzir mais produtos de dados e monetização.

Em um setor onde velocidade, precisão e flexibilidade definem o sucesso, a HP agora tem uma plataforma de dados que corresponde à sua visão. De melhores decisões a melhores experiências do cliente e até mesmo novas fontes de receita, a Databricks está ajudando a HP Industrial Print Software Solutions a transformar seus dados em uma vantagem competitiva.

Quer saber como o Databricks pode te ajudar a simplificar sua arquitetura de dados, reduzir os custos com silos de dados e desbloquear novas oportunidades de negócio? Comece hoje com o Databricks SQL.

 

(This blog post has been translated using AI-powered tools) Original Post

Nunca perca uma postagem da Databricks

Inscreva-se nas categorias de seu interesse e receba as últimas postagens na sua caixa de entrada

O que vem a seguir?