Ir para o conteúdo principal

Desvendando o futuro da indústria automotiva (Parte 1): entendendo a analítica geoespacial escalável & AI

Impulsionando a inovação automotiva e de mobilidade com dados geoespaciais em tempo real, AI e analítica escalável

Unlocking the future of the Automotive Industry

Summary

  • Descubra como a Databricks permite que as empresas automotivas aproveitem dados geoespaciais, de telemática e de sensores em tempo real.
  • key casos de uso incluem segurança viária, manutenção preditiva, otimização de infraestrutura e gerenciamento de ativo/frotas, todos habilitados por analítica geoespacial escalável.
  • Esses recursos de analítica geoespacial e AI na Databricks permitem que as empresas alcancem melhorias de até 30% na eficiência da frota, reduzam os custos de infraestrutura em até 25% e possibilitem uma maior segurança viária, diminuindo as taxas de acidentes em até 20%.

Introdução

A indústria automotiva está passando por uma data-driven transformação, usando grandes volumes de dados geoespaciais, telemáticos e de sensores para impulsionar a inovação em AI. À medida que veículos, infraestrutura e sistemas de mobilidade se tornam cada vez mais conectados, esses dados ajudam a enfrentar desafios como segurança no trânsito, manutenção preditiva, planejamento de infraestrutura para veículos elétricos e logística sustentável.

Com um TAM projetado crescendo de US$ 53,79 bilhões em 2024 para US$ 165,67 bilhões até 2032, a oportunidade é enorme. Por exemplo, o Departamento de Energia dos EUA observa que a direção agressiva, como aceleração rápida e frenagem brusca, pode aumentar o consumo de combustível em até 33%. O coaching de drivers com base em telemática ajuda a reduzir esses comportamentos e a diminuir os custos com combustível. A manutenção preditiva baseada em telemática também reduziu drasticamente o tempo de inatividade dos veículos em até 80%, aumentando a eficiência operacional.

O Databricks capacita as organizações a aproveitarem essas oportunidades, oferecendo análise geoespacial escalável e em tempo real. Com funções geoespaciais integrada, integrações de AI e suporte a arquiteturas modernas, a plataforma permite a criação de aplicativos com reconhecimento de localização que geram impacto real nos negócios.

Este blog de duas partes aborda (Parte 1) os key casos de uso e datasets geoespaciais nos setores automotivo e de mobilidade, e (Parte 2) como o Databricks acelera as analítica geoespaciais e a AI de nível de produção com exemplos de código e melhores práticas.

Entendendo o problema

As organizações do setor automotivo enfrentam uma complexidade crescente no gerenciamento e na análise do grande volume de dados provenientes de veículos conectados, infraestrutura e plataformas. Equipes isoladas, arquiteturas fragmentadas e recursos limitados em tempo real geralmente bloqueiam o acesso a percepções preditivas.

O Databricks resolve isso oferecendo uma plataforma unificada e escalável para processar dados geoespaciais, treinamento de modelos de AI e permitir a colaboração multifuncional. Dentre esses recursos, a Analítica Geoespacial surge como um facilitador key para viabilizar uma tomada de decisão mais inteligente e orientada por localização em casos de uso de alto impacto.

O restante deste blogs explora como a Databricks ajuda as organizações automotivas a usar a analítica geoespacial para superar esses desafios e gerar resultados mensuráveis.

Casos de uso de analítica geoespacial

As organizações que não conseguem aproveitar a analítica geoespacial geralmente enfrentam ineficiências como planejamento de rotas ineficiente, tempo de inatividade inesperado do veículo e tomada de decisões reativa. Ao integrar dados geoespaciais com AI, as empresas podem obter percepções em tempo real para melhorar a segurança, a eficiência e a qualidade do serviço em suas operações. Os principais casos de uso incluem:

  • Segurança Viária e Previsão de Risco: oferece uma solução de analítica geoespacial com tecnologia de AI que combina dados de pontos críticos de acidentes, clima e trânsito com a telemática de veículos em tempo real para prever trechos de estrada de alto risco e informar proativamente os drivers sobre locais com propensão a acidentes ao longo de sua rota, ajudando a prevenir incidentes.
  • Mobilidade inteligente: aplique analítica geoespacial com tecnologia de IA para otimizar rotas, oferecer serviços públicos sob demanda e melhorar a eficiência logística, aumentando assim a qualidade de vida dos cidadãos.
  • Seguro baseado na direção: permite que as seguradoras avaliem com precisão os perfis de risco dos drivers usando dados geoespaciais e de mobilidade, oferecendo tarifas melhores para drivers mais seguros.
  • Otimização da infraestrutura de VEs: aproveite as percepções baseadas em localização para posicionar estrategicamente as estações de recarga em áreas de alta demanda, melhorando a utilização das estações.
  • Manutenção preditiva: use a telemática em tempo real e as analíticas orientadas por AI para prever as necessidades de manutenção, reduzindo o consumo de combustível, o tempo de inatividade e os custos operacionais.

Datasets Essenciais para analítica Geoespacial e AI

Os dados são essenciais para a inovação automotiva, principalmente quando combinados com analítica geoespacial e inteligência artificial. A utilização de dataset relevantes com ontologias claramente definidas permite que as empresas automotivas obtenham percepções acionáveis, melhorem a tomada de decisões e melhorem seus resultados financeiros. Estes são alguns dos dataset recomendados para criar analítica geoespacial no setor automotivo e de mobilidade.

Nesta postagem, usamos como referência dados públicos da cidade de Nova York devido à sua acessibilidade e abrangência. Esses datasets representam os pilares fundamentais para analisar o comportamento do tráfego, a segurança nas estradas e os impactos ambientais. O blogs usa dados de NYC como demonstração, mas a abordagem é flexível e pode ser dimensionada com dataset maiores e de propriedade da organização.

  • O dataset Colisões fornece registros detalhados de incidentes de trânsito, incluindo datas, locais e fatores contribuintes, como comportamento do driver ou condições da via, facilitando a análise de segurança e a mitigação de riscos.
  • O Volume de Tráfego dataset fornece informação histórica sobre densidade e congestionamento do tráfego, auxiliando no planejamento eficiente de rotas e na previsão de tráfego.
  • O dataset Condição da via oferece data histórica e em tempo real sobre interdições de vias, obras e incidentes, permitindo a gestão proativa da segurança e eficiência do transporte.
  • Os dados meteorológicos, incluindo temperatura, precipitação, velocidade do vento e visibilidade, apoiam a correlação das condições climáticas com os padrões de direção e os resultados de segurança.
  • O Trips dataset captura registros de viagens individuais, como horários de embarque/desembarque, distâncias, tarifas, CEPs e tipos de viagem (por exemplo, táxi, compartilhamento de caronas), servindo como um dataset fundamental para analisar padrões de mobilidade, comportamento dos passageiros e eficiência do serviço em diferentes meios de transporte.
  • Os dados de telemática, que fornecem métricas de direção como velocidade, aceleração, frenagem e escolhas de rota, permitem que as organizações desenvolvam modelos analíticos sobre a segurança do comportamento ao dirigir e a manutenção preditiva.

Juntos, esses datasets capacitam as empresas automotivas a otimizar operações, aprimorar a experiência do cliente e gerar um impacto mensurável nos negócios. Em resumo, para viabilizar analítica geoespacial rica, os clientes devem considerar uma infinidade de pontos de dados, combinando dataset proprietários e fontes públicas. Abaixo está um exemplo de modelo de dados bronze com os datasets discutidos acima:

Example of Bronze Tables Used in Road Safety Medallion Pipeline

Entendendo a telemática e o CAN: a espinha dorsal da telemetria de veículos

Dados de telemática se referem a informações do veículo coletadas por meio de sensores de bordo, GPS e sistemas integrados. Eles incluem detalhes como localização, velocidade, aceleração, frenagem, eficiência de combustível e diagnósticos, permitindo percepções sobre o desempenho do veículo, o comportamento do driver e o gerenciamento de frotas.

No centro da telemetria está a Controller Area Network (CAN), um protocolo de comunicação amplamente utilizado que conecta as Unidades de Controle Eletrônico (ECUs) em um veículo. Originalmente projetado para simplificar a fiação interna do veículo, o barramento CAN permite uma comunicação eficiente, confiável e priorizada, baseada em mensagens, usando sinais diferenciais para reduzir o ruído elétrico.

Variantes como CAN 2.0, CAN FD e CAN XL oferecem velocidades e capacidades de carga útil diferentes, adequadas para uma variedade de aplicações automotivas.

Para os engenheiros de dados, isso apresenta um desafio: ingerir transmissões de telemetria de alta frequência, intermitentes e priorizadas, decodificar quadros CAN brutos em percepções utilizáveis e dar suporte ao processamento em tempo real para analítica e aplicativos subsequentes.

Entendendo a analítica geoespacial escalável

A analítica geoespacial escalável refere-se à capacidade de processar e analisar volumes massivos de dados baseados em localização, geralmente em escalas de petabytes e exabytes, em tempo real, permitindo que as organizações extraiam percepções significativas de padrões espaciais complexos em grandes áreas geográficas.

A Data Intelligence Platform da Databricks combina analítica geoespacial poderosa e AI para fornecer percepções escaláveis e em tempo real. Com recursos como o Liquid Clustering e as funções espaciais H3, ela permite o processamento rápido e eficiente de datasets geoespaciais massivos. As funções geoespaciais integradas simplificam tarefas espaciais, como mapear padrões de tráfego ou avaliar riscos nas estradas. O AutoML acelera o desenvolvimento de modelos para casos de uso como a previsão de direção agressiva, considerando as condições climáticas, de tráfego e da estrada. A plataforma também garante uma governança robusta por meio do Unity Catalog (UC), que gerencia o acesso e o compartilhamento de dados com segurança. Ferramentas como o AI Query e as funções governadas pelo UC facilitam a extração de dados de geolocalização estruturados de fontes não estruturadas, aumentando a precisão e a produtividade.

Habilite a Governança Escalável & a Colaboração Aberta

O Databricks oferece analítica geoespacial poderosa, combinando compute de alto desempenho, arquitetura flexível e funções espaciais integrada. A execução com Photon e o Serverless fornecem processamento rápido e econômico, ideal para joins espaciais em grande escala, agregações e queries de ponto em polígono em datasets como rastros de GPS, fluxos de tráfego e dados ambientais.

O suporte nativo para indexação H3, funções espaciais e previsão de séries temporais permite que as equipes analisem padrões de mobilidade, detectem anomalias e prevejam tendências usando dados históricos e em tempo real.

A analítica geoespacial escalável requer uma governança robusta. Unity Catalog (UC) centraliza metadados e controles de acesso, garantindo o gerenciamento seguro e em conformidade de datasets espaciais, modelos e dashboards. O UC oferece suporte a acesso refinado, linhagem de dados e colaboração confiável entre equipes.

O UC também se integra ao Delta Sharing, permitindo a colaboração segura de dados tempo-real entre OEMs, fornecedores e parceiros de mobilidade, sem a necessidade de copiar os dados. Por exemplo, uma montadora pode compartilhar dados de perigos na estrada com um provedor de navegação para aprimorar o roteamento, mantendo uma governança rigorosa. Juntos, o UC e o Delta Sharing oferecem suporte à troca de dados aberta, mas controlada, algo essencial para as soluções de mobilidade data-driven de hoje.

Pipeline para mobilidade inteligente e segurança viária

Apresentamos abaixo um pipeline de analítica geoespacial desenvolvido na Databricks Data Intelligence Platform. Ele integra dados de telemática, tráfego e clima com recursos como Automated Liquid Clustering, indexação H3, AutoML e funções de AI para dar suporte a casos de uso em tempo real, como segurança viária. Ele ilustra um pipeline medallion que combina dados geoespaciais, LLMs e Genie para percepções conversacionais.

A Importância dos Dados Sintéticos

Dados sintéticos de telemática — dataset gerados artificialmente que imitam cenários do mundo real — oferecem uma maneira segura e eficaz de testar e desenvolver sistemas sem expor informação de identificação pessoal (PII). Isso permite analítica que preserva a privacidade, desenvolvimento de modelos e validação de sistemas, ao mesmo tempo que garante a compliance regulatória.

A telemática é um caso de uso ideal para dados sintéticos, pois permite testes realistas sem acessar dados sensíveis do veículo. Embora os desenvolvedores possam gerar esses dados usando SQL ou Python, o Databricks Labs Data Generator (dbldatagen) simplifica o processo com uma interface declarativa para criar grandes datasets escaláveis no Spark.

Na Parte 2, mostraremos como criar dados de telemática com dbldatagen — com localização GPS, velocidade, aceleração, Timestamp, uso do cinto de segurança, status do limpador de para-brisa e outros —, ideais para modelagem, validação ou teste de pipeline, sem depender de dados de produção.

O impacto

Ao aproveitar a analítica geoespacial juntamente com a inteligência artificial e os recursos de processamento de dados tempo-real, a Databricks permite que a indústria automotiva reduza os custos de manutenção e melhore a segurança viária, descobrindo percepções transformadoras. Ao utilizar a arquitetura escalável e unificada da Databricks, as organizações podem efetivamente melhorar a segurança viária por meio de analítica avançada, otimizar a infraestrutura de veículos elétricos prevendo com precisão a demanda e os padrões de uso, e melhorar a eficiência operacional da frota por meio de recursos de monitoramento em tempo real e manutenção preditiva.

As organizações que buscam garantir uma vantagem competitiva devem considerar explorar os recursos avançados de analítica geoespacial e inteligência artificial da Databricks, que permitiram às empresas alcançar melhorias de até 30% na eficiência da frota, reduzir os custos de infraestrutura em até 25% e aprimorar os resultados de segurança no trânsito por meio de percepções preditivas que diminuem as taxas de acidentes em até 20%.

Colocando em prática: os próximos passos

Na Parte 2 desta série, demonstramos como dar vida a essas percepções usando o Databricks, abordando pipelines escaláveis, dados sintéticos, geração de rotas, previsão de séries temporais e enriquecimento geoespacial baseado em LLM.

 

(This blog post has been translated using AI-powered tools) Original Post

Nunca perca uma postagem da Databricks

Inscreva-se nas categorias de seu interesse e receba as últimas postagens na sua caixa de entrada