Mais rápido para extrair insights graças às operações de TI aprimoradas
Mais rápido para processar dados de veículos e estradas
特拉讚多inovações para o mercado com mais velocidade
“Antes da Databricks, o tempo de lançamento沒有商業價值,或até有必要提供資料análise有需要的客戶。Hoje, isso acontece em questão horas。”
A fim de criar英勇para seus客戶,wejo ingere dados de streaming de 50 milhões de veículos conectados, processando dados de OEMs e sistemas de navegação por satélite A cada três segundos。Esses dados são indicores para melhorar o fluxo de tráfego, reduzir acentes, emitir alertas de segurança e informar serviços de emergência e até inovar para otimizar estacionamentos。Todos esses fluxos de dados vêm de fontes differes: extrair insights deles por meio da數據科學é um desafio real e consome muitos recursos。
老爸們的大卷:一個進程três trilhões老爸們的pontos de dados por mês,連續傳送veículos para o mercado em menos de 40 second。Isso requer um ambiente que combine baixa latência e alta capacidade。
Desafios em larga escala: para ingerir essa enorme quantidade de dados, wejo contou com群集Mapreduce, que possuem dimensões rígidas e sofrem com limitações em termos de bibliotecas disponíveis。O resultado foram dias de atraso世界語que os módulos Python necessários fossem instalados, um verdadeiro freio para inovação。
Desempenho lento: os jobs mais longos às vezes levavam horas ou até dias para ser processados。
A數據庫à wejo uma plataforma de análise de dados uniificada que facility A criação de um ambiente escalável e colaborativo entre as equipes de data science e gengenharia de dados。Isso permite que as equipes de dados forneçam inovações baseadas em ML mais rapidamente à indústria automotiva。
一個計算集群的簡單計算和簡單規定的平台。
一個compatibilidade com diversas linguagens (SQL, Scala, Python, R) melhora colaboração entre數據工程,數據科學和分析師。
一個兼容的原生com三角洲湖permite que裝備數據工程執行形式上的維度confiável操作管道,批量流處理mesmos dados。
Com Databricks, a Wejo agora é capaz de processardados em escala核準o機器學習可以快速進行操作,簡化操作。我是重要的,我是一個大老板fácil de compartilhar result tataos entre as equie organização e capacitar out pessoas a trazer inovação para o mercado。
Ganho de eficiência操作性:Recursos como dimensionamento automático de cluster melhoraram as operações de data engineering。Os pipeline de análise下遊,特別是,passaram de semanas para minutos。
Melhor colaboração entre裝備:O ambiente de notebook comppartihado compatível com várias linguagens aumentou a productividade da equipe。
Tempo de análise reduzido:com數據,agora estamos vendo um desempenho 20 vezes melhor do que o Spark, uma ferramenta de código aberto。自由的節奏lançamento沒有機會,我有90%的機會。