經濟繁榮à生產繁榮
Redução nos customs de compute
Os consumidores compram com a Via, uma grande varejista brasileira com quase 100 milhões de clients, há mais de 60 anos。Mas, com décadas de dados desalinhados e canais em silos impactando como作為decisões有孔蟲(e ainda estão sendo) tomadas em toda organização, a equipe de dados da Via tem tem diuldade para conguir uma imagem completa da demanda do consumidor para moldar作為operações de negócios e作為considerações da cadeia de fornecimento。
Devido à longevidade e à natureza do negócio, a Via tinha muitos ambientes de transação tradicionais, incluindo um主機construído em Hadoop。Ao longo dos anos,一個empresa consolidou tudo com數據倉庫Teradata, complexo de gerenciar e incapaz de atender às必要的數據科學家,forçando-os一個criar e treinar modelos em筆記本電腦個人。Sem a capacidade de colaborar e escalar o treinamento em todo o conjunto de dados, os數據科學家não podiam avalaliar totalmente os insights no contexto das informações relacionadas。
“colaboração這是一個偉大的地方”,afirmou Cezar Steinz, Gerente de MLOps da Via。“Nós precisávamos這是一個完整的模型,24個問題bilhões de linhas de informações。É impossível treinar esses tipos de modelos em筆記本電腦。”
Isso resultou em uma diminuição da precisão na análise, o que desestabilizou tudo, desde jornada do cliente até a prevenção de fraudes, e acabou minando a receita e desacelerando o crescimento。A Via percebeu que, para capacitar total seus數據科學家和分析者的數據,精確的não apenas A uma camada de dados comisava, também da operatique capacidade seus de maneera高效率和協作para ajudalna otimização da cadeia de fornecmentento, previsão de demand de muito maiis。Para criar uma estructura de dados unified e otimizar análises e ML, a Via recorreu à Databricks。
組織數據磚Lakehouse沒有Azure permitiu是這個組織通過acessasse見解,resultam em melhores decisoes de negocios incluindo弗雷德rotatividade determinacao da比鄰星melhor oferta ou acao (NBO / NBA), deteccao e mitigacao de欺詐e desenvolvimento de莫德羅de precos, impulsionam conversoes e servicos de financas (personalizacao de credito e outras簡稱formas de pagamento)。
Com a abordagem de lakehouse, a Via agora tem uma visão comum de seus dados para análise e ML. O Delta Lake é usado para fornecer consistência e confiabilidade de dados à medida que a empresa cria pipelines ETL para alimentar dashboards de BI por meio de Com O Power BI, além de oferecer support ao treinamento de modelos de ML. Mais importante, a empresa é capaz de entregar, Com alto desempenho e confiança,O que é基本para atender às suas necessidades diárias de tomada de decisão。
“關於世界的數據governança老爸”,contou Steinz。“Com o Delta Lake,嗯,分析者的pode acessar os dados exatos necessários para abordar o caso de uso específico em questão。Se estivermos falando de uma transportadora logística, por exemplo, acessamos apenas tabelas de dados logísticos relevantes。O理想é que possamos compartilhar dados específicos com作為pessoas certas。”O Delta Lake também oferece à Via melhor rastreabilidade para que a empresa possa entender melhor como seus dados estão sendo usados e se podem reutilizar alguns de seus dados em不同的模態de ML。
一個特征存儲庫,一個數據科學家和分析者的數據存儲庫,一個數據科學家和分析者的數據存儲庫。Isso permitiu que les realmente unificassem não apenas seus dados, mas também as equique estão acessando e usando os dados para tomar decisões melhores e maiis inteligentes para os negócios。“一個完整的自然環境數據的特征存儲estável對模型的重新利用和重複使用的計算”,explicou Steinz。“數據科學家和分析者可以得到數據,可以得到數據não精確數據可以得到數據,可以得到數據,可以得到數據,可以得到數據”
Com seus dados centralizados no lakehouse, os analyistas da empresa usam o Databricks SQL para analisar dados rapidamente e comparlhar insights Com o restante das equipes por meio de dashboards e relatórios do Power BI。E, com MLflow, os數據科學家da Via podem gerenciar facilmente todo o ciclo de vida do ML, desde o rastreamento de versões do modelo até a execução de experimtos E a revisão dos resultados。“Criar um projeto com MLflow é de suma importância, pois viabiliza o empacotamento de um modelo para rodarmos em qualquer platform”,explica Steinz。“有意義的事情não有限製的事情à有影響的事情negócios”
Com o desempenho de dados em alta e a數據科學trabalhando Com todos os seus dados, a Via conseguiu desenvolver e implantar快速模型de ML que ajudam na previsão de rotatividade, recomendações de produtos, análise de fraude crédito e análise comportamental dos clientes。vários我們的權利之門experiência我們的權利之門às我們的權利之門conversão我們的權利vitalício我們的權利之門。Na parte de análises, uma visão unificada de seus dados erece a capacidade de extrair insights que ajudam a orientar estratégias desde a simplificação das operações da cadeia de fornecimento até機會para inovações de novos產品que encantam seus客戶。
Do ponto de vista operacional, a Databricks ajudou a reduzir os customs de compute a auumentar a colaboração entre equipes。Em toda a organização de dados, a Via percebeu um aumento de 30% na productividade, resultando Em uma economia total estimada de R$ 3,9 milhões。Com a ajuda da Feature Store e do gerenciamento automatizado de cluster, a empresa também observou uma queda de 25% nos custom de processamento de dados。
施泰因茨聲明:“與最高英勇相一致的部門às期望negócios com entregas rápidas”。“Isso só é possível por causa da Plataforma Databricks Lakehouse e dos especialistas por trás dela。”
Olhando para o futuro, com democratização dos dados profundamente enraizada em sua cultura, a Via está bem prepare para cumprir sua missão de realizar os sonhos dos client, aproveitando dados e IA para oferecer a melhor experiência de comppra possível。