Redução no tempo de criação do pipeline de dados
Cargas de trabalho ETL mais rápidas
À medida que o setor de varejo se digitaliza rapidamente em todos os canais, a Columbia é pioneer ira na exploração de dados em todas as áreas de negócios: vendas, compras, cadeia de suprimentos e otimização de produtos。Por exemplo, a empresa queria entender como proveitar insights relacionados à geografia, afinidade com a marca, margens brutas e customs para melhorar as operações e tomar decisões mais inteligentes。Também estava procururdo usar os dados de entralento do client a partir de avaliações e comentários para melhorar as campanhas de marketing e o support ao client。
A empresa tinha uma grande quantidade de dados na ponta dos dedos, mas o processamento de dados em batch ou em tempo real ficou aquém dos ac鄂爾多斯internos de nível de serviço para análises下遊e relatórios。A equipe de gerenciamento de informações corporativas (EIM) estava sendo precicada por ferramentas ETL specializas e數據倉庫去數據化,分段電子poco escaláveis。我們的自由之路às需要之路várias需要之路negócios,我們的自由之路necessários。Além disso, sua infrestructura era muito rígida e cara para manter e expansion, o que era um problem diante das crescent solicitações de acesso aos dados。
“Às vezes, nossos sistemas legados levavam semanas para processar dados para fins de análise e geração de relatórios”,explicou Lara Minor, gerente sênior de dados corporativos da Columbia運動服。“Portanto, não我們的人民支持我們的國家,我們的國家insatisfação分析家funções negócios。”
De executivos分析師De dados e數據科學家,muitas equipes cobiçam dados De toda a empresa。Assim, foi necessário mudar平台de sistema de análise e migrar para a nuvem para ganhar agilidade e rentabilidade em escala。Também精確計算preparação關於ETL的簡單計算,關於計算的簡單計算às關於計算的簡單計算fácil關於計算的簡單計算decisões關於計算的簡單計算。
Ao adotar o微軟Azure,一個配備de EIM達哥倫比亞蔚藍數據庫和奧三角洲湖para atualizar seus recursos de análise e processamento de dados。“Queríamos uma solução escalável, elástica e mais econômica”,解釋Lara Minor。“Azure Databricks參加了一個três critérios。”
Com Databricks, a equiagora está criando管道ETL de alto desempenho que podem激光雷達Com cargas de trabalho em batch e em tempo real。三角洲湖的輸油管道是食物的來源。“O Delta Lake oferece recursos ACID que simplificam as operações de pipeline de dados para melhorar a conffiabilidade e a consistência dos dados”,explicou Minor。"我的節奏,我的記憶indexação automática我的記憶,我的記憶indexação automática我的記憶,我的記憶indexação automática "
Depois que os dados são ingeridos, eles são roteados para不同終點corporativos, dependdo usuário最後e do caso de uso。Por範例,os分析者de negócios對權力的協調者的影響,para produzir relatórios de vendas que exigem informações要求實際的速度。Eles podem então criar notebooks interativos da Databricks para disponibilizar esses dados para data scientists que explorarão e treinarão modelos。Os dados também podem ser enviados para uma ferramenta de數據倉庫para casos de uso que組合baixa latência e高並發。Todas as equique precisam de acesso aos dados agora podem ter total confiança em sua confiabilidade e consistência。
進程的速度é基本的洞察速度negócios。A數據權限的一個裝備的哥倫比亞acelerasse o ETL e A preparação的dados,還原速度的criação做管道的ETL em 70%的速度的過程的速度,da的carga de trabalho ETL的quatro horas的apenas和cinco分鍾- isso é 48 vezes mais rápido做que antes。
equipment adas com uma plataforma escalável e eficiente capaz de processar cargas em batch e em tempo real, todas as category orias de usuários de dados agora têm a capacidade de tomar melhores decisões que beneficiam as operações de negócios, sem依賴da equipe de EIM。
“Esta平台是一個偉大的優勢:os usuários一個偉大的進步。Todos os dados são reunidos lá, e cada vez mais unidades de negócios estão usando a plataforma de maneira自助服務,o que antes era impossível。, afirmou Lara Minor。“哥倫比亞數據的極端印象和積極影響”。
Com dados選擇na ponta dos dedos, os casos de uso - desde previsão das demandas dos consumidores até a análise de avaliações de produtos para aumentar a satisfação do client - estão sendo impulse por dados。Como Lara Minor também credita, não há limite para Como a equipe na Columbia pode usar os dados para tomar decisões mais inteligentes e moldar o futuro dos negócios。