實施大規模機器學習磚和埃森哲
2020年4月7日 在公司博客上
Atish射線客座博客,應用情報和Nathan Buesgens埃森哲谘詢公司董事總經理,經理,埃森哲
雖然許多機器學習飛行員成功,縮放和操作完全成熟的應用程序提供關鍵業務成果仍然是一個關鍵的挑戰。埃森哲和磚合作克服這一點,Atish雷寫道,埃森哲谘詢公司董事總經理應用智能,專門從事大數據和人工智能。
2019年,機器學習(ML)應用程序和平台吸引了平均Beplay体育安卓版本全球420億美元的資金。盡管這一承諾,縮放和操作全麵毫升應用程序仍然是一個關鍵的挑戰,尤其在商業環境中,許多長期的工業化毫升尚未意識到的好處。
雖然毫升是因其學習能力模式的數據,隨後提高性能和結果基於經驗,擴展的障礙是多種多樣的。例如,缺乏良好的管理的元數據的端到端毫升生命周期可能會導致基本信任和可跟蹤性問題。所需的技能和技術的快速發展,傳統的經營模式和業務流程的潛在不相容,特別是,在移動毫升構成障礙從試點階段投入生產應用。
好消息是,最新進展和可用性的幾個AI和ML技術取得了必要的工具民主化和工業化毫升應用程序的生命周期。越來越受歡迎和使用公共雲使得組織能夠存儲和處理更多的數據比以往更高效率利用25毫升的先決條件應用規模和最高效地運行。
創新來自開源社區支持的公司如磚了最先進的產品,允許科學家、工程師和建築師共同協作和快速構建和部署毫升應用程序。,過去需要一個機器學習的博士學位,現在已經被抽象成各種各樣的軟件工具和服務,這是民主化較為多樣化的用戶使用。
把所有這一切與一個行業的深入了解和它的數據,和顯然從來沒有一個更好的時間組織大規模部署和運營毫升。
什麼使ML生命周期的一個複雜、協作過程?beplay娱乐ios
監控如果毫升持續結果業務在一段時間內,深入了解的人,流程和技術毫升生命周期的每個階段(圖1)是至關重要的。從一開始,關鍵利益相關者必須對齊究竟是他們需要實現的業務。
在業務上下文中,的最佳實踐之一是首先優先一個或兩個業務挑戰周圍建立一個最小可行產品或MVP由最初的基礎。一旦建立和必要的數據準備,一個實驗階段發生來確定正確的模型對於任何給定的問題。
模型被選中後,測試,調整完成,毫升應用程序準備好實施。傳統上,這項工作需要這一點已經數據科學家關注的大部分時間。然而,為了實施大規模、模型可能需要部署在特定的平台,比如雲平台,或者集成到麵向用戶的業務應用程序。Beplay体育安卓版本
一旦這一切完成之後,下一步是監視和優化性能的這些學習模型作為他們部署到生產環境中,在那裏他們提供具體結果如提出建議和預測或監視某些類型的操作效率。
在一個案例中,例如,在線廣告公司在日本是利用毫升為廣告交付創建目標客戶列表。beplay体育app下载地址他們成功地創建精確的模型,但遭受高運營成本的建築模型和評估目標的結果。有迫切需要規範化和自動化過程的措施。
為了解決這個問題,埃森哲來構建一個可重用的腳本工具,實現訓練、測試和驗證模型。腳本從一個GUI前端,集成了ML流使輕鬆部署,大大減少了DevOps規模所需的時間和精力。
在另一起案件中,一個大型醫藥零售商在美國正竭力與8000萬+基地成員通過提供由其忠誠計劃。它需要一種方法來增加隆起,但除了手動流程,沒有係統構建一個可靠的、統一的和可再生的ML管道評估數十億的組合提供了數百萬的客戶在持續的基礎上。beplay体育app下载地址
埃森哲的個性化引擎開發和交付數據磚平台構建、火車、測試、驗證和部署模型的規模,在成千上萬的客戶,提供數十億美元,成千上萬的產品。beplay体育app下载地址Beplay体育安卓版本自動ML模式部署過程和現代化智能管道也部署。結果是顯著降低了DevOps的時間和精力在部署模型,估計和業務能夠實現20%的利潤率較高的飛行員零售店。
工業技術構建塊毫升是什麼?
利用建立與確立了等專家作為構建塊的兩種情況概述above-accelerates的構建和部署這些類型的項目,可以迭代,逐步擴展和應用日益複雜的業務成果。
幫助客戶建立和運營這些毫升應用,埃森哲與磚。埃森哲是利用磚平台建立的關鍵技術基礎需要解決的三個核心領域工業ML:協作Beplay体育安卓版本、數據依賴和部署(圖2)。
磚的統一分析數據平台支持關鍵技術組件的三個基本領域,和埃森哲已經發展出Beplay体育安卓版本了一套額外的技術組件和集成數據磚平台共存。這也包括一套可重用的組件,加快協作,提高理解的數據和簡化操作部署。
最終,這一夥伴關係的目的是簡化的方法,已被證明成功的大規模部署。
基於豐富的實施經驗,我們知道工業化毫升的組織開發和部署是解決我們解決三個基本領域:
協作
跨組織邊界分析社區的全麵合作,管理和共享的特性和模型,是成功的關鍵。作為一個協beplay娱乐ios作環境,磚工作空間提供了一個空間數據工程師和科學家可以共同探索數據集,構建模型迭代和執行實驗和數據管道。MLflow是一個關鍵的組件從磚和開源項目合作在ML生命周期從實驗到部署和允許用戶跟蹤模型性能,版本和可重複的結果。
埃森哲將工具包模型和特性的工程對於許多場景,例如一個推薦引擎,接連毫升應用全生命周期。它利用行業知識成功的模型,使基線生產反饋告知校準工作。
數據依賴
我們不能強調足夠的可用數據集訪問和理解的重要性和相關元數據驅動成功的結果。我們的數據依賴項組件捕獲準則、規則形狀數據,並提供可視化的圖表來幫助評估數據質量。這提高了數據采集的速度和內容管理,進一步加速了解工程的數據和提高效率的功能。
磚平台提供了一些功能來提高數據Beplay体育安卓版本質量和加工性能。三角洲湖,可用作為磚的一部分,是一個開源存儲層,支持ACID事務和數據質量特性,並將可靠性數據的湖泊在規模。Apache火花大數據提供了一個高度可擴展引擎和ML,高性能的額外增強從磚。
部署
而實驗需要數據科學知識應用正確的解決方案,正確的行業問題,部署需要集成,跨職能團隊。我們部署組件使用元數據驅動的方法來構建和部署毫升管道代表連續工作流程從開始到驗證。通過啟用標準和部署模式,這些組件可以實施實驗。
的磚企業雲服務是一個簡單的、安全的和可伸縮的托管服務,支持高性能毫升管道的統一部署和應用程序。更重要的是,部署和管理的治理結構生產模型和漂移也可以啟用。這些組件集成在一起,從磚和埃森哲交付重要加速度毫升的部署生命周期在AWS和Azure雲。
在部署大規模毫升之前的關鍵因素是什麼?
對於那些考慮毫升的工業化方法,有幾個關鍵問題先考慮。它們包括:
- 業務涉眾對齊毫升需要解決的業務問題和主要成果需要達到的期望嗎?
- 是正確的角色和技能以規模和監控毫升部署申請成功的實驗?
- 是必要的基礎設施和自動化的需求理解和工業化毫升可用的解決方案嗎?
- 數據科學團隊有正確的運營模式,標準和推動者需要避免重大部署再造一次實驗做了什麼?
工業化毫升時,它可以容易先建立一個很深的技術基礎,解決生命周期的各個方麵。然而,往往這種方法風險的業務成果和遇到的挑戰與采用,花和對齊方式。
相反,我們經曆了成功的迭代開發這些基金會在關鍵業務環境中,通過構建連續周期交付增量業務成果。
關於埃森哲
埃森哲是全球領先的專業服務公司,提供範圍廣泛的服務和解決方案的策略,谘詢、數字技術和操作。結合無與倫比的經驗和專業技能在40多個行業和所有業務功能——世界最大的交付網絡支撐的埃森哲交集的業務和技術,幫助客戶改善他們的表現和他們的利益相關者創造可持續的價值。有超過492000人在120多個國家,服務客戶埃森哲推動創新來改善世界工作和生活的方式。在訪問我們www.accenture.com。
本文檔是由谘詢公司埃森哲一般指導。它並不打算提供具體建議在你的情況下。如果你需要建議或進一步的細節在任何問題提到,請聯係您的埃森哲的代表。
本文檔是描述性的引用可能屬於別人的商標。這種商標的使用本不是一個斷言這樣的商標所有權由埃森哲和並不打算代表或暗示的存在,埃森哲與這些商標的合法所有者。
版權©2019埃森哲。保留所有權利。埃森哲谘詢公司,它的標誌,和高的性能。交付。是埃森哲的商標。