跳轉到主要內容

術語表

無所不包的

什麼是事務?在數據庫和數據存儲係統的環境中,事務的任何操作都被視為單個的工作單元,完成完全或不完全,和樹葉存儲係統的缺點{…}
梯度下降法是最常用的優化方法部署在機器學習和深度學習算法。它是用來訓練機器學習模型。類型的梯度下降法有三個主要類型的梯度下降法{…}
替代數據是什麼?替代數據收集的信息通過使用替代來源的數據其他人不使用;非傳統的信息來源。替代數據的分析可以提供見解除此之外的{…}
異常檢測是識別罕見的事件或觀察的技術可以提高懷疑被統計不同於其他的觀察。這樣的“反常”行為通常轉化為某種形式的一個問題{…}
Apache蜂巢是什麼?Apache蜂巢是開源數據倉庫軟件閱讀,寫作,和管理大型數據集從Apache Hadoop分布式文件係統中提取(HDFS),更大的Hadoop生態係統的一個方麵。與exten{…}
Apache撚角羚是什麼?Apache撚角羚是一個自由和開放源碼Apache Hadoop柱狀存儲係統發達。這是一個引擎用於結構化數據,支持低延遲隨機存取millisecond-scale訪問單個行{…}
Apache麒麟是什麼?分布式開放源碼Apache麒麟是聯機分析處理(OLAP)引擎互動分析大數據。Apache麒麟被設計來提供SQL接口和多維分析(OLAP) Hadoop / S{…}
Apache火花是什麼?Apache火花是一個開源的分析引擎用於大數據的工作量。它可以處理兩個批次以及實時分析和數據處理工作負載隻Apache引發2009年開始作為一個研究項目{…}
Apache火花作為服務是什麼?Apache火花是一個開源集群計算框架,用於快速實時大規模數據處理隻自2009年成立以來在加州大學伯克利分校的AMPLab,引發了主要的增長。目前它是類風濕性關節炎{…}
人工神經網絡是什麼?一個人工神經元網絡(ANN)是一個計算係統的手術後的神經元在人類的大腦。人工神經網絡如何工作?人工神經網絡可以是最好的{…}
自動化的偏見是什麼?自動化的偏見是一種過度依賴自動化艾滋病和決策支持係統。自動化輔助決策係統的可用性日益增加等關鍵決策上下文重症監護病房,{…}
貝葉斯神經網絡是什麼?貝葉斯神經網絡(bnn)指擴展後的標準網絡推理為了控製過度學習。從更廣泛的角度來看,貝葉斯方法使用統計方法{…}
數據和大數據分析的區別在Hadoop的發明之前,現代存儲和計算技術支撐係統相對基礎,限製公司主要分析“小數據。”Even this relat{…}
生物信息學是一個研究領域,使用計算從海量生物數據中提取知識。生物信息學是指利用生物技術來存儲,檢索、組織和分析生物數據。{…}
火花SQL是催化劑優化器的核心,它利用高級編程語言特性(例如Scala的模式匹配和準引號)小說的方式來構建一個可擴展的查詢優化器。催化劑是基於功能的程序{…}
複雜事件處理(CEP)是什麼?複雜事件處理(CEP)也稱為事件,流或事件流處理技術的使用存儲在數據庫或前查詢數據,在某些情況下,沒有被年代{…}
連續應用程序是一個端到端的應用程序,對數據進行實時的反應。特別是,開發人員想要使用一個連續的應用程序編程接口來支持方麵目前在不同的處理{…}
在深度學習,卷積神經網絡(CNN或事先)是一種深層神經網絡,通常用於識別模式出現在圖像但他們也用於空間數據分析、計算機視覺、自然語言{…}
數據分析平台是什麼?Beplay体育安卓版本數據分析平台是一個生態係統的服務和Beplay体育安卓版本技術,需要執行大量的分析,複雜和動態數據,允許您檢索,結合,相互作用,探索和visua{…}
數據治理是什麼?數據治理是監督,以確保數據帶來價值和支持商業策略。數據治理不僅僅是一種工具或一個過程。它將使用f數據相關業務戰略需求{…}
什麼是數據Lakehouse ?數據lakehouse是一個新的、開放數據管理體係結構,結合了靈活性,成本效益,和規模的數據湖泊與數據管理和數據倉庫的ACID事務,支持業務int{…}
什麼是數據集市?數據集市是策劃設計的數據庫包括一組表為單個數據的特定需求服務團隊,社區,或業務部門,如市場營銷或工程部門。它通常從小型{…}
數據共享是什麼?數據共享是能夠使相同的數據可用於一個或多個消費者。如今,不斷增長的數據量已成為一種戰略資產對任何公司。共享數據,組織內部或外部{…}
數據保險庫是什麼?數據保險庫是一個數據建模設計模式用於構建一個企業級數據倉庫分析。數據保險庫有三種類型的實體:中心,鏈接和衛星。中心代表核心業務的概念,{…}
什麼是數據倉庫?數據倉庫是一種數據管理係統,將來自多個源的當前和曆史數據存儲在一個商業友好的方式更容易的見解和報告。數據倉庫通常用於業務{…}
磚運行時上運行的軟件構件集的集群機器由磚。它包括火花,還添加了許多組件和更新,大大提高可用性、性能和安全的{…}
什麼是DataFrame ?DataFrame是一種數據結構,將數據組織成一個二維表的行和列,就像一個電子表格。DataFrames是最常見的一種數據結構在現代數據分析,因為它們使用{…}
數據集是類型安全的版本的火花的結構化的Java API和Scala。這個API是在Python和R,因為這些都是動態類型語言,但它是一個強大的工具用Scala編寫大型應用程序和Java。Recal{…}
深度學習是什麼?深度學習是機器學習的一個子集涉及大量數據和算法受到人類大腦的結構和功能,這就是為什麼經常referre深度學習模型{…}
需求預測是什麼?需求預測是預測消費者需求的過程(相當於未來的收入)。具體地說,它預計的各式各樣的產品消費者會購買使用定量和定性數據。受潮濕腐爛{…}
密度張量值存儲在一個連續的連續的內存塊,所有值表示。張量或多維數組中使用一組不同的多維數據分析應用程序。有很多軟件刺激{…}
什麼是數字的雙胞胎?數字雙的古典的定義;”“數字雙是一個虛擬模型旨在準確反映物理對象。””——IBM [KVK4]一個離散的或連續的生產過程,一個數字的雙胞胎聚集{…}
DNA序列是什麼?DNA序列的過程中確定的確切的核苷酸序列的DNA(脫氧核糖核酸)。,測序DNA的順序四個化學積木——腺嘌呤、鳥嘌呤、胞嘧啶、胸腺嘧啶{…}
生活表δ生活表(DLT)可以輕鬆地構建和管理可靠數據管道三角洲湖上提供高質量的數據。,了解更多關於ETL數據磚,ETL是什麼?隨著我{…}
工程特性工程機器學習功能,也稱為數據預處理的過程是將原始數據轉化為特性,可用於開發的機器學習模型。本主題描述的主要概念{…}
基因組學領域內遺傳學擔心一個有機體的基因組的測序和分析。它的主要任務是確定整個序列的DNA或原子的成分構成DNA和之間的化學鍵DN{…}
什麼是Hadoop集群?Apache Hadoop是一個開源的、基於java、軟件框架和並行數據處理引擎。它使大數據分析處理任務被分解成更小的任務可以並行執行{…}
HDFS HDFS (Hadoop分布式文件係統)是主要的存儲係統由Hadoop應用程序使用。這種開源框架是通過迅速節點之間傳輸數據。它常常被公司需要處理和存儲大數據。{…}
Hadoop生態係統是什麼?Apache Hadoop生態係統是指各種組件的Apache Hadoop軟件圖書館;它包括開源項目以及一個完整的範圍的補充工具。一些最知名的工具{…}
在計算中,哈希表(散列映射)是一種數據結構,它提供了幾乎直接訪問對象基於關鍵(一個獨一無二的字符串或整數)。一個哈希表使用一個哈希函數計算成一個數組索引桶或槽,從製作{…}
一個蜂巢日期函數是什麼?蜂巢提供了許多內置函數來幫助我們在處理和查詢的數據。這些函數提供的一些功能包括字符串操作、操作日期,類型轉換,conditi{…}
托管火花是什麼?Apache火花是一個快速和大數據集群計算係統建立在速度、易用性和先進的分析,最初建於2009年在加州大學伯克利分校。它提供高級api在Scala中,Java, Py{…}
什麼是Jupyter筆記本?Jupyter筆記本是一個開源的web應用程序,它允許數據科學家創建和共享文檔,包括代碼,方程,和其他多媒體資源。Jupyter筆記本使用佛是什麼{…}
Keras模型是什麼?Keras深度學習是一個高級庫,Theano和Tensorflow之上。寫在Python和提供一個清潔和方便的方式來創建一係列深度學習模型隻Keras已經成為{…}
什麼是Lakehouse零售嗎?磚的第一特定於行業的Lakehouse Lakehouse零售。它可以幫助零售商通過解決方案加速器快速啟動和運行,數據共享能力,和合作夥伴生態係統。Lakehouse佛{…}
λ架構是什麼?λ架構是一種處理大量的數據(即。“大數據”)提供批處理和流處理方法的混合方法。λ架構用於求解{…}
Apache火花的機器學習庫(MLlib)被設計為簡單起見,可伸縮性,並且很容易與其他工具的集成。與可伸縮性、語言兼容性,和速度的火花,科學家可以專注於他們的數據問題和國防部{…}
機器學習模型是什麼?機器學習模型是一個程序,可以找到從以前看不見的數據集模式或做決定。例如,在自然語言處理,機器學習模型可以正確解析和recogni{…}
管理的火花是什麼?火花管理服務允許您利用開源數據批處理工具,查詢、流媒體和機器學習。通過使用這種自動化您需求能夠快速創建集群,m{…}
MapReduce是什麼?MapReduce是一個基於java的、分布式的執行框架Apache Hadoop生態係統內隻它帶走了分布式編程的複雜性,讓開發人員實現的兩個處理步驟:1)和地圖{…}
管道/物化視圖數據磚δ介紹三角洲管道提供了一組api和UI管理生命周期的數據管道。這個開源框架有助於數據簡化ETL開發工程團隊,提高dat{…}
一個圖案架構是什麼?大獎章的體係結構是一種數據設計模式用於lakehouse邏輯上組織數據,逐步逐步的目標和改進的結構和質量數據流經ea{…}
通常運行時機器學習算法,它包括一係列的任務,包括預處理、特征提取、模型擬合,驗證階段。例如,當分類文本文檔可能涉及文本分割和c{…}
MLOps是什麼?MLOps代表機器學習操作。MLOps是機器學習的核心功能工程,集中在簡化過程中機器學習模型來生產,然後維護和監控。米{…}
模型風險管理的監督是指潛在的不良後果的風險決策基於不正確或濫用模型。風險管理模型的目的是使用技術和實踐,將識別、測量和{…}
Multi-Statement事務磚磚三角洲表支持Multi-Statement交易如果底層表數據磚三角洲表隻這意味著所有的語句在事務將atomi{…}
神經網絡是什麼?神經網絡計算模型的分層結構類似於大腦中的神經元的網絡結構。它功能相互聯係的處理元素稱為神經元產生outpu一起工作{…}
開放的銀行是什麼?開放銀行業是一種安全的方法來提供消費者的財務數據,取決於客戶的同意。²受到監管,技術和競爭動態,開放銀行成本的民主化的呼聲{…}
編製是什麼?編排多個計算機係統的協調和管理,應用程序和/或服務任務串聯起來,以更大的工作流程或流程執行。這些過程可以由{…}
整體設備效率是什麼?整體設備效率(OEE)是衡量製造業如何操作使用(設施、時間和材料)相比,它的全部潛力,在預定的時期{…}
數據科學時,毫不誇張地說,你可以改變你的生意的方式是通過使用其潛能和熊貓DataFrame。要做到這一點,你需要正確的數據結構。這些將幫助你ef{…}
拚花是什麼?Apache拚花是一個開源的,用於數據文件格式設計高效的數據存儲和檢索。它提供了高效的數據壓縮和編碼方案與增強的性能來處理複雜的數據{…}
個性化的金融是什麼?金融產品和服務日益商品化和消費者越來越挑剔的媒體和零售行業增加了他們喜歡個性化的體驗。,仍{…}
預測分析是什麼?預測分析是一種先進的分析,使用新的和曆史數據來確定模式和預測未來的結果和趨勢。預測分析是如何工作的呢?預測分析{…}
預見性維護是什麼?預測性維護,簡而言之,就是弄清楚當一項資產應該維護,具體需要執行維護活動,基於資產的實際情況或狀態,早期{…}
PyCharm是一個集成開發環境(IDE)用於計算機編程、創建Python編程語言。當使用PyCharm磚,默認情況下PyCharm Python創建了一個虛擬環境,但您可以配置克雷亞{…}
PySpark是什麼?Apache火花是用Scala編程語言寫的。PySpark已經發布為了支持Apache火花和Python的合作,它實際上是一個Python API的火花。此外,wi PySpark,幫助你接口{…}
實時數據為零售是什麼?實時零售數據的實時訪問。從批量訪問、分析和計算將使數據是“永遠在運行”,從而獲得準確、及時的決策和商業智能。{…}
抽樣是主要麵向用戶的API引發自成立以來。核心,一個抽樣是一個不可變的分布式數據的元素集合,跨中節點集群,可以並行操作的低級API{…}
雪花模式是什麼?雪花模式是一個多維數據模型是一個星型模式的延伸,在維度表分解成個子維度。雪花模式通常用於商業智能和再保險{…}
如果你正在與火花,你將遇到三個api: DataFrames,數據集,和抽樣彈性分布式數據集是什麼?抽樣或彈性分布式數據集,與分布式計算是記錄的集合,{…}
火花的應用程序由一個驅動過程和一組執行程序的過程。司機流程運行main()函數,坐在集群中的一個節點,並負責三件事:維護信息引發程序;res{…}
火花Elasticsearch是什麼?火花Elasticsearch NoSQL,分布式數據庫存儲,檢索和管理麵向文檔和半結構化數據。GitHub開源,RESTful Apache Lucene搜索引擎之上,r{…}
許多數據科學家,分析師和一般商業智能用戶依賴於交互式探索數據的SQL查詢。火花SQL是一種火花為結構化數據處理模塊。它提供了一個編程抽象稱為DataFrames和可以{…}
Apache火花流是Apache火花的流的上一代引擎。有引發流不再更新,這是一個遺留項目。有一個新的和更容易使用流引擎Apache火花稱為結構性壓力{…}
引發性能調優是什麼?火花性能調優的過程是指記錄內存調整設置,核心,和實例使用的係統。這個過程保證了火花有一個完美的性能也很強{…}
Sparklyr是什麼?Sparklyr之間提供了一個接口是一個開源包R和Apache火花。您現在可以利用R火花的能力在現代環境中,由於火花與分布式數據交互的能力與小l{…}
SparkR火花的工具運行R。它遵循同樣的原則作為引發的所有其他語言綁定。使用SparkR,我們隻是將其導入我們的環境並運行我們的代碼。它非常類似於Python API除了它跟隨{…}
Python提供了一個內置庫稱為numpy操縱多維數組。這個庫是一個主要的組織和使用要求開發pytensor圖書館。Sptensor代表稀疏的張量是一個類。水療中心{…}
星型模式是什麼?星型模式是一個多維數據模型用來組織數據在數據庫中,這樣很容易理解和分析。明星模式可以應用於數據倉庫,數據庫,數據集市和其他工具。聖{…}
流分析是如何工作的呢?流分析,也稱為事件流處理,是巨大的分析的當前和“運動”數據池通過使用連續查詢,稱為事件流。這些流觸發的{…}
結構化流是一個高級API 2.2流處理,生產就緒的火花。結構化流允許您采取同樣的操作,執行批處理模式使用火花的結構化的api,並運行他們的壓力{…}
在2015年11月,Google發布了它為機器學習,並命名為TensorFlow開源框架。它支持深度學習、神經網絡和一般數值計算cpu、gpu和集群gpu。一個最大的效果顯著{…}
Tensorflow估計API是什麼?估計是一個完整的模型也看起來直觀足以減少用戶。估計量的API提供了一些方法來訓練模型,來判斷模型的準確性,並生成預測。TensorFlow{…}
轉換是什麼?在火花,核心數據結構創建不可變意味著他們無法改變一次。這可能似乎是一個奇怪的概念,如果你不能改變它,你應該如何使用它呢?為了“改變”{…}
鎢項目是什麼?鎢的代號是傘項目修改Apache火花的執行引擎,關注大幅提高火花應用程序的內存和CPU的效率,推進性能{…}
統一的人工智能或可用在F8今年宣布了Facebook。這彙集了2特定深度學習框架,Facebook創建和外包——PyTorch專注於研究假設進入大規模計算r{…}
統一數據分析是一個新的類別統一數據處理與人工智能技術的解決方案,使得企業組織和AI更加可行的使它們加速AI倡議。統一數據分析使其e{…}
磚的統一數據分析Platform 幫助組織加快通過統一數據科Beplay体育安卓版本學與工程和業務創新。與磚作為統一的數據分析平台,您可以快速準備和幹淨的數據質量Beplay体育安卓版本{…}
一個統一的數據倉庫是什麼?一個統一的數據庫也被稱為一個企業數據倉庫持有所有組織的業務信息,使其可訪問整個公司。大多數公司今天,數據管理{…}
Apache Hadoop是一個基於java的開放源碼的軟件平台管理大數據應用程序的數據處理和存儲。Beplay体育安卓版本平台通過Beplay体育安卓版本分發Hadoop大數據在集群中的節點計算和分析工作,打破它們{…}
Baidu
map