開源
Gli ingegneri di磚園子我creatori di alcune delle tecnologie開源/ la gestione一些蒂稍utilizzate絕對的
我nostri progetti開源稍noti
Apache Spark è un motore unico per eseguire carichi di lavoro per ingegneria dei dati, data science e ML.
Apache Spark è un motore unico per eseguire carichi di lavoro per ingegneria dei dati, data science e ML.
Apache火花™
Apache火花e聯合國motore整合每eseguire carichi di lavoro每ingegneria一些蒂數據科學e毫升。
Delta Lake consente di costruire un'architettura lakehouse su sistemi di storage come AWS S3, ADLS, GCS e HDFS.
Delta Lake consente di costruire un'architettura lakehouse su sistemi di storage come AWS S3, ADLS, GCS e HDFS.
三角洲湖
三角洲湖consente di costruire聯合國'architettura lakehouse蘇sistemi di存儲AWS S3, ADLS, GCS e HDFS。
MLflow gestisce il ciclo di vita ML, con sperimentazione, riproducibilità, implementazione e un registro centralizzato dei modelli.
Redash consente a tutti di utilizzare SQL per esplorare, interrogare, visualizzare e condividere dati da sorgenti di piccola e grande entità.
Delta Sharing è il primo protocollo aperto per la condivisione sicura dei dati, che semplifica la condivisione con altre organizzazioni.
磚supporta altre tecnologie開源非常分散
Databricks supporta TensorFlow, una libreria per deep learning e calcolo generico su cluster
Facebook, creatore di PyTorch, e Databricks hanno collaborato alle integrazioni
API di Deep Learning scritte in Python che girano su TensorFlow. Disponibili in Databricks Runtime per ML.
Una suite open-source di strumenti per data science collaborativa che utilizza R
Pacchetto Python molto utilizzato per machine learning basato su NumPy, SciPy e Matplotlib
XGBoost
每linguaggi Libreria軟件di regolarizzazione del gradient Python, R e C + +
起程拓殖
每creare HashiCorp起程拓殖e uno strumento開源甚diffuso聯合國'infrastruttura sicura e di servizi雲蘇prevedibile diversi提供者。起程拓殖consente ai Il提供者磚性能di gestire合唱我洛spazi di lavoro磚e Il飯館戴爾'infrastruttura反對聯合國整合strumento potente e flessibile。L 'uso di起程拓殖門inoltre我反對infrastruttura性能廣告adottare最佳實踐來配置(IaC)