考拉

重要的

這個文檔已經退休了,可能不會被更新。產品、服務或技術中提到的這些內容不再支持。看到熊貓API火花

請注意

考拉是棄用。如果你嚐試運行的集群上使用考拉磚運行時的10.0(不支持)以上,將顯示一個信息消息,建議你使用熊貓API火花代替。

考拉提供了一個替代熊貓。常用數據科學家,熊貓是一個Python包,它提供了簡單易用的數據結構和數據分析工具的Python編程語言。但是,大熊貓不規模大數據。熊貓考拉填補這一差距,提供相同的api, Apache火花。考拉是有用不僅為熊貓用戶還PySpark用戶,因為考拉支持許多困難的任務與PySpark,例如繪製數據直接從PySpark DataFrame。

需求

  • 考拉是包括集群運行磚運行時7.3到9.1。為集群運行磚運行時10.0及以上,使用熊貓API火花代替。

  • 使用考拉集群上運行磚或低於7.0運行時,安裝考拉磚PyPI圖書館

  • 在IDE中使用考拉、筆記本電腦服務器或其他自定義應用程序連接到一個磚集群,安裝磚連接並遵循考拉安裝說明

筆記本

以下筆記本顯示了如何從熊貓遷移到考拉。

熊貓,考拉的筆記本

在新標簽頁打開筆記本