阿斯利康為世界上一些最嚴重的疾病發現、開發並商業化了開創性藥物。新創新的最大障礙是無法比新數據的速度更快地利用所有可用的科學信息。他們需要一個平台,使他們能夠Beplay体育安卓版本建立可擴展的、高性能的數據管道,為機器學習模型提供數據,這些模型旨在幫助科學家做出有針對性的決策。借助Databricks,他們能夠利用數據和機器學習建立一個推薦引擎,使科學家能夠更容易、更快、更便宜、更有效地發現新的新藥。
眾所周知,新類型藥物的發現、開發和商業化可能需要10-15年的時間,研發投資超過50億美元,但隻有不到5%的藥物能夠進入市場。阿斯利康認識到這種創新速度是不夠的,因此轉向了數據驅動的方法,以提高藥物發現的成功率和更安全的臨床試驗管理。
然而,他們的科學家仍然無法利用手頭所有可用的科學信息迅速做出明智的決定。他們努力處理公司內部和外部公共數據庫中互不關聯的數據。此外,隨著新的科學研究繼續以快速的速度發布,幾乎不可能跟上科學發現的步伐。
阿斯利康利用Databricks Lakehouse平台來幫助建立一個生物學見解和事實的知識圖Beplay体育安卓版本譜。該圖表為推薦係統提供了動力,使阿斯利康科學家能夠利用所有可用數據,為任何疾病生成新的目標假設。
自從遷移到Databricks,阿斯利康現在能夠更容易地處理來自數千個來源的數百萬數據點。消除規模障礙使他們能夠更可靠地提取有意義的見解,從而產生旨在幫助人們過上更健康生活的新型藥物。
使用Databricks後,我們的性能得到了數量級的提升。”
——Eliseo Papa,阿斯利康計算生物學家
2019年歐盟Spark + AI峰會技術講座