客戶的故事
人工智能如何改變藥物研發

工業:生命科學

解決方案:推薦引擎

Beplay体育安卓版本平台用例:三角洲湖數據科學機器學習ETL

雲:AWSAzure

阿斯利康為世界上一些最嚴重的疾病發現、開發並商業化了開創性藥物。新創新的最大障礙是無法比新數據的速度更快地利用所有可用的科學信息。他們需要一個平台,使他們能夠Beplay体育安卓版本建立可擴展的、高性能的數據管道,為機器學習模型提供數據,這些模型旨在幫助科學家做出有針對性的決策。借助Databricks,他們能夠利用數據和機器學習建立一個推薦引擎,使科學家能夠更容易、更快、更便宜、更有效地發現新的新藥。

太多的數據會減慢決策速度

眾所周知,新類型藥物的發現、開發和商業化可能需要10-15年的時間,研發投資超過50億美元,但隻有不到5%的藥物能夠進入市場。阿斯利康認識到這種創新速度是不夠的,因此轉向了數據驅動的方法,以提高藥物發現的成功率和更安全的臨床試驗管理。

然而,他們的科學家仍然無法利用手頭所有可用的科學信息迅速做出明智的決定。他們努力處理公司內部和外部公共數據庫中互不關聯的數據。此外,隨著新的科學研究繼續以快速的速度發布,幾乎不可能跟上科學發現的步伐。

  • 基礎設施複雜性:找到允許靈活性但不需要持續維護的基礎設施。
  • 大量互不關聯的數據:負責從100多個數據源(包括內部數據源和公共數據源(包括技術文獻、公共數據庫等)中攝取、解析和分析數百萬個數據點。
  • 努力擴展操作,以支持開源Python筆記本的數據科學工作。

更快的數據管道推動ML創新

阿斯利康利用Databricks Lakehouse平台來幫助建立一個生物學見解和事實的知識圖Beplay体育安卓版本譜。該圖表為推薦係統提供了動力,使阿斯利康科學家能夠利用所有可用數據,為任何疾病生成新的目標假設。

  • 全管理平台:簡化集群管理和大Beplay体育安卓版本規模分析資源的維護。
  • 構建規模化、高性能的數據管道:能夠跨巨大的科學文獻庫和數據源利用NLP進行下遊分析。
  • 加速機器學習創新:數據科學家被授權建立和訓練模型,提供排名預測,幫助他們做出更明智的決策。

用人工智能改變藥物的發現方式

自從遷移到Databricks,阿斯利康現在能夠更容易地處理來自數千個來源的數百萬數據點。消除規模障礙使他們能夠更可靠地提取有意義的見解,從而產生旨在幫助人們過上更健康生活的新型藥物。

  • 提高運營效率:集群管理和集群自動伸縮等功能改進了從數據攝取到管理整個機器學習生命周期的操作。
  • 更好的數據科學生產力:支持多種語言的共享筆記本環境提高了團隊工作效率。
  • 更快的time-to-insight:由Databricks提供支持的推薦引擎提高了他們做出更明智假設的能力,使他們能夠加快新藥物和藥物的上市時間。
  • 數百萬
    來自數千個來源的數據點

使用Databricks後,我們的性能得到了數量級的提升。”

——Eliseo Papa,阿斯利康計算生物學家

相關內容


2019年歐盟Spark + AI峰會技術講座

Baidu
map