按需網絡研討會:Regeneron如何用Apache Spark加速生物銀行規模的基因組發現TM

基因組學領域已經成熟到一個階段,DNA測序項目已經達到人口規模。雖然許多組織已經投資於像英國生物銀行這樣的大型基因組數據集,但很少有專業知識或適當的技術架構來將這些大量的原始DNAseq數據轉化為可操作的見解。

Regeneron是一家領先的生物技術公司,致力於創造治療創新,已經建立了世界上最全麵的基因數據庫之一,擁有超過50萬個外顯子組。在將這些數據轉化為新的治療方法的過程中,Regeneron遇到了許多挑戰。例如,如何對>300B數據點進行快速而準確的查詢?如何加快對結核病規模數據進行新穎的統計檢驗?

在本次會議上,Regeneron將分享他們在建立世界上最大的基因數據庫時所麵臨的挑戰,他們如何通過由Apache Spark™、Databricks和AWS支持的可擴展和高性能的信息基礎設施克服這些挑戰,以及一路走來學到的關鍵經驗教訓。

參加本次網絡研討會,了解:

  • 關於基因組學在Regeneron加速藥物開發中的作用
  • 將50萬外顯子體和電子醫療記錄轉化為可操作的見解,他們麵臨著多大的挑戰
  • Apache Spark、Databricks和AWS如何使他們能夠輕鬆地擴展信息學並將查詢速度提高600倍
  • 演示由Apache Spark和Databricks支持的全基因組疾病風險評分的機器學習模型

立即觀看

Baidu
map