基因組學領域已經成熟到一個階段,DNA測序項目已經達到人口規模。雖然許多組織已經投資於像英國生物銀行這樣的大型基因組數據集,但很少有專業知識或適當的技術架構來將這些大量的原始DNAseq數據轉化為可操作的見解。
Regeneron是一家領先的生物技術公司,致力於創造治療創新,已經建立了世界上最全麵的基因數據庫之一,擁有超過50萬個外顯子組。在將這些數據轉化為新的治療方法的過程中,Regeneron遇到了許多挑戰。例如,如何對>300B數據點進行快速而準確的查詢?如何加快對結核病規模數據進行新穎的統計檢驗?
在本次會議上,Regeneron將分享他們在建立世界上最大的基因數據庫時所麵臨的挑戰,他們如何通過由Apache Spark™、Databricks和AWS支持的可擴展和高性能的信息基礎設施克服這些挑戰,以及一路走來學到的關鍵經驗教訓。
參加本次網絡研討會,了解: