跳到主要內容
工程的博客

利用NLP檢測不良事件提高藥物安全性

分享這篇文章

不要錯過我們即將與約翰·斯諾實驗室進行的虛擬研討會,用NLP提高藥品安全,以了解更多有關藥物不良事件檢測的聯合NLP溶液加速器。

世界衛生組織定義藥物警戒作為"與檢測、評估、理解和預防不良反應或任何其他藥物/疫苗相關問題有關的科學和活動"。換句話說,藥物安全。

藥物警戒:現實世界中的藥物安全監測

雖然所有藥物和疫苗在臨床試驗中都經過嚴格的安全性和有效性測試,但隻有當這些產品被更大、更多樣化的患者群體(包括患有其他並發疾病的患者)使用時,某些副作用才可能出現。

為了支持持續的藥物安全,生物製藥製造商必須向監管機構報告藥物不良事件(ADEs),如美國的美國食品和藥物管理局(FDA)和歐盟的歐洲藥品管理局(EMA)。藥物不良反應或事件是在藥物治療或治療過程中發生的醫療問題。值得注意的是,ADEs與治療並不一定有偶然的關係。但總的來說,不良事件的主動報告是用於確保藥物安全的信號檢測係統的關鍵部分。

不良事件檢測需要正確的數據基礎

隨著收集到的數據越來越多,監測患者安全變得越來越複雜。事實上,隻有不到5%的ade是通過官方渠道報告的,絕大多數都是通過自由文本渠道獲得的:給患者支持中心的電子郵件和電話,社交媒體帖子,臨床醫生和製藥公司銷售代表之間的銷售對話,在線患者論壇等等。

強有力的藥物安全監測要求製造商、製藥公司和藥物安全組織監控和分析來自各種專業術語、格式、渠道和語言的非結構化醫療文本。為了有效地做到這一點,組織需要一個現代的、可擴展的數據和人工智能平台,可以提供科學嚴謹、接近實時的見解。Beplay体育安卓版本

前進的道路始於Databricks湖屋這是一個現代數據平台,它將數據倉Beplay体育安卓版本庫的最佳元素與雲數據湖的低成本、靈活性和規模相結合。這種新的簡化架構使醫療保健提供商和生命科學組織能夠將所有結構化數據(如emr中的診斷和程序代碼)、半結構化數據(如臨床記錄)和非結構化數據(如圖像)整合到一個單一的高性能平台中,用於傳統分析和數據科學。Beplay体育安卓版本

Databricks和John Snow Labs架構,用於使用NLP工具分析非結構化醫療保健文本數據。

在這些功能的基礎上,Databricks已與醫療保健自然語言處理(NLP)領域的領導者John Snow Labs合作,為醫療保健文本量身定製了一套強大的NLP工具。這是至關重要的,因為用於不良事件檢測的大部分數據都是基於文本的。你可以在我們之前的博客中了解更多關於我們與約翰·斯諾的合作,自然語言處理在大規模衛生文本中的應用

藥物不良事件檢測溶液加速器

為了幫助組織監控藥品安全問題,Databricks和John Snow實驗室建立了一個ADE的解決方案加速器筆記本使用NLP。正如我們在上一篇博客中所演示的,通過利用Databricks Lakehouse平台,我們可以使用預先訓練好的NLP模型從非結構化文本中提取高度專業化的結Beplay体育安卓版本構,並為不同的角色構建強大的分析和儀表板。在這個解決方案加速器中,我們將展示如何使用預先訓練的模型來處理對話文本,提取不良事件和藥物信息,並為藥物警戒構建一個Lakehouse,為各種下遊用例提供動力。

Databricks和John Snow Labs從非結構化文本中提取藥物不良事件的端到端工作流程,用於藥物警戒。

解決方案加速器遵循4個基本步驟:

  1. 大量攝入非結構化的醫學文本。
  2. 使用預訓練的NLP模型提取有用的信息,如不良事件(如腎損傷),藥物名稱和事件的時間接近實時。
  3. 將不良事件與藥物實體聯係起來以建立關係。
  4. 測量事件的頻率以確定重要性。

中包含的工作流的簡要摘要筆記本

藥品不良事件檢測工作流程概述

從原始文本數據開始,我們使用一個由已知ADE狀態的20,000文本組成的語料庫(4200個包含ADE的文本),並應用一種方法預訓練生物機器人模型來檢測ADE狀態,並根據地麵真相和分配準確性的置信水平評估模型的特異性和敏感性。此外,我們結合使用ner_ade_clinical和ner_posology模型,從對話文本中提取ADE狀態和藥物實體。

Databricks和John Snow Labs解決方案使用ner_ade_clinical和ner_posology模型的組合,從對話文本中提取ADE狀態和藥物實體。

通過簡單地在管道中添加一個階段,我們可以檢測ADE的斷言狀態(當前、缺席、過去發生等)。

用於此解決方案的Databricks和John Snow Labs NLP管道可以檢測ADE的斷言狀態。

為了推斷ADE與臨床實體之間的關係狀態,我們使用預訓練的模型(re_ade_clinical),該模型檢測臨床實體(在本例中為藥物)與推斷ADE之間的關係。

Databricks和John Snow Labs解決方案使用預訓練的模型(re_ade_clinical),該模型檢測臨床實體(在本例中為藥物)與推斷出的ADE之間的關係。

sparknlp_display庫能夠顯示原始文本之間的關係以及它們之間的語言關係和依賴關係,如下所示。

使用Databricks和John Snow Labs解決方案,sparknlp_display庫能夠顯示原始文本上的關係以及它們的語言關係和依賴關係,如下所示。

在ADE和藥物實體數據處理和關聯之後,我們可以構建強大的儀表板來實時監控ADE和藥物實體對的頻率。

在ADE和藥物實體數據經過處理和關聯後,用戶可以構建強大的儀表板來實時監控ADE和藥物實體對的頻率。

開始在Databricks上使用NLP分析藥物不良事件

有了這個解決方案加速器,Databricks和John Snow Labs可以輕鬆分析大量文本數據,幫助進行實時藥物信號檢測和安全監測。要使用此解決方案加速器,可以預覽筆記本電腦並直接導入到您的Databricks帳戶。筆記本包括安裝相關的John Snow Labs NLP庫和許可密鑰的指導。

您也可以訪問我們的行業頁麵,以了解更多關於我們的醫療保健而且生命科學解決方案。

免費試用Databricks
看到所有工程的博客的帖子
Baidu
map