這是為DEV全球展示挑戰賽(由Mux贊助)提交的作品。
我開發了MEN2 預測器,這是一款機器學習篩檢工具,用於檢測一種名為 MEN2 的罕見遺傳性癌症綜合徵,該綜合徵是由 RET 基因突變引起的。
MEN2 如果不及時發現,往往會導致甲狀腺髓樣癌。在印度,確診通常需要進行基因檢測,費用約為 2 萬盧比;因此,許多家庭會推遲或放棄檢測。
本計畫旨在探索常規血液標記和基本臨床特徵是否可以作為定序前的第一道篩檢屏障。
{% embed https://player.mux.com/Uc02omls5kFgnuB61sqv5vkN01y22bhxviStEL92PhXyQ %}
GitHub 程式碼庫:https://github.com/ArjunCodess/men2-predictor
線上示範(Gradio / Hugging Face):https://huggingface.co/spaces/arjuncodess/men2-predictor
此示範可讓您輸入臨床特徵,例如降鈣素、CEA、年齡和RET風險水平,並查看預測的癌症風險。
這一切源自於一個簡單的問題:為什麼挽救生命的診斷要花這麼多錢?
MEN2雖然罕見,但漏診會造成嚴重後果。大多數篩檢流程都假設能夠進行基因定序,但這在許多情況下並不現實。同時,臨床醫生已經採集了降鈣素和CEA等血液標記物,並追蹤了一些基本的臨床特徵。
我想看看能否更好地利用現有資料。
我透過匯總已發表研究中的真實患者資料建置了這個專案,並測試模型能否優先考慮安全性而非性能表現。關鍵要求很明確:漏診癌症病例是不可接受的。
基於20 項同儕審查研究的152 名真實病患資料進行訓練,涵蓋 **24 種 RET 變異體*
實現了五種不同的機器學習模型,用於交叉驗證和比較。
關注的是召回率(敏感度)而非標題準確性
在真實患者資料上實現了100%的召回率,未漏診任何已記錄的癌症病例。
明確測試了合成資料增強如何影響召回率
用 Python 編寫的端到端可重現流程,並帶有清晰的評估結果
使用 Gradio 部署了一個互動式演示,以實現透明效果。
該專案有意優先考慮可解釋性和安全性,而非複雜性。
這個專案並非孤立完成的,我要感謝那些為此做出重要貢獻的人。
我學校的12年級學生。她不在dev[dot]to上。
Harnoor 為此計畫的研究方面提供了大量幫助,包括尋找和整理相關的同行評審研究,以及協助獲取和整理用於模型開發的臨床資料。
本專案導師。
Shashwat 在整個開發過程中提供了指導,幫助審查了方法,並對最終流程的技術和研究決策提供了回饋。
他們的支持在將這個想法變成一個可行的、經過驗證的專案的過程中發揮了重要作用。
提交此專案即表示我確認我的影片符合 Mux 的服務條款:https://www.mux.com/terms
原文出處:https://dev.to/arjuncodess/i-built-a-zero-miss-cancer-screening-model-using-routine-blood-tests-5703