醫學模型的困難
2021-08-12

在現實中,僅僅預測健康和疾病是不夠的,我們經常需要將醫療數據劃分為多個類別或標簽。舉例來說,僅通過心律檢查就可以判斷心律失常的程度,而要從分析中判斷房顫、室上性心動過速等哪種心律失常更為有效。


從理論上講,醫學模型生產廠家可以為每個標簽建立獨立的神經網絡模型,但是,將這些分類模型結合到神經網絡中,這樣的編碼是非常不現實的,如果將這些分類模型組合成一個神經網絡,返回多種預測結果將會更加有用。


答:要解決這個問題,醫學模型生產廠家可以使用一種方法,叫做“多類別分類”或“多標簽分類”。對于多類情況,數據樣本的分類是相互排斥的,而在多標簽情況下,數據樣本可以歸入多個類別。因為患者被診斷為肺不張(肺膨脹不全),所以在醫學領域,我們通常采用多標記分型,并不意味著他/她沒有心臟肥大。再一次向Sigmoid激活函數傳遞模型一層的分數,這樣一層的每一分都將被轉換為一個0到1的值,而不依賴于其他分數。


數據集大小挑戰。要處理醫療數據集,另一個挑戰是數據集的大小。醫學模型生產廠家基于良好的體系結構,大規模的數據集對模型的性能有著重要的影響,但對于疾病患者的數據量往往是不足的。因為數據集的小,導致了高、高的方差,使得模型很難推廣和優化。


答:為了解決模型優化的困難,我們可以使用一種稱為“遷移學習”的方法,在這種方法中,我們從相關網絡的底層學習,而不用從頭開始學習。由于已有的訓練,下層可以很好地用作特征提取器,因此我們可以根據數據集微調特征,這種方法優化速度更快,同時減少了訓練新模型所需的數據量。

相關行業知識

天天躁日日躁狠狠躁av麻豆,男同动漫GAY18禁网站,无码AV免费网站