【第171期 December 5, 2011】
 

研發新視界

談資料探勘技術應用於醫療資訊系統

作者/黃昭瑋

[發表日期:2011/12/5]


前言

現代人身處在資訊爆發的時代,如何快速又準確的找到重要資料,整合吸收到的資訊做出合適的決策,愈來愈重要了。若能夠運用資訊技術的輔助醫師能夠更加快速準確的施行診斷,相信將有助於醫療品質與醫病關係提升。

何為資料探勘 (Data Mining)

可解釋為資料庫之知識發掘(Knowledge Discovery in Databases,簡稱KDD)。也就是說可以從一個大型資料庫裡頭所儲存的大量資料當中萃取出有趣知識,這個大型資料庫有可能是線上作業的資料庫 (on-line database),也有可能是資料倉儲 (data warehouse)。

資料探勘的興起應可以歸功於三大技術的成熟:[註1]

一、大量資料的收集技術:由於網際網路的發達、關聯式資料庫(relational database)的應用廣泛、再加上全面性的資料整合技術成熟,使得資料的收集變得輕而易舉。

二、高效能的多處理器電腦架構:透過平行處理的多處理器架構,可促使大量資料的處理及運算能在可容忍的時間內完成。

三、資料探勘演算法的成熟:諸如統計學(statistics)、人工智慧(artificial intelligence)和機器學習(machine learning)等已發展近十幾年的理論,以及近年來深受矚目的基因演算法(genetic algorithms)等技術。

文獻探討

在電腦輔助診斷中,為了幫助醫師在最有效時間掌握病人的病徵,因而發展許多有關醫療影像檢測方面,一般而言,完整的醫療影像可以由不同的醫學影像器材取得影像,如:超音波影像、核磁共振、正子斷層掃描、電腦斷層掃描、乳房攝影與X光攝影等器材。

Kim等(1999)由128×128的區塊影像計算紋理特徵,之後使用紋理特徵經類神經網路做分類,分類該區塊為有含微鈣化或是為正常的組織[註2],其流程如圖一所示。


《圖一》Kim等(1999)之影像檢測模式


Zheng等(1996)第一階段由影像中取出8×8的區塊影像做檢測,計算空間域特徵(Spatial Domain Features)與頻率域特徵(Spectral Domain Features),做為類神經網路的輸入特徵,分類之後第二階段再以另一頻率域特徵做最後的決策參數,判斷第一階段的檢測結果[註3],其流程如圖二所示。


《圖二》Zheng等(1996)之區塊影像檢測流程


Yu等(2000)的處理也分為兩個階段,第一階段是由已數位化的乳房X光影像資料庫中取出40個ROI(Regions of Interest),大小為128×128,其中20個ROI包含微鈣化叢集(Microcalcification Clusters,MCC’s),另20個ROI為正常的組織,經小波轉換(Wavelet Transform)求取特徵後,使用類神經網路進行訓練,之後再辨識40張資料庫中的影像,找出潛在的微鈣化點。第二階段是依前述所找出潛在微鈣化點計算31個特徵,再以特徵選擇的手法求出最小均方差的特徵組合,最後用類神經網路分類出微鈣化點[註4],其流程如圖三所示。


《圖三》Yu等(2000)之整張影像檢測流程圖


林勝雄(2005)利用超音波影像來診斷腫瘤良惡性,使用紋路特徵有效地應用在超音波影像的腫瘤判斷上,得到不錯的乳房腫瘤診斷之正確率[註5]。

楊勝智(2005)主要探討乳房X光攝影與乳房核磁共振影像之乳房腫瘤電腦輔助診斷系統包含篩檢、分類與定位功能的建立與技術,對於提昇臨床乳癌早期診斷的準確度能有很大的幫助[註6]。

資料探勘技術的未來展望與挑戰

在硬體效能與網路頻寬大幅提升,政府也強力支持並積極計畫建構雲端系統,整體發展環境及前景看好的情況之下,資料探勘技術仍就存在未來尚待克服的挑戰,簡列如下:

1.處理不同型態的資料,例如:圖像、波型訊號、聲音
2.提昇資料探勘演算法的效能
3.提高資料探勘結果的可用性及正確性
4.以多樣化的圖形介面呈現資料探勘結果
5.多重抽象層次中的互動式知識發掘
6.不同來源資料的整合
7.隱私保護與資料安全議題
8.更具預測能力的模型
9.更具延展性的模型
10.更具成本效益的模型
11.不斷進化成長的資料探勘標準
12.與關聯式資料庫的整合

以上這些問題,相信在不久的將來,將會一一克服。

參考文獻

[註1] http://vega.cs.tku.edu.tw/~cyh/data_mining/DM_Exercise_Chapter1.html
[註2] Kim, J. K., Park, H. W., 1999, Statistical textural features for detection of microcalcifications in digitized mammograms., IEEE Trans. Med. Imag., vol. 18, no. 3, pp. 231-238.
[註3] Zheng, B., Qian, W., Clarke, L. P., 1996, Digital mammography mixed feature neural network with spectral entropy decision for detection of microcalcifications., IEEE Trans. Med. Imag., vol. 15, no. 5, pp. 589-597.
[註4] Yu, S., Guan, L., 2000, A CAD System for the Automatic Detection of Clustered Microcalcifications in Digitized Mammogram Films, IEEE Trans. Med. Imag., vol. 19, no. 2, pp. 115-126.
[註5] 林勝雄,2005,乳癌超音波影像紋路特徵電腦輔助診斷之研究,東海大學資訊工程與科學系,碩士論文
[註6] 楊勝智,2005,乳房醫學影像之腫瘤電腦輔助診斷系統,國立成功大學電機工程學系博士班,博士論文