【第162期 March 7, 2011】
 

研發新視界

心電訊號生物辨識初探

作者/吳緯閔

[發表日期:2011/3/1]



前言

因資訊化社會的需要,個人辨識的重要性也日漸高漲。生物辨識是利用生物上獨一的特性來進行個人辨識,比起傳統的個人辨識,它具備遺失率低、損壞率低、攜帶方便等優點。目前發展較成功的生物辨識特徵包括指紋比對、人臉辨識、語者聲音以及視網模等。

在IT醫療管理上,個人辨識科技日新月益,也大幅度提升管理上的方便性。利用生理訊號辨識來辨識病患的身份,並且在監控生理訊號的同時,進一步監控病患的生理狀況。若再結合雲端科技,可以大幅度降低醫療管理系統的負載。筆者由於參與國內某醫學中心IT專案開發,透過所學與實務相互結合,獲益許多,故而藉此機會分享筆者過去在心電訊號生物辨識的研究心得,期能收到拋磚引玉的效果。

自從Harvey提出心臟流量理論之後,心臟的研究已經超過百年,而近年來由於科技進步、心電圖量測方法的提出,人類對於心臟認識更是向前跨了一大步。雖然心電圖會受到年齡、性別、生理狀況各種因素所影響,但近年來已有一些文獻探討以心電圖為基礎之生物辨識的可行性,目前研究所遭遇的缺點包括了計算量過大,以及會隨生理狀態改變而變化。

本文的目的即針對現今心電訊號應用於生理辨識領域上,可能遇到的計算量過度龐大的問題,加以探討,希望可以在減少資料群樣本數下,仍然亦可達到高辨識率,驗証資料群樣本數的多寡,不會對辨識率有著明顯的影響,以便日後做更深層的探討與應用,並提高其實用性與應用的可能性。

實驗方法

我們從MIT/BIH data base中選取出二十個人,每個人取二十筆資料作為樣本的資料群,十筆資料作為測試資料。首先對這些資料做前處理,包括了前處理和低通濾波處理,目的是為了減少其外部雜訊可能的干擾,以降低錯誤率。我們分別計算測試資料與樣本中不同人的心電圖資料的相關係數平均,取最大值作為是否辨認正確的依據,並計算測試資料的辨識率。其流程圖如圖一所示,詳細步驟說明如下:


《圖一》心電訊號處理流程圖


一、前處理(Preproess):

一開始將由MIT/BIH所得到的數據,進行初步運算。運算公式如下:



其中公式之所代表的是原始資料經過平移之後的訊號,而代表則是原始資料還未平移的訊號,則表示的算術平均值。此步驟其用意在於去除訊號飄移所帶來的影響,可以減低變異率,示意圖如圖二所示,接著我們實行低通濾波之步驟,選擇三點平滑來實現。目的在於將不必要的高頻雜訊濾除,減低其變異率。


《圖二》訊號前處理示意圖,綠色為原訊號,紅色為處理後訊號。


二、自相關係數(Correlation Coefficient)

將經過步驟一之後。將已前處理過的訊號和已建立完成的樣本資料,先計算測試資料與樣本資料之相關係數,並重覆操作五次,取其平均,作為辨識測試資料的基礎。再以亂數從中選取出十八個心電訊號做自相關係數的計算,去分析兩者的相似度,亦重覆五次後並且計算這五次之算數平均數,並以此算數平均數做為此次的相關係數結果,自相關係數之公式如公式二所示。



三、辨識單元(Decision Unit):

藉由以上的處理步驟後,將所得到的相關係數,做算術平均數,找出最大者並與樣本比對,藉此得知是否判斷正確,並計算全部資料的辨識率。之後依序每次亂數取出之樣本數減少二筆,直到取出之樣本數只剩下二筆為止。


《圖三》樣本比對之直方圖


實驗結果

根據此次實驗結果我們可以得知,心跳數的樣本從二十開始向下遞減,每次遞減兩筆之時,辨識率變化幅度不大,依舊可以保持相當理想的高辨識率,其大多可達八成以上,平均數也是八成以上。所以實驗結果顯示,心跳樣本數的多寡並不會明顯影響我們辨識的結果。其詳細結果,和各樣本數之辨識率如下表一所示。


《表一》


結論

從實驗結果我們發現利用心電圖訊號來實作生物辨識基本上是可行的。我們從實驗結果可以得知。即使將樣本數從十八依次遞減,減少至二。在少量樣本數時,心電圖之辨識率仍可達到八成以上的辨識率,整體平均亦維持八成以上。因此由以上實驗結果得知,我們可以使用樣本數較少、且較適合的特徵值再加上簡易的計算就可達到心電圖應用於生物辨識上。然而在實驗之中,我們發現若測試者在運動後所量測的心電訊號,利用我們此篇所提出來的分析方法,未必能成功的辨識正確。我們亦發現若測試者心電圖的P波及T波有較大的變化時,則無法達到理想的辨識效果。因此,對於受測者並非在靜止狀態所量測的心電圖,要作為生物辨識的依據,仍需做更深入的探討和分析。而這項利用心電訊號辨識身份的功能未來可應用在檢查病患時直接做病患身份辨識,對於急診病人,或是路倒病患身份辨識可望提供相當大的幫助。