凌群電子報

圖形辨識與物聯網之發展將日趨密切

作者/鄭子豪

[發表日期：2015/5/5]

前言

圖形識別（Pattern recognition，或稱模式識別），為透過電腦運算技術方法達到圖形的自動判讀之技術。影像在電腦中以陣列的形式儲存與運算，如三原色光模式（RGB），先將影像以不同色彩分層，以上述方法代表不同顏色後，再以相對位置分配顏色的強度數值。此外尚有印刷四分色模式（CMYK）、CIE 1931等色彩空間結構。模型識別將代表影像的陣列進行數學算，利用機率、向量等特徵模型，進行特徵選取或萃取、分類器設計以及系統辨識率測試，使得資訊系統得以自動化辨識輸入影像中的資訊，將目標資訊主體與背景分離並轉換成所需之內容，以利後續運算。

《圖一》國際照明協會(CIE；INTERNATIONAL COMMISSION ON ILLUMINATION)所訂定之色彩空間
來源:http://www.cie.co.at/

《圖二》識別辨識戰鬥機機型樣本
來源:Guangyi Chen, Wenfang Xie. (2011) Wavelet-based moment invariants for pattern recognition. Optical Engineering 50, 077205. . Online publication date: 1-Jan-2011. [ CrossRef ]

隨著資訊科技的進步，資訊處理過程日趨複雜，應用範疇也與日俱增，物聯網（IOT；Internet of Things）時代的來臨使得影像處理需求增加，含有影像攝取鏡頭的硬體設備越來越多，並融入各種生產製造、商業行為甚至日常生活，不同應用的資訊系統漸漸倚靠自動化影像辨識技術，完成各種新的應用。

當今常見的代表性技術如字元識別(OCR；Optical Character Recognition)，將文字影像進行處理，抽取主要表達特徵並將特徵模型紀錄，比對實際輸入影像後，依邏輯與機率轉換成字串形式，供系統進行後續處理，如車牌辨識系統，將各種車輛的影像做為系統輸入，以特徵匹配辨識車牌字元後，即可進行如計費、安全控管、疑車追蹤等應用。某些系統結合甚至機器學習等演算法，透過訓練，能自動修正模型提升準確率。拜電腦運算之速度快、準確性高、效率高特性之賜，此技術能逐步取代人工作業行為，目前常用於醫療判讀、聲紋辨識、車輛監控計費、個人安全等資訊系統，應用範疇仍隨著時間快速擴展中。

《圖三》文字識別辨識標的不同角度的樣本範例
來源:Guangyi Chen, Wenfang Xie. (2011) Wavelet-based moment invariants for pattern recognition. Optical Engineering 50, 077205. . Online publication date: 1-Jan-2011. [ CrossRef ]

圖形辨識的流程

圖形辨識流程可以分為特徵表現、特徵萃取、分類器設計以及系統辨識率測試幾個步驟。在特徵表現步驟將資料之特徵量化取出，再藉由特徵萃取找出較具分類效果的特徵，限縮資料維度。再根據資料是否包含先前取得並選取之類別資訊以與應用面考量採用分群法或分類法來進行分類器設計，產生分類函數，最後依測試資料來驗證該系統準確率，了解分類函數是否完善等個步驟之準確性，逐一最佳化。

圖形辨識的相關技術

圖形偵測(detection)技術，如線條偵測、臉部偵測等，偵測一個物體在一個圖像中的表現，線條偵測即偵測影像中是否含有符合條件的直線；臉部偵測則欲在影像中偵測人臉。Hough Transform(霍式轉換)為此技術之經典演算法，將圖形轉換成特徵空間，再由投票選取圖形。圖形辨識(recognition)則是要判斷影像中物體所屬條件，相對於偵測，以人臉為例，偵測的目的為標記出人臉位置，辨識則是能進一步的認出這是屬於哪個人物的人臉。圖形偵測主要鑽研偵測速度以及對於雜訊的敏感度，而辨識則討論複雜環境中對應不同結果的方法。相較於圖形偵測除定位與判斷欲偵測的物件是否存在外，圖形辨識因能判斷出圖形中存在物件的其他特性，應用更為多廣。

至於辨識時的分類方法，多源自於機率上的理論，如貝氏定理（Bayes' theorem）、主成分分析(PCA；Principal component analysis)、線性識別分析(LDA；Latent Dirichlet allocation)、支持向量機(SVM；Support Vector Machine)、類神經網路Neural Network等，研究將辨識物件進行分類並最佳化。

結論

智能居家、數位安全監控、個人裝置安全控管等議題一直是物聯網的熱門討論內容，車牌辨識、街道影像系統、行動裝置應用等熱門技術亦需要成熟的影像辨識技術，任何需要針對圖形中的物件(如使用者、車輛、文件等)進行萃取的系統均能看到圖形辨識的技術實作。因圖形辨識可應用之領域相當廣泛，在物聯網發展的同時，圖形辨識的技術仍同樣在進步中，各種圖形辨識演算法均有擅長的辨識物件目標，優良的圖形辨識演算法須結合不同領域之知識，開發者熟悉辨識物件的各種外顯特性，以及動態行為，並且不斷設計修改演算法內容，方能設計出最適宜的辨識與分類演算法，提升準確率。對於跨領域之技術人才如醫療與資訊；工業設計與資訊；機械與資訊等，同時具有辨識物件與辨識演算法知識的人才，將能在這一波躍進中提供更多見解、嶄露頭角。