top of page

人工視覺系統與生物視覺的深刻差異:專家視角分析

  • 作家相片: Unop
    Unop
  • 2019年7月23日
  • 讀畢需時 5 分鐘

引言:

現代科技的發展超乎人類的想像,科學家已經研發出能使機器自我學習和獲得特定能力的程序,例如物體辨識。機器如何視覺分辨物體成為不同領域科學家的研究重點。本篇報導探討了由認知心理學研究團隊進行的實驗,並邀請到生物產業機電工程學系的專家及心理學界在視覺科學、臉孔與物體辨識領域的專家,共同對這項技術的發展進行評析。本研究小組針對視覺系統出發,挑戰機器獲得的能力與人類相似度,專家們認為,儘管表面相似,實際上它們依賴的機制卻是截然不同的。我們的專家將如何看待這一觀點呢?


人工視覺系統與生物視覺之間的關鍵差異

加州大學洛杉磯分校的認知心理學研究團隊對機器視覺(machine vision)設計了一系列實驗,探討機器如何辨認物體。隨著深度學習系統(特別是深度卷積神經網絡,DCNNs)的發展,物體辨識的表現逐漸逼近人類水平,一些研究顯示這些系統的處理過程可以類比生物視覺中的物體識別能力。本研究強調,在生物視覺中,形狀是辨認物體過程中最重要的線索。因此,研究團隊設計了五個實驗,測試形狀資訊在訓練DCNNs辨認圖像時的作用。實驗結果顯示,DCNNs的分類在形狀以外的其他資訊(如表面紋理)的影響下,似乎占有更大的比重。最關鍵的是,這項研究證實了,雖然深度學習系統能夠讀取局部形狀特徵,但對邊緣特徵的排列和整體形狀的敏感度相對較低,這反映出人工視覺系統與生物視覺之間的重要分歧。

研究原文參考:

Nicholas Baker, Hongjing Lu, Gennady Erlikhman, Philip J. Kellman. “Deep convolutional networks do not classify based on global object shape,” PLOS Computational Biology, 2018; 14 (12): e1006613 DOI: 10.1371/journal.pcbi.1006613


生物產業機電工程學系郭彥甫副教授的觀點

在機械自動化與智能化進程中,機器視覺技術為工作效率的提升帶來了顯著助益。例如,漁業署為了避免非法濫捕問題而獲得歐盟或國際組織的認證,必須妥善執行監管程序。以往需依賴專業遠洋漁業觀察員進行魚種記錄工作,但目前透過魚種及魚身辨識技術,機器能夠從照片或影片中學習各類魚類特徵,同時辨識魚的頭部、尾部,甚至估算魚的長度。這一技術不僅提高漁獲統計的速度,還有效彌補了人力資源的短缺。


實際上,機器辨識過程涉及形狀、紋理和顏色等多項特徵。研究者不斷調整機器學習算法,以提高識別的準確率。然而,由於機器同時接受所有特徵進行學習,這使我們難以明確斷定最易閱讀的特徵究竟是形狀、紋理還是其他資訊。根據物體類別的差異,機器可能會優先使用最能區分該物體類別的特徵進行分類。例如,辨識樹葉類型時,形狀的差異可能比葉脈的紋理差異來得重要,因此機器會優先從形狀開始辨識。而在其他情境中,像是訓練機器辨識花瓣的類型時,顏色也可能成為關鍵的辨識依據。因此,雖然這篇研究中的深度卷積神經網絡(DCNNs)在物體辨識方面提供了一套有效的工具,但其分類結果可能會更依賴於形狀以外的其他特徵(如表面紋理),而這並不一定能適用於所有機器視覺系統或研究領域。


成功大學心理學系龔俊嘉副教授的觀點

龔俊嘉教授表示,最近越來越多的研究開始比較深度學習模型和人類在視覺處理上的表現。他指出,文章中的結論——即其他線索(如表面紋理)在辨識過程中發揮了更大的作用——是可以理解的。他認為,天擇演化與人工演化之間的差異,確實在時間上就像蘋果與橘子般不可類比。


人類的視覺系統經過數億年的演化,從一些對光敏感的多細胞生物逐步演變至現在的水平。這一過程中,先前物種的特性從未被拋棄,而是經歷了不斷的選擇與調整。這使得目前我們對於視覺系統的理解,包含了許多關於大腦功能與處理過程的知識,是基於大量的實驗資料及臨床案例的結晶。


相對而言,人工深度學習網絡的設計是透過多層的數位構成,輔以向後傳播(back-propagation)和側向抑制(lateral inhibition)來近似人類的視覺表現。然而,這種設計缺乏了經過自然選擇的演化過程,無法有效模擬自然界中的逐步演變。因此,龔教授指出,人工系統的操作是在一個較為靜態的框架下進行,並不具備生物視覺所經歷的長期進化所帶來的穩定性與多樣性。


結論

這項研究結果不僅對偏向工程的視覺科學家提供了重要的參考,幫助他們進一步調整機器學習的參數以獲得更精確的視覺辨識,亦對學術界中的理論取向科學家強調了生物演化過程對視覺系統的影響。了解人類及動物視覺的基礎仍是不可或缺的一部分,這樣才能提高人工視覺技術的準確性及適用性。


隨著科技的進步,人工視覺系統的發展不僅需要參考生物視覺的特點,還需吸收更多來自於不同學科的研究成果。只有持續進行多領域的交叉研究,才能朝著更高效、更智能的機器視覺系統邁進,最終服務於更廣泛的應用場景。


FAQ結構:

Q1: 什麼是機器視覺?

A: 機器視覺是指利用計算機和技術使機器能夠獲取、處理、理解視覺信息的系統,通過算法和深度學習模型來模擬人類的視覺功能。


Q2: 機器與人類視覺的主要差異是什麼?A: 雖然機器視覺在物體辨識方面的表現已接近人類,但其依賴的學習機制和特徵識別方法不同於人類經由長期進化所構成的視覺能力,因此在某些特徵的識別上(例如邊緣形狀)仍存在差距。


Q3: 深度學習系統如何提高物體辨識精度?

A: 深度學習系統通過大量數據與多層神經網絡結構進行訓練,這使得系統能夠自動抽取影像中的特徵,並學習這些特徵與物體類別之間的關聯。具體來說,系統首先將影像分段,然後進行特徵提取與映射,這一過程中的每一層都會進一步抽象化前一層的輸出,最終形成對應於不同物體的分類結果。


這些深度卷積神經網路(DCNNs)利用大量的標註數據來強化學習,並通過反向傳播算法持續優化網絡參數。這種方法使得系統在處理複雜圖像,尤其是在光照、角度和背景變化大的情況下,能夠逐漸提高辨識的準確性。


然而,雖然深度學習系統在物體辨識方面的性能已達到很高的水平,但基於其獨特的學習方式,該系統仍然可能在某些方面(例如整體形狀的判斷)不如人類視覺系統來得敏感。因此,對於深度學習系統在特定應用中的適應性與效能,持續的研究與調整是必要的。


結語

總結來說,這次的研究投入了對於機器視覺與生物視覺之間差異的深入探討,揭示了人工視覺系統在特徵學習上的優勢與局限。未來,隨著技術進一步發展,期待機器視覺能夠靈活結合更多特徵參數,進一步提升在不同場環境中的識別能力。這不僅能夠提升相關科技的運用效率,更將推進各種實際應用的發展,如自動駕駛、機器人視覺及智能監控等領域。

Meta Title: 人工視覺系統與生物視覺的探討:科技與心理學的視角

Meta Description: 深入解析機器視覺與生物視覺之間的關鍵差異,探索深度學習系統如何影響物體辨識能力,專家觀點提供不同視角的分析與見解。

Comentarios


bottom of page