計算機視覺、機器視覺感知與SLAM比較

生物及人類的視覺原理是什麼,至今在科技界也無確切的研究清楚,一個三維物體,人眼從不同的角度看過後,得到真實三維物體的一個「開覆蓋」,這個「開覆蓋」在人類大腦里就有了這個物體所唯一對應的一個視覺感知,這個感知在大腦里的存儲是二維的還是多維的?存儲的信息是曲率還是輪廓線?這裡的「唯一對應」是共形映射還是普通雙射或是其他?等等類似這些問題,至今我們一概沒有頭緒,但這並不妨礙我們持續地去觀察及研究。

目前,基於深度學習的計算機視覺,發展了相關演算法,在人臉識別、無人駕駛等方面有了一定的進展與實際應用,SLAM技術對可移動的智能硬體,在定位與建圖層次也有了一定的支撐,那麼有沒有更自然更普適的視覺模型與視覺演算法。

Advertisements

以上分析中,提到了「開覆蓋」、「共形映射」,那麼視覺的理論基礎會不會是微分幾何,視覺感知物體與環境,會不會是在分析曲率的一種概率分佈,本文就以此為出發點,逐步剝開一種更具普適性的視覺感知模型——機器視覺感知。

如下圖所示,我們先給出當前技術:計算機視覺、機器視覺感知與SLAM的比較說明,

各種視覺方案的演算法分析

Advertisements

你可能會喜歡