總體上來說, 視覺顯著性檢測的方法可以分為兩大類, 分別是自底向上數(shù)據(jù)驅(qū)動(dòng)的顯著性提取和自頂向下任務(wù)驅(qū)動(dòng)的顯著性提取??紤]到自頂向下的顯著性提取是根據(jù)特定的任務(wù)建立, 理論和應(yīng)用均具有局限性, 本文重點(diǎn)介紹自底向上數(shù)據(jù)驅(qū)動(dòng)的顯著性提取類型。同時(shí), 目前顯著性檢測中的絕大多數(shù)研究成果均是研究自底向上的由底層特征驅(qū)動(dòng)的計(jì)算模型。下面對視覺顯著性檢測模型的發(fā)展歷程做一個(gè)簡單的梳理。
Niebur等人提出第一個(gè)具有實(shí)際意義的視覺顯著性檢測算法, 而具有里程碑式的視覺顯著性檢測模型則是由美國加州理工學(xué)院的Christof Koch教授和美國南加州大學(xué)的Laurent Itti副教授二人于1998年合作提出, 對輸入圖像分布計(jì)算得到亮度、顏色和方向3個(gè)通道的高斯金字塔, 再對各金字塔計(jì)算中央周邊差運(yùn)算得到特征圖, 最后將各通道的特征圖也分別規(guī)則化后合并得到最終的顯著圖, 具有較高的計(jì)算機(jī)適用度。GBVS是基于圖論求取顯著性, 提取過程類似于Itti等人模型模擬視覺原理, 但在顯著圖的生成過程中加入Markov鏈, 利用圖的模型計(jì)算中央周邊差, 然后通過純數(shù)字計(jì)算得到顯著性。DISK算法用樣本方差和峰度估計(jì)假設(shè)的廣義高斯概率密度函數(shù), 然后計(jì)算中央周邊的相互信息?;谥醒胫苓叢畹娘@著性算法考慮局部特征的對比往往用多尺度而不是單個(gè)尺度的方案以更好地求得顯著圖, 然而多尺度算法的計(jì)算花銷較大運(yùn)算較慢, 并且由于頻繁地使用鄰近插值導(dǎo)致顯著圖的分辨率降低, 也一定程度丟失了目標(biāo)邊緣信息除此以外, SR算法和IG算法等基于圖像空間頻域分析的顯著性檢測算法也都是隸屬于自底向上的顯著性檢測經(jīng)常采用的代表性算法, 它們具有運(yùn)算速度較快的優(yōu)點(diǎn), 但I(xiàn)G算法計(jì)算的顯著圖中顯著區(qū)域的顯著度較低, 無法很好地突出最顯著的位置;SR算法沒有考慮顏色特征, 也沒保存足夠多的高頻信息, 使得顯著圖中顯著區(qū)域的邊界不夠清晰。顯著性模型在上個(gè)世紀(jì)八十年代就被提出, 但是直到近幾年才出現(xiàn)許多新的顯著性建模思想, 并且形成了一個(gè)熱門的研究領(lǐng)域。
本文地址:http://m.blackside-inc.com//article/27098.html