❶ 計算機視覺中,目前有哪些經典的目標跟蹤演算法
古老的方法比如optical flow,kalman filter(後面的particle filter)……了解不多不瞎扯了
目前tracking主要是兩種,discriminative 和 generative,當然也有combine兩個的比如SCM。你提到的都是前者,就是演算法裡面基本有一個classifier可以分辨要追蹤的物體。這類除了你說的最近比較火的還有速度極占優勢的CSK(後來進化成KCF/DCF了)
另一種generative的方法,大致就是用模版(或者sparse code)抽一堆feature,按距離函數來匹配。L1,ASLA,LOT,MTT都是。
最近才開始了解tracking,所以說得可能並不是很對,僅供參考
❷ 光流法(optical flow methods)
光流法,即光學流,是計算機視覺中的關鍵技術,用於估計視頻幀中像素隨時間的變化,通常用於物體運動追蹤和場景自運動分析。其核心是尋找圖像中像素在連續幀之間的位移。
Lucas-Kanade方法是稀疏光流估計的經典演算法,它基於亮度不變性和鄰域光流相似性假設,通過最小化局部匹配誤差求解光流。該演算法利用角點檢測(如Harris角點)來處理可逆像素,避免孔徑問題。OpenCV中的cv.calcOpticalFlowPyrLK函數實現了這一過程,常用於特徵點的追蹤。
對於稠密光流,如Farneback演算法,它通過多項式擬合鄰域像素來提供更全面的像素級運動估計。OpenCV的cv2.calcOpticalFlowFarneback函數提供了稠密光流的計算,輸出每個像素的位移,常用於圖像穩定、視頻處理等領域。
深度學習在光流估計中也有所貢獻,如FlowNet/FlowNet2.0,這些神經網路模型如ICCV2015的FlowNet,通過端到端的學習直接預測光流,極大提升了估計精度。FlowNet2.0作為改進版,不僅性能優秀,且具有更快的計算速度,適用於實時應用。
光流在實際應用中廣泛,如視頻對象跟蹤(如TLD演算法)、視覺里程計(如VINS-Mono)和動作識別、視頻插幀等,它通過像素級的運動信息,增強了視頻內容的理解和處理能力。