導航:首頁 > 源碼編譯 > 基於深度學習的手勢識別演算法設計

基於深度學習的手勢識別演算法設計

發布時間:2023-01-19 10:30:21

A. 求計算機科學與技術畢業論文題目

你的計算機科學與技術論文准備往什麼方向寫,選題老師審核通過了沒,有沒有列個大綱讓老師看一下寫作方向?
老師有沒有和你說論文往哪個方向寫比較好?寫論文之前,一定要寫個大綱,這樣老師,好確定了框架,避免以後論文修改過程中出現大改的情況!!
學校的格式要求、寫作規范要注意,否則很可能發回來重新改,你要還有什麼不明白或不懂可以問我,希望你能夠順利畢業,邁向新的人生。

論文選題的具體方法有哪些

在選題的方向確定以後,還要經過一定的調查和研究,來進一步確定選題的范圍,以至最後選定具體題目。下面介紹兩種常見的選題方法。

1、瀏覽捕捉法
這種方法就是通過對佔有的文獻資料快速地、大量地閱讀,在比較中來確定題目的方法。
瀏覽捕捉法一般可按以下步驟進行:
第一步、廣泛地瀏覽資料。在瀏覽中要注意勤作筆錄,隨時記下資料的綱目,記下資料中對自己影響最深刻的觀點、論據、論證方法等,記下腦海中涌現的點滴體會。
第二步、是將閱讀所得到的方方面面的內容,進行分類、排列、組合,從中尋找問題、發現問題,材料可按綱目分類。
第三步、將自己在研究中的體會與資料分別加以比較,找出哪些體會在資料中沒有或部分沒有。

2、追溯驗證法
這是一種先有擬想,然後再通過閱讀資料加以驗證來確定選題的方法。
追溯可從以下幾方面考慮:
第一步、看自己的「擬想」是否對別人的觀點有補充作用,自己的「擬想」別人沒有論及或者論及得較少。
第二步、如果自己的「擬想」雖然別人還沒有談到,但自己尚缺乏足夠的理由來加以論證,考慮到寫作時間的限制,那就應該中止,再作重新構思。
第三步、看「擬想」是否與別人重復。如果自己的想法與別人完全一樣,就應馬上改變「擬想」,再作考慮;如果自己的想法只是部分的與別人的研究成果重復,就應再縮小范圍,在非重復方面深入研究。
第四步、要善於捕捉一閃之念,抓住不放,深入研究。在閱讀文獻資料或調查研究中,有時會突然產生一些思想火花。

B. 最近做圖像識別,想通過MATLAB做手勢識別的演算法,不知道需要學些什麼,做完會是什麼樣子,求大牛指導

模式識別、機器學習。
一般的做法是:
首先要有一定數量的手勢圖片;
其次將訓練用的手勢圖片進行人工分類,即「打上標簽」
再次將手勢圖片轉換成輪廓圖(可以用DFT、DCT、小波變換等計算出邊緣,然後對邊緣進行「擴張」即可);
第四是將輪廓圖規格化、矢量化,生成向量;
最後以上述向量集來訓練學習機(例如:神經網路),直到回歸;
獲得的結果是能進行手勢識別的學習機。

C. AR的核心技術,及與人工智慧之間的關系

AR/VR常作為孿生兄弟被相提並論,被普遍認為為應用層新技術或者說是「智能可穿戴設備」,相比人工智慧相對的「演算法」標簽,顯得不夠有深度有內涵高大上,那AR和人工智慧之間到底是什麼關系?AR屬不屬於當下我們認知中的人工智慧?

AR屬不屬於人工智慧?看完本文你就懂了 AR資訊

2018年3月,上海市經濟和信息化委員會公示了2018年第一批本市人工智慧創新發展專項擬支持項目。「一共有19家創新企業入圍,亮風台作為AR公司也入圍此次支持項目」亮風台工作人員告訴青亭網,這不是AR企業第一次被劃歸到人工智慧,但這種歸類方式也並不常見。據了解此專項由經信委與市財政局聯合開展,擬支持金額超過1億。

簡單梳理下AR的核心技術

AR(Augmented

Reality),是在現實世界中疊加虛擬信息,也即給現實做「增強」,這種增強可以是來自視覺、聽覺乃至觸覺,主要的目的均是在感官上讓現實的世界和虛擬的世界融合在一起。

其中,對現實世界的認知主要體現在視覺上,這需要通過攝像機來幫助獲取信息,以圖像和視頻的形式反饋。通過視頻分析,實現對三維世界環境的感知理解,比如場景的3D結構,裡面有什麼物體,在空間中的什麼地方。而3D交互理解的目的是告知系統要「增強」的內容。

這其中有幾個關鍵點:

首先是3D環境理解。要理解看到的東西,主要依靠物體/場景的識別和定位技術。識別主要是用來觸發AR響應,而定位則是知道在什麼地方疊加AR內容。定位根據精度的不同也可以分為粗定位和細定位,粗定位就是給出一個大致的方位,比如區域和趨勢。而細定位可能需要精確到點,比如3D坐標系下的XYZ坐標、物體的角度。根據應用環境的不同,兩種維度的定位在AR中都有應用需求。在AR領域,常見的檢測和識別任務有人臉檢測、行人檢測、車輛檢測、手勢識別、生物識別、情感識別、自然場景識別等。

在感知現實3D世界並和虛擬內容融合後,需要以一定方式將這種虛實融合信息呈現出來,這裡面需要的就是AR中的第二個關鍵技術:顯示技術,

目前大多數的AR系統採用透視式頭盔顯示器,這其中又分為視頻透視和光學透視,其他的代表有光場技術(主要因Magic

Leap而顯名)、全息投影(在科幻影視劇作品中常出現)等。

AR中的第三個關鍵技術在於人機交互,用以讓人和疊加後的虛擬信息互動,AR追求在觸摸按鍵之外自然的人機交互方式,比如語音、手勢、姿態、人臉等,用的比較多的語音跟手勢。

人工智慧和AR的技術關聯

在人工智慧領域有幾個概念常被提及,如深度學習(DL)、機器學習(ML),在學術領域包括人工智慧(AI)在內幾大領域均有自己的研究界限,而在普遍意義上,我們常說的是泛意的人工智慧,涵括所有「讓機器像人一樣」的技術的應用方向。

從這張圖也可以簡單一窺三者的關系,深度學習是實現機器學習的一種技術方式,而機器學習是為了讓機器變得智能,去達到人工智慧。可以說人工智慧是最終目標,而機器學習是為了實現這個目標延伸出的一個技術方向。在這其中,還有另一個重要概念為計算機視覺(CV),主要來研究如何讓機器像人去「看」,是目前人工智慧概念中的一個重要分支,這也是因為人類獲取信息最主要的方式之一就是視覺,目前計算機視覺已經在商業市場發揮價值,比如人臉識別;自動駕駛中讀取交通信號和注意行人以導航;工業機器人用來檢測問題控制過程;三維環境的重建圖像的處理等等。這些概念既有區分也有一定范圍的重疊。

其中,2006年開始,Hinton引發的深度學習熱潮開始蔓延,在一定程度上帶動了AI的又一次崛起,十年中,在包括語音識別、計算機視覺、自然語言處理在內的多個領域取得重大突破,並向應用領域延伸,正發展的如火如荼。

在AR的核心技術中,3D環境理解、3D交互理解和計算機視覺、深度學習都有著緊密的聯系。3D環境理解在學術界里主要對應的是計算機視覺領域,而近年來深度學習在計算機視覺中得到廣泛應用。交互方面,更趨自然的交互方式如手勢和語音在硬體終端的使用,得益於近幾年深度學習在相關領域的突破。也可以說,深度學習在AR中應用主要在視覺關鍵技術。

目前,AR最常見的形式是2D圖片掃描識別,如騰訊QQ-AR火炬活動、支付寶五福等多數AR營銷中所見,用手機掃描識別圖出現疊加的內容,但主要的研發方向還在3D物體識別和3D場景建模。

現實的物體是以3D形態存在的,有不同的角度和空間方位。所以一個自然的擴展就是從2D圖片識別到3D物體識別,識別物體的類別和姿態,深度學習可以用在這里。以水果識別為例,識別不同類別的水果,並且給出定位區域,即集成了物體識別與檢測的功能。

3D場景建模,從識別3D物體擴大到更大更復雜的3D區域。比如識別場景裡面有哪些東西、它們的空間位置和相互關系等等,這就是3D場景建模,是AR比較核心的技術。這其中涉及目前熱門的SLAM(實時定位與地圖構建)。通過掃描某個場景,然後在上面疊加虛擬戰場等三維虛擬內容。如果只是基於普通2D圖像識別就需要有特定的圖片,而在圖片不可見時會識別失敗。而在SLAM技術裡面,即使特定平面不存在,但是空間定位依然非常精確,就是因為有周圍3D環境的幫助。

這里想探討下深度學習和SLAM技術的融合,計算機視覺大體上可以分兩個流派,一種基於學習的思路,例如特徵提取-特徵分析-分類,目前深度學習技術在這一路線上取得了主導性的地位。另外一種路線是基於幾何的視覺,從線條、邊緣、3D形狀推出物體的空間結構信息,代表性的技術就是SFM/SLAM。基於學習的方向上深度學習基本上一統天下,但是在基於幾何視覺的領域,目前相關的進展還很少。從學術界而言,深度學習技術的研究進展可以說日新月異,而SLAM技術最新十年的進展相對較少。在國際視覺頂級會議ICCV

2015年度組織的SLAM技術專題討論會上,基於近年深度學習在視覺其它領域的快速發展,有與會專家曾提出SLAM中採用深度學習的可能性,但是目前還沒有成熟的思路。總體而言,短期內將深度學習和SLAM融合是一個值得研究的方向,長遠來看聯合語義和幾何信息是一個非常有價值的趨勢。因此,SLAM+DL值得期待。

在交互方式方面,主要的包括語音識別和手勢識別,語音識別在目前已經取得了較大進展,國內如網路、科大訊飛、雲知聲等都是其中的佼佼者,AR公司更想突破的是手勢識別的成熟商業化。

「亮風台展示過的一款基於深度學習的手勢識別系統,主要定義了上下左右、順時針、逆時針六種手勢」亮風台工作人員告訴青亭網,先實現人手的檢測和定位,然後通過識別相應的手勢軌跡來實現對人手勢的識別。雖然人臉識別等其他人工智慧熱門領域在AR中也有使用,但不是AR公司重要的研發方向。

以上不難看出,AR的底層技術或者說基礎部分是計算機視覺以及關聯領域的融合,而當下熱門的深度學習和AR的結合,也是演算法工程師們的努力方向。這也是AR為計算機視覺與人機交互的交叉學科,AR的基礎是人工智慧和計算機視覺等說法的依據。

20180528163858218.png

圖:計算機視覺與AR流程關聯

在去年今日頭條發布的《人工智慧影響力報告》中也簡單統計了人工智慧科學家的分布情況,這其中包括人臉識別、語音識別、機器人、AR、晶元等領域的公司與大型研發機構,高端研發人員的分布也說明了AI領域的細分方向。

那AR究竟是不是人工智慧?

對AR從業者來說,理想的狀態是用更智能的AR終端去取代智能手機,所以對於用戶來說接觸使用AR首先受影響的是內容,其次是終端,AR產業鏈可以粗略劃分為技術提供商、智能終端研發公司,以及AR內容提供商。在這其中,AR設備提供商不可避免關注硬體技術,如底層的晶元、電池、光學鏡片等,以及硬體本身的性能優化,而內容提供商更傾向於在現有技術基礎上優化內容及表現。所以我們可以說AR技術提供商,或者說在底層演算法研發上有一定成績的AR公司是人工智慧公司。

對公司來說,特別是創企會把底層技術轉化為成熟的產品或服務,這可能是如無人機、AR智能終端、機器人等,也可能是行業解決方案,以達到商業目的,並且這已經成為在沸騰聲音之後,媒體、企業以及大眾對AI企業的期待和要求。近期,人工智慧產業發展聯盟(AIIA)出版的圖書《人工智慧浪潮:科技改變生活的100個前沿AI應用》將對外發布,以及涵括了目前巨頭公司以及創企在商業化上的前沿成果,也直接反映了AI目前的主要商業化方向。

作為技術驅動的商業領域,無論是AR還是人工智慧的其他多數方向,技術距離完全成熟還有很長的路程要走,在整個產業鏈逐漸繁榮,關注商業化實現的同時,也需要有更多公司機構去不斷拓展技術邊界,建立核心競爭力,讓行業爆發更大的價值與潛力,如此,AI時代中國彎道超車當可期。

D. 手勢識別演算法哪家企業做的好

可以測試下閱面科技手勢識別演算法,識別精度還是很高的。對姿態和光線的適應性很強,關鍵是基於深度學習及嵌入式,完全離線本地化運算,無需網路連接。
我們已經在合作了!

E. 10.23——10.27《深度自適應》

領域自適應:

多用於文本分類,屬於直推式遷移學習,直推式遷移學習定義:給定一個源域和相應的學習任務,一個目標域和相應的學習任務,直推式學習旨在利用源域和目標域中相同的知識來提高目標域中的目標預測函數。

《基於深度學習的體態與手勢感知計算關鍵技術研究》

基於深度學習的肌電手勢識別:

並不需要任何附加信息或手工設計的特徵提取器,基於高密度肌電信號(HD-sEMG),使用二維陣列電極採集的肌電信號,使得肌肉活動產生的電勢場在時間和空間上的變化可被多個緊密分布在皮膚表面的電極同時記錄下來。HD-sEMG中的肌電信號描繪了位於電極覆蓋區域內的肌肉活動的時空分布,同時HD-sEMG的瞬時值呈現了在特定時間點肌肉活動所涉及的生理過程的相對全局的測量。瞬時HD-sEMG內部可區分出不同手勢模式,可以將採集到的HD-Semg描繪出電勢在空間的分布,其對應的熱度圖即為肌電圖像,肌電圖像中的像素數(解析度)由其採集設備中的電極陣列決定,即電極的數量及其電極間距離(例如,具有16行8列的電極網格可W採集8*16像素的肌電圖像)。

主要是將原始肌電信號值從(-1,1)映射到(0,255),即,其中x是原始肌電信號,I是肌電圖像。構建一個8層CNN結構,網路的前兩個卷積層用於提取公共的底層圖片特徵,作者發現瞬時肌電圖像在不同的空間位置上表現出不同的視覺特徵。在不同手勢中,肌電圖像在中部偏下以及頂部的條狀區域上亮度較強,提出在3,4層加入局部連接結構(受人臉識別前沿工作的啟發),因為局部連接層在不同空間位置上的卷積模板的權重不共享,可以更好的提取圖片上不同位置的特徵。並依據單個窗口內每幀識別出的手勢標簽中所佔比例最高的標簽,因為上述實驗僅適用於肌電幅值較大的數據進行訓練和測試可以獲得較高的手勢識別准確率,因此需要對肌電信號採用全波整流和低通濾波(全波整流和低通濾波是被廣泛採用的肌電信號幅值估計方法),以獲取更好的肌電信號。

基於深度領域自適應的肌電手勢識別:

當訓練集和測試集的肌電信號來自不同的採集會話的情況。因為電極位移,肌肉疲勞,電極和皮膚之間的阻抗變化等因素的干擾,肌電信號與採集會話高度相關,已經訓練好的手勢分類器直接被應用在新的會話時通常准確率較低。因為肌電信號的分布在不同的會話之間變化很大,所以來自不同會話的基於瞬時肌電信號的手勢識別可以相應地表示為多源領域自適應問題。

當標定數據未標記時,該論文採用自適應批量歸一化(AdaBN, Adaptive Batch Normalization)對手勢分類器進行適配。假設用於區分不同手勢的知識存儲在每個層的權重中,AdaBN不需要適配數據的手勢標簽,而是隨著無標簽的適配數據的增加,逐步更新少量的網路參數。給定輸入U,BN將其轉換為V,其中第i個輸入特徵的轉換公式為:

l在訓練階段,每個BN層對於每個源域的均值統計量和方差統計量是獨立計算的。因為訓練階段的BN對每個數據批次獨立計算統計量,所以只需要確保每個數據批次中的樣本來自同一個會話。

l識別階段,對於給定的未標記數據A,AdaBN執行正向傳播演算法,更新參數。

該方法准確率:單幅30.5%,150毫秒窗口-39.2%,而另一種演算法特徵集(150毫秒窗口)和線性判斷:34.1%。

隨機選擇未標記的測試集的子集(0.1%,0.5%,1%,5%,10%)進行深度領域自適應,之後再評測整個測試集上的手勢識別的准確率。最後觀測到大約5%的適配數據後准確率達到巔峰,適配數據20000幀,在CSL-HDEMG的2048赫茲的采樣率下大約10秒。

並且適配演算法並不需要觀測到所有種類的手勢,從27種選擇5個和13個進行適配,最終結果分別是31.3%(73.2%),34.6%(81.4%)另一種方法是肌電地勢(sEMG topography),定義為肌電信號在時間上的二維平均強度圖,其中每個像素是某個通道的肌電信號在特定時間窗口內的均方根,用於手勢識別。

《Revealing Critical

Channels and Frequency Bands for Emotion Recognition from EEG with Deep Belief

Network》

在基於腦電信號的情感識別任務中,多通道腦電信號存在不相關的腦電信號,這不僅會引起雜訊,還會降低系統對情感識別能力。該論文提出一種新的深度信念網(DBN)來檢查用於情感識別的關鍵EEG信道和頻段。

主要從行為和生理反應進行情感分析,因為EEG與表情手勢相比,具有較高的准確性和客觀評價性。該論文採用ESI神經掃描系統,從62通道電極帽以采樣率為1000Hz記錄腦電信號。每個實驗有15個測試,每個測試包括15s提示,45s測試及反饋,5s休息。蓋論文一共評價了30個實驗。

先下采樣原始腦電數據到200Hz,之後使用0.3Hz到50Hz的帶通濾波器濾除雜訊和偽影,之後採用之前提出的微分熵(differential entropy)特徵[1][2],對於固定長度的腦電信號,微分熵相當於一定頻段內的對數能量譜。此前已經證明微分熵在低頻和高頻能量之間具有識別EEG模式的能力,因此在五個頻段計算微分熵特徵(δ:1-3Hz,θ:4 – 7Hz,α:8-13Hz,β:14-30Hz,γ:31-50Hz),使用256點的短時傅里葉變換,並將特徵歸一化到0-1。

利用五個頻段的去噪後的62通道的特徵作為輸入,DBN達到86.08%的准確率和8.34%標准差,本論文通過分析經過訓練的DBN的權重分布來檢驗關鍵通道和頻帶,權重對於識別情感模型是很重要的,因為對於學習任務貢獻較大的神經元權值將增加,不相關的神經元權值趨於隨機分布,圖1為權重在第一層神經網路訓練後的分布,可以看出主要在beta和gamma波的權重最大,這說明此頻帶包含更重要的鑒別信息。

  從圖2中我們可以看出側顳區和前額腦區相比其他腦區在beta和gamma頻帶更容易激活。因此可以得出結論,在識別積極,中性和負面情緒時側顳葉和前額葉通道是關鍵通道,beta和gamma是關鍵頻帶。

如圖3所示,依據腦區中權重分布的特點,設計了四種不同的電極放置剖面,包括4通道,6通道,9通道和12通道,其中4通道的最佳平均精度和標准差為82.88%/10.92%,而所有62通道的最佳平均精度和標准差為83.99%/10.92%,這說明四個相對電極阻輪廓(four profiles of relative electrode sets)FT7,T7,FT8,T8是辨別情感特徵的電極。

[1]Duan R N, Zhu J Y, Lu B L. Differential entropyfeature for EEG-based emotion classification[C]// International Ieee/embsConference on Neural Engineering. IEEE, 2013:81-84.

[2]Zheng W L, Zhu J Y, Peng Y, et al. EEG-based emotionclassification using deep belief networks[C]// IEEE International Conference onMultimedia and Expo. IEEE, 2014:1-6.

腦電論文(大腦解碼:行為,情緒):

Real-time naive learning of neural correlates in ECoG Electrophysiology

神經實時樸素學習相關的皮層電生理

地址: http://www.ijmlc.org/papers/40-L0174.pdf

A Deep Learning Method for Classification of EEG Data Based on MotorImagery

基於運動表象的腦電數據分類的深度學習方法

地址: http://www.bio.spbu.ru/faculty/departments/vnd/pdf/journal%202015/moskvich.pdf

Affective state recognition from EEG with deep belief networks

基於深層信念網路的腦電情感狀態識別

地址: https://www.cse.buffalo.e//DBGROUP/bioinformatics/papers/Kang_BIBM_2013.pdf

A Novel Semi-Supervised Deep Learning Framework for Affective StateRecognition on EEG Signals

一種用於腦電信號情感狀態識別的半監督深度學習框架

地址: https://www.cse.buffalo.e//DBGROUP/bioinformatics/papers/cameraready_xwjiabibe.pdf

Revealing critical channels and frequency bands for emotion recognitionfrom EEG with deep belief network

用深層信念網路揭示腦電情感識別的關鍵通道和頻帶

地址: http://bcmi.sjtu.e.cn/~blu/papers/2015/9.PDF

EEG-based emotion recognition using deep learning network withprincipal component based covariate shift adaptation

基於深度學習網路的主成分協移自適應的腦電情感識別

地址: http://europepmc.org/backend/ptpmcrender.fcgi?accid=PMC4165739&blobtype=pdf

Classifying EEG recordings of rhythm perception

節律性腦電記錄分類

地址: http://www.terasoft.com.tw/conf/ismir2014/proceedings/T117_317_Paper.pdf

Using Convolutional Neural Networks to

Recognize Rhythm Stimuli from Electroencephalography Recordings利用卷積神經網路識別腦電記錄中的節律刺激

地址: http://wwwiti.cs.uni-magdeburg.de/~stober/publ/nips2014.pdf

Convolutional neural network with embedded Fourier transform for EEGclassification

基於嵌入傅立葉變換的卷積神經網路在腦電信號分類中的應用

地址: http://pdfs.semanticscholar.org/9a19/.pdf

Continuous emotion detection using EEG signals and facial expressions

基於腦電信號和表情的連續情緒檢測

地址: https://ibug.doc.ic.ac.uk/media/uploads/documents/soleymani-fu-icme14_camera_ready.pdf

『Deep Feature Learning for EEG Recordings

腦電記錄的深部特徵學習

地址: https://www.researchgate.net/publication/283986303_Deep_Feature_Learning_for_EEG_Recor

異常分類論文(阿茲海默症,癲癇,睡眠階段檢測):

Classification of Electrocardiogram Signals with Deep Belief Networks

基於深層信念網路的心電信號分類

http://www.researchgate.net/publication/293781533_Classification_of_Electrocardiogram_Signals_with_Deep_Belief_Networks

Modeling electroencephalography waveforms with semi-supervised deepbelief nets: fast classification and anomaly measurement

半監督深信網模擬腦電波形:快速分類和異常測量

http://xueshu..com/s?wd=paperuri%3A%%29&filter=sc_long_sign&tn=SE_xueshusource_2kw22v&sc_vurl=http%3A%2F%2Fwww.ncbi.nlm.nih.gov%2Fpmc%2Farticles%2FPMC3193936%2Fpdf%2Fnihms322259.pdf&ie=utf-8&sc_us=14353019482626292792

Deep belief networks used on high resolution data for seizure detection

用於癲癇檢測的基於高解析度多道腦電圖數據的深度信念網

地址: https://www.knexusresearch.com/wp-content/uploads/2015/07/AAAI_JT_Turner.pdf

Deep Learning in the EEG Diagnosis of Alzheimer』s Disease

深層學習在阿爾茨海默病腦電診斷中的應用

http://vigir.missouri.e/~gdesouza/Research/Conference_CDs/ACCV_2014/pages/workshop3/pdffiles/w3-p7.pdf

Sleep stage classification using unsupervised feature learning

基於無監督特徵學習的睡眠階段分類

https://www.researchgate.net/publication/235943204_Sleep_Stage_Classification_Using_Unsupervised_Feature_Learning

Classification of patterns of EEG synchronization for seizureprediction

癲癇發作的腦電同步模式分類

地址: http://yann.lecun.com/exdb/publis/orig/mirowski-cneuro-09.pdf

Recurrent neural network based prediction of epileptic seizures inintra-and extracranial EEG

基於遞歸神經網路的顱內外腦電癲癇發作預測

EEG-based lapse detection with high temporal resolution

基於腦電信號的高時間解析度檢測

地址:

http://www.researchgate.net/profile/Richard_Jones21/publication/3039266_EEG-Based_Lapse_Detection_With_High_Temporal_Resolution/links/5457ab030cf2bccc491112ed

F. 2020-11-25FDC2214感測器模塊

以銅板作為導體材質,由於DC2214 是基於 LC 諧振電路原理的一個電容檢測感測器,所以利用 FDC2214 的工作原理可實現手勢接近和識別的功能。當人手接近該導體感測平面時,感測端的電容發生了變化,這就會導致 LC 電路振盪頻率的變化,從而反映出手勢接近,以及手勢的判定。

從手勢識別方面講:關於手勢動作捕捉主要是通過光學和感測器兩種方式來實現。手勢識別推測的演算法,包括模板匹配技術(二維手勢識別技術使用的)、通過統計樣本特徵以及深度學習神經網路。而常見的紅外識別解析度低,易受干擾,成本高,維護困難,而2214可以在任意環境下實現接近度感測,成本低,在波動的條件下,可以穩定的顯示預期效果。故而我們選擇使用2214晶元。
數據通信方面來講:晶元間的通信只能使用I2C協議,可以採用有限傳輸和無線傳輸兩種方式。考慮到FDC2214晶元靈敏度極高,無線協議會產生較大幹擾使結果不準確,因此採用有線傳輸的I2C協議傳輸。

任務要求裝置具有訓練和判決兩種工作模式,在判決模式下實驗裝置能對指定人員進行猜拳游戲和劃拳游戲的判決。猜拳游戲的判決是指對手勢比劃「石頭」、「剪刀」和「布」的判定,劃拳游戲的判定是指手勢比劃「1」、「2」、「3」、「4」和「5」的判定。在訓練模式下對任意人員進行猜拳游戲和劃拳游戲的手勢訓練,經過有限次訓練後,能進行正確的猜拳游戲和劃拳游戲的手勢判決。
模式及操作流程使用串口屏顯示,首先進入開始界面,選擇需要的工作模式。在判決模式下有猜拳游戲和劃拳游戲,選擇對應的游戲模式進入,在相應的位置做出不同的手勢,裝置即可做出准確的判定,並將正確的結果顯示在串口屏上。在訓練模式下,將任意一位人員的手放在裝置的指定位置,選擇對應的猜拳游戲「石頭、剪刀、布」或者劃拳模式「1、2、3、4、5」,進入對應的游戲模式之後,系統對此人員的手勢信息進行採集,所有的數據採集完成之後,進行判斷和存儲。返回模式選擇界面,選擇判決模式,就可以對此人員的手勢進行准確的判決,並將判決結果顯示在串口屏上。系統在任意模式下都可以返回,可以循環操作。
流程圖如下圖:

此部分進行采樣

此部分 濾波、信號處理、模數轉換輸入到core計算單元

1、高解析度,
2、降低雜訊
3、可以測量震盪LC諧振器的頻率。

每個通道的數字化輸出是成比例的fSENSOR/fREF的比值。

G. 手勢識別用什麼圖像特徵提取演算法

《基於計算機視覺的手勢識別研究》中提到了多尺度模型,它就是採用此模型提取手勢的指尖的數量和位置,將指尖和掌心連線,採用距離公式計算各指尖到掌心的距離,再採用反餘弦公式計算各指尖與掌心連線間的夾角,將距離和夾角作為選擇的特徵。對於靜態手勢識別而言,邊緣信息是比較常用的特徵。中採用的HDC提取關鍵點的識別演算法,基於用八方向鄰域搜索法提取出手勢圖像的邊緣,把圖像的邊緣看成一條曲線,然後對曲線進行處理。

閱讀全文

與基於深度學習的手勢識別演算法設計相關的資料

熱點內容
做什麼app賺錢 瀏覽:83
博途編譯失敗聯系客戶支持部門 瀏覽:926
金蝶旗艦版編譯 瀏覽:50
萬象伺服器斷電後啟動不了怎麼辦 瀏覽:356
我的世界蘋果版的2b2t伺服器地址咋查 瀏覽:95
xlsx轉換pdf 瀏覽:98
3dmax擠出命令英語 瀏覽:903
靶心率的定義和演算法 瀏覽:514
3d模術師app哪裡下載 瀏覽:474
php中文api文檔 瀏覽:458
安卓設計怎麼加入輸入框 瀏覽:185
主根伺服器什麼時候開始 瀏覽:738
奇門遁甲完整版pdf 瀏覽:903
app軟體怎麼用的 瀏覽:802
電子書pdf購買 瀏覽:194
浪潮伺服器如何做系統 瀏覽:111
冒險島img格式加密 瀏覽:596
我的世界手游如何復制命令 瀏覽:659
天刀自動彈琴腳本源碼 瀏覽:971
打開其它app微信怎麼收不到 瀏覽:447