美國康奈爾大學(xué)的研究人員最近成功開發(fā)了一款聲吶眼鏡,它能夠通過聲學(xué)感應(yīng)和人工智能技術(shù)來識(shí)別嘴唇和嘴巴的動(dòng)作,從而連續(xù)識(shí)別多達(dá)31個(gè)無聲命令。
該系統(tǒng)的成功開發(fā)將為那些暫時(shí)不方便說話或無法發(fā)聲的人提供非常有用的幫助。比如,那些有語言障礙或喉嚨疾病的人,以及那些在公共場所不方便大聲說話的人。
這款眼鏡是一種名為EchoSpeech的無聲語音識(shí)別接口。該眼鏡配備了一對(duì)麥克風(fēng)和比鉛筆橡皮擦還小的揚(yáng)聲器,成為一個(gè)可穿戴的人工智能驅(qū)動(dòng)的聲吶系統(tǒng),在面部發(fā)送和接收聲波,并感知嘴巴的運(yùn)動(dòng)。然后,深度學(xué)習(xí)算法實(shí)時(shí)分析這些回聲輪廓,準(zhǔn)確率約為95%。這款低功耗、可穿戴的眼鏡只需要幾分鐘的用戶訓(xùn)練數(shù)據(jù),即可識(shí)別命令并可在智能手機(jī)上運(yùn)行。
聲吶眼鏡是由可穿戴技術(shù)和深度學(xué)習(xí)算法組成的。它通過穿戴者的嘴部和喉嚨的聲音發(fā)射出去的特殊頻率來進(jìn)行聲學(xué)感應(yīng),從而識(shí)別嘴巴和嘴唇的動(dòng)作。隨著深度學(xué)習(xí)算法的發(fā)展,聲吶眼鏡識(shí)別命令的能力也不斷提高,現(xiàn)在已經(jīng)能夠連續(xù)識(shí)別多達(dá)31條無聲的命令。
在測試中,研究人員讓用戶進(jìn)行一系列的肢體動(dòng)作和嘴唇動(dòng)作,聲吶眼鏡可以精確識(shí)別這些動(dòng)作的細(xì)微變化,非??煽康刈R(shí)別命令,并輸出相應(yīng)的命令觸發(fā)器。
這項(xiàng)技術(shù)的研究成果將在本月于德國漢堡舉行的計(jì)算機(jī)協(xié)會(huì)計(jì)算系統(tǒng)人為因素會(huì)議上發(fā)表,屆時(shí)研究人員將詳細(xì)介紹聲吶眼鏡的工作原理和應(yīng)用前景,以及未來的研究方向。
它的發(fā)明將為那些暫時(shí)不方便說話或無法發(fā)聲的人帶來更好的生活體驗(yàn),讓他們可以更加自如地與世界互動(dòng)。未來,我們期待該技術(shù)能夠更加成熟和普及,為更多需要的人們帶來幫助。
前瞻經(jīng)濟(jì)學(xué)人APP資訊組
更多本行業(yè)研究分析詳見前瞻產(chǎn)業(yè)研究院《2023-2028年中國眼鏡制造行業(yè)發(fā)展前景預(yù)測與投資戰(zhàn)略規(guī)劃分析報(bào)告》同時(shí)前瞻產(chǎn)業(yè)研究院還提業(yè)大數(shù)據(jù)、產(chǎn)業(yè)研究、政策研究、產(chǎn)業(yè)鏈咨詢、產(chǎn)業(yè)圖譜、產(chǎn)業(yè)規(guī)劃、園區(qū)規(guī)劃、產(chǎn)業(yè)招商指南、IPO募投可研、IPO業(yè)務(wù)與技術(shù)撰寫、IPO工作底稿咨詢等解決方案。