搜狗推出“唇語識別”技術 垂直場景下達到90%準確率
鳳凰科技訊(作者/二維馬)12月14日消息,搜狗今日推出了一種人機交互新技術唇語識別,通過機器視覺識別說話人唇部動作,來解讀說話者所說的內容。搜狗官方表示,通過復雜端到端深度神經網絡技術進行中文唇語序列建模,經過數(shù)千小時的真實唇語數(shù)據(jù)訓練,終于取得了唇語識別效果。在非特定人開放口語測試集上,該系統(tǒng)達到60%以上的準確率,超過google發(fā)布的英文唇語系統(tǒng)50%以上的準確率,在垂直場景如車載、智能家
2017-12-15 07:59:46
來源:鳳凰科技??

鳳凰科技訊(作者/二維馬)12月14日消息,搜狗今日推出了一種人機交互新技術唇語識別,通過機器視覺識別說話人唇部動作,來解讀說話者所說的內容。

搜狗官方表示,通過復雜端到端深度神經網絡技術進行中文唇語序列建模,經過數(shù)千小時的真實唇語數(shù)據(jù)訓練,終于取得了唇語識別效果。在非特定人開放口語測試集上,該系統(tǒng)達到60%以上的準確率,超過google發(fā)布的英文唇語系統(tǒng)50%以上的準確率,在垂直場景如車載、智能家居等場景下甚至已經達到90%的準確率。

作為人機交互的形式之一,未來唇語識別技術可以輔助語音交互及圖像識別,在日常生活、安防、公益等各個領域實現(xiàn)廣泛應用。比如在車載場景下,周圍噪音過大時會對語音指令產生干擾,通過唇語識別技術則可以規(guī)避干擾,保證人車交互的準確性和穩(wěn)定性,日常不便發(fā)聲的公共場所也可以保證說話內容的私密性;在安防領域,由于目前多數(shù)監(jiān)控只有攝像頭沒有麥克風,往往只能看清嘴型卻不知道在說什么,給案情分析帶來很多難題,而唇語識別技術可以幫助公安人員獲取重要的講話信息,為公共安全提供有效支持。除此之外,唇語識別技術還能發(fā)揮巨大的公益價值,幫助先天性聽障人群或老年人,讓他們更好地理解和表達自己。

最新文章
1
輿論風暴之后,小米能用玄戒和YU7翻盤嗎?
2
TCL獲中國視像協(xié)會權威認可,三大技術方向樹立行業(yè)標桿
3
第三代儲能電芯誰說了算?
4
蘋果將向開發(fā)者開放其AI模型,助其與三星展開競爭
5
凈利下滑84%,箭牌家居的希望在哪里?
6
30分鐘到手還便宜千元?“國補+美團閃購”這波太狠了!
7
終極演唱會神器!vivo X200 Ultra長焦增距鏡影像套裝今日開售:1699元
8
國補額度已消耗過半 空調廠商狂賭旺季 6月排產增長35%
9
首發(fā)自研玄戒O1芯片!雷軍自費購買一臺小米15S Pro收藏
10
同賽道競爭,為何美的與小米的競合關系如此融洽?
11
小米劍指前三,美的、格力、海爾如何回答“方洪波之問”?
12
2025年廚房小家電細分“藍?!壁厔荨案韶洝笨偨Y
13
空調6月排產增長35%,旺季賭一波?
14
Galaxy Watch 8 Classic帶旋轉表圈曝光
15
谷歌I/O大會:與中國企業(yè)合作打造Android XR眼鏡,可實時翻譯
16
開啟電競三芯時代!一加 Ace 5 至尊版發(fā)布會定檔5月27日
17
“兩個女人一臺戲”:董明珠孟羽童互撕后再合體賺足流量
18
蘋果首款雙攝手機落幕!iPhone 7 Plus、iPhone 8被列入過時產品
19
雷軍今晚發(fā)布!小米自研3nm芯片來了 到底由誰負責量產
20
參訪京東方成都8.6代液晶產線:發(fā)揮氧化物高端優(yōu)勢,打造百吋大屏世界級基地
關于我們

微信掃一掃,加關注

商務合作
  • QQ:61149512