8月18日,威邁爾VMR正式發布(bu)全球首款人(ren)形機器人(ren)頭部模組OmniHead(奧視知腦)。
當前,人(ren)形機器(qi)人(ren)在實(shi)際應用中(zhong)普遍面臨環境感(gan)知能力弱、決策依賴預設邏輯的(de)痛點,導致難以擺脫(tuo)人(ren)工遙控,制約了實(shi)際應用場(chang)景的(de)拓展。OmniHead的(de)推出將有效解決這些技術瓶頸。
OmniHead是威邁爾專為(wei)具(ju)身智能打造的(de)頭部模組,搭載(zai)高(gao)精度RGB-D視覺(jue)系統和AI大(da)模型。通過OmniHead開發者可輕松提升機器人的(de)視覺(jue)感(gan)知(zhi)能力和環境魯棒性,從此擺脫(tuo)遙操。

01、視覺全景感知
OmniHead的(de)(de)(de)RGB-D深度視(shi)覺(jue)系統由(you)三組(zu)十(shi)個RGB-D陣列相機組(zu)成,分(fen)布于頭(tou)部模組(zu)的(de)(de)(de)正前方、左(zuo)后側(ce)和(he)右(you)后側(ce),形(xing)成360°x90°的(de)(de)(de)全(quan)景視(shi)野,實現機器人在復雜(za)場景中的(de)(de)(de)定(ding)位、感知和(he)自主導航。

視覺定位技術
OmniHead采用視(shi)覺定(ding)位技(ji)術,通過RGB-D陣列(lie)相機(ji)(ji)實時獲取周(zhou)圍環境的三維信息并快速建圖,為機(ji)(ji)器人定(ding)位導(dao)航(hang)提供可(ke)靠數(shu)據。

多模態感(gan)知與語義識別
OmniHead的RGB-D相機(ji)融合語義感(gan)知(zhi)算法(fa),實現環(huan)境(jing)物體類別的精準(zhun)識別,經(jing)過訓練可識別桌子(zi)(zi)、椅子(zi)(zi)、人(ren)、機(ji)器人(ren)、狗等(deng)多(duo)類物體,為(wei)機(ji)器人(ren)行為(wei)決策提供準(zhun)確依據。

多機協同數據同步
三組RGB-D陣(zhen)列相(xiang)機可實現視覺數據同步采集與傳輸,最終獲(huo)得全景三維重建與實時感知。

02、AI大(da)模型+麥克風陣列
深度集成DeepSeek或(huo)通(tong)義(yi)千問大(da)模(mo)型和環形麥克風,支持360°聲源定位與(yu)自(zi)然語義(yi)理解(jie),實現多輪(lun)對話與(yu)情感化響應。
環形麥克風(feng)陣列(lie)6麥協(xie)同降噪(zao),支(zhi)持(chi)5米遠場拾音,搭配聲(sheng)紋識別算法,實現多人對話場景(jing)下(xia)的聲(sheng)源分(fen)離與語音增強,并且支(zhi)持(chi)中(zhong)英(ying)雙語交流。

03、開放接(jie)口多模態(tai)數據融合(he)
OmniHead擁有豐富(fu)的開放接口,支持視(shi)覺、語音多模態數據聯合(he)推(tui)理,適配各類(lei)人形機器人平(ping)臺,可拓展具身智能多場景應用,包(bao)括商業辦公、智能制(zhi)造、智能家居(ju)、醫療陪護等領域(yu)。

電話
微信掃一掃