人人人做人人爽夜欢视频|ve中文字幕久久一区二区|日韩 欧美 综合 制服|在线免费观看网站|欧美丰满BBB久久久|肉伦疯狂娇喘迎合受孕|床片激情免费视频


首頁
產(chǎn)品系列
行業(yè)應(yīng)用
渠道合作
新聞中心
研究院
投資者關(guān)系
技術(shù)支持
關(guān)于創(chuàng)澤
| En
 
  當(dāng)前位置:首頁 > 新聞資訊 > 機(jī)器人知識 > 機(jī)器人的 語音的生成、音響特征及語音分析,語音識別  
 

機(jī)器人的 語音的生成、音響特征及語音分析,語音識別

來源:機(jī)器人[李明]      編輯:創(chuàng)澤      時間:2026/5/20      主題:其他   [加盟]

機(jī)器人的語音輸入輸出內(nèi)容如圖3-9所示。語音輸入過程是一種模式識 別過程,先對空氣振動引起的語音聲波進(jìn)行分析,然后抽取聲波里的音響特征,模式識別以及限定語音之間的連接關(guān)系。正確無誤地對連續(xù)的發(fā)音進(jìn)行 一個一個語音識別是一件非常困難的事情,所以只能從不是那么準(zhǔn)確的語音 序列或單詞的識別去理解人的說話內(nèi)容。因此,在機(jī)器人系統(tǒng)中所使用的語 音識別方法、韻律規(guī)則和語法規(guī)則等語言學(xué)方面的規(guī)則都是綜合了各種知識 形成的,只有這樣才能理解人說話表達(dá)的意思。可以把這種系統(tǒng)稱為語音理 解系統(tǒng)。但是人的說話有時不那么明確,或者表達(dá)不那么清楚,這時機(jī)器人就 要通過語音合成裝置在人說話內(nèi)容不明確或不清楚的地方提出疑問并請求解 答,或?qū)θ说恼f話內(nèi)容多次加以確認(rèn),采用這種方式構(gòu)成的系統(tǒng)稱為語音對話 系統(tǒng)。在語音對話系統(tǒng)中,雖然對人所發(fā)出的語音或單詞的識別并不十分準(zhǔn) 確,但通過對話和理解過程就能把人說話的內(nèi)容傳達(dá)給機(jī)器人。

一般來說,語音的生成過程分為三個階段:聲道內(nèi)音源的發(fā)音;到聲道出 口為止的聲波的傳遞;從聲道出口到語音接受點的聲波輻射。發(fā)音的音源也 有三種:通過聲帶的振動引起聲道內(nèi)呼出的氣流所產(chǎn)生具有近似周期性的斷 續(xù)氣流量的變化;當(dāng)呼出的氣流通過聲道時,由于聲道變窄而產(chǎn)生的聲壓變 化;把閉鎖的聲道突然開放而產(chǎn)生的階躍型的音壓變化。對元音而言,聲道由 咽喉、口咽和口腔組成,并具有全極點的傳遞函數(shù)特性,每個極點的頻率稱為 共振峰頻率,把這些共振峰頻率依次編號為D一共振峰頻率、第二共振峰頻 率、第三共振峰頻率等。

語音的特征有分節(jié)特征和韻律特征兩種。在語音分節(jié)特征中,可以把元 音或輔音等每個單音作為語音的一個特征單位,因此可以根據(jù)聲道的傳遞函 數(shù)和音源的種類對這些特征單位進(jìn)行描述。在語音的韻律特征中可以把語音 的抑揚、強(qiáng)度、節(jié)奏和速度作為語音的一種特征單位。語音的抑揚可以用振動的基頻來描述,語音的強(qiáng)度可以用音源的強(qiáng)弱來描述,而語音的節(jié)奏和速度則 可以用單音或停頓的持續(xù)時間來描述。

通過傅里葉變換對頻率函數(shù)進(jìn)行分析是一種基本的語音分析方法。這種 方法得出的結(jié)果是一種頻譜特性,包括振幅頻譜和相位頻譜,但相位特性對語 音影響不大,所以一般僅用振幅頻譜(簡稱頻譜)來表示。因為語音特征是隨 時間變化的,所以使用傅里葉變換對語音分析時,應(yīng)截取有限長度的語音信號 進(jìn)行分析。

孤立單呼語音識別系統(tǒng)的基本構(gòu)成。該圖所示系統(tǒng)只能 識別預(yù)先指定的有限個孤立單詞,這種系統(tǒng)不是進(jìn)行組成單詞的音素的識 別,而是把單詞整體作為一個單位來進(jìn)行識別。輸入系統(tǒng)的孤立單詞語音用 隨時間變化的函數(shù)來描述,通過某些數(shù)學(xué)運算把單詞語音信號變換為語音特 征更為明確的參數(shù)序列,進(jìn)行音響分析。經(jīng)過變換后的單詞語音通常用十幾 維的向量序列來描述,即使同一說話者對同一單詞進(jìn)行發(fā)音,每次發(fā)音時的 向量序列長度也有可能不同。對單詞整體而言,向量序列長度的伸縮不是線 性變化的,元音的穩(wěn)定發(fā)音部分的長度容易引起伸縮,輔音部分和各個過渡 部分則保持相對的固有長度,因而描述單詞的整個向量序列長度的伸縮呈非 線性的。

在單呼語音識別系統(tǒng)中,被識別對象的單詞,都預(yù)先準(zhǔn)備好其標(biāo)準(zhǔn)的特征 向量序列。這些特征向量序列叫做標(biāo)準(zhǔn)模式。所謂單呼語音識別,是把經(jīng)過 變換后的輸入單詞的特征向量序列與各單詞的標(biāo)準(zhǔn)模式之間的相似性(或距 離)逐一進(jìn)行比較,Z后把相似性Z高的單詞作為識別結(jié)果進(jìn)行輸出。把被識 別單詞的特征向量序列與標(biāo)準(zhǔn)單詞模式進(jìn)行比較,計算兩者的相似性的操作 過程稱為“對照”或“匹配”。輸入的單詞和標(biāo)準(zhǔn)單詞的模式的向量序列長度一 般有差異,兩者進(jìn)行匹配時不能單純的線性伸縮把兩者湊齊,需要根據(jù)在時間 軸上的非線性特點采用時間規(guī)整技術(shù)進(jìn)行復(fù)雜的數(shù)學(xué)計算。

單呼語音識別系統(tǒng)有兩種類型:以特定人為前提并隨時進(jìn)行語音調(diào)整的 系統(tǒng)和以非特定人為前提且不對語音進(jìn)行特別調(diào)整的系統(tǒng)。前者叫做特定人 的單呼語音識別系統(tǒng),后者叫做非特定人的單呼語音識別系統(tǒng)。在特定人的 單呼語音識別系統(tǒng)中,大多數(shù)情況下是把特定人所說的單詞語音進(jìn)行音響分 析再變換為特征向量序列,然后原封不動地將這個特征向量序列句作為標(biāo)準(zhǔn) 模式來使用。在特定人的單呼語音識別系統(tǒng)中,選擇幾個典型的單詞特征向 量序列作為標(biāo)準(zhǔn)單詞模式,或從多個標(biāo)準(zhǔn)單詞模式中求出概率分布,Z后進(jìn)行 統(tǒng)計判別。





機(jī)器人圖像匹配的常用方法:極線約束,唯一性約束,視差連續(xù)性約束,順序一致性約束

匹配點一定位于兩幅圖像中相應(yīng)的極線上;兩幅圖像中的對應(yīng)的匹配點應(yīng)該有且僅有一個;除了遮擋區(qū)域和視差不連續(xù)區(qū)域外,視差的變化應(yīng) 該都是平滑的

機(jī)器人的視覺技術(shù):單目視覺、雙目視覺和全景視覺

移動機(jī)器人的單目視覺能夠從圖像的二維特征推導(dǎo)出三維信息,不能直接得到三維環(huán)境信息的;雙目視覺機(jī)器人由兩部攝像機(jī)從不同角度同時獲取周圍景物的兩幅數(shù)字圖像

足式移動機(jī)器人獨特的優(yōu)勢:適應(yīng)能力,隔振能力,能耗較少

雙足機(jī)器人對步行環(huán)境的要求很低,能適應(yīng)各種地面且具有較高的逾越障礙的能力;占地面積小,活動范圍很大,其上配置的機(jī)械手具有更大的活動空間

不同類型的機(jī)器人手臂的運動形式和特點:直線,伸縮、升降及橫向,回轉(zhuǎn),上下擺動

圓柱坐標(biāo)型機(jī)器人,其臂部具有回轉(zhuǎn)、升降和伸縮自由度;極坐標(biāo)型機(jī)器人的典型臂部結(jié)構(gòu),其臂部具有回轉(zhuǎn)、俯仰和伸縮自由度;多關(guān)節(jié)型機(jī)器人的臂部結(jié)構(gòu)有回轉(zhuǎn)、俯仰和前后移動三個自由度

機(jī)器人的手臂機(jī)構(gòu)的要求:剛度要大、導(dǎo)向性要好、偏重力矩要小

為防止臂部在運動過程中產(chǎn)生過大的變形,手臂截面形狀的選擇要合理;為防止手臂在直線運動中沿運動軸線發(fā)生相對轉(zhuǎn)動,設(shè)置導(dǎo)向裝置,或設(shè)計方形、花鍵等形式的臂桿

迎賓機(jī)器人的低層控制的三種關(guān)鍵控制策略:阻抗柔順控制,力/位混合控制,高頻伺服與 PID 控制

阻抗柔順控制將末端模擬為一個虛擬的彈簧阻尼系統(tǒng),機(jī)械臂會表現(xiàn)出物理上的順應(yīng)性,主動退讓以緩沖能量;分別應(yīng)用力反饋回路和位置伺服回路

迎賓機(jī)器人的動作的生成與運動學(xué)的三項核心技術(shù):時序軌跡規(guī)劃,逆運動學(xué)解算,動力學(xué)一致性

時序軌跡規(guī)劃確保機(jī)器人生成的位置、速度及加速度曲線具備二階連續(xù)性;逆運動學(xué)解算在完成抓取任務(wù)的同時優(yōu)化機(jī)械臂構(gòu)型,以避開奇異位形

智能服務(wù)機(jī)器人動作表征體系的三種形式:任務(wù)空間表征,關(guān)節(jié)空間表征,肌群協(xié)同表征

關(guān)節(jié)空間表征描述機(jī)器人本體所有活動關(guān)節(jié)的角度、角速度及力矩構(gòu)成的向量空間;肌群協(xié)同表征將高維的關(guān)節(jié)運動分解為少數(shù)幾種基礎(chǔ)模式的線性組合

導(dǎo)引指路機(jī)器人的觸覺感知技術(shù):觸覺陣列、加速度/振動傳感器以及光學(xué)觸覺傳感器

力/力矩傳感器對整體載荷變化敏感,常用于力控、阻抗控制與安全監(jiān)測;觸覺陣列提供壓力或剪切力的空間分布,可推斷接觸斑塊形狀、接觸位置與支撐關(guān)系

仿人機(jī)器人路徑規(guī)劃:滾動路徑規(guī)劃的方法

在動態(tài)環(huán)境下,可以采用基于傳感信息融合的在線 滾動路徑規(guī)劃的方法。該方法是一種實時路徑規(guī)劃方法,使用滾動規(guī)劃的策略來解決動態(tài)環(huán)境下仿人機(jī)器人路徑規(guī)劃問題

移動機(jī)器人路徑規(guī)劃:局部路徑規(guī)劃,全局路徑規(guī)劃

局部路徑規(guī)劃指的是機(jī)器人在全局信息位置的情況下,依靠傳感器信息進(jìn)行的局部路徑規(guī)劃;機(jī)器人的全局路徑規(guī)劃方法可以分為可視圖法,結(jié)構(gòu)空間法,柵格法,拓?fù)浞?隨機(jī)路徑規(guī)劃法等

仿人機(jī)器人復(fù)雜運動規(guī)劃:上下樓梯、跨越臺階、跑步、翻滾、爬行、守門、起立、跳舞

仿人機(jī)器人在3D空間的上下樓梯、跨越臺階和使用手臂一起進(jìn)行全身運動規(guī)劃的跑步、翻滾、爬行、守門、起立、跳舞以 及跟目標(biāo)物體接觸的踢球、開門、搬運東西等一系列運動
 
資料獲取
新聞資訊
== 資訊 ==
» 分布式機(jī)器人體系結(jié)構(gòu)DIRA-利于機(jī)器人
» ALLIANCE機(jī)器人系統(tǒng)-用于不均勻多
» Nerd Herd機(jī)器人系統(tǒng)-避障、返回
» 多機(jī)器人系統(tǒng)的體系結(jié)構(gòu):集中式、 分層式
» 2026年全球前15名人形機(jī)器人-Tec
» 基于具身大模型的多場景智能巡檢機(jī)器人系統(tǒng)
» 中國具身智能市場規(guī)模預(yù)測分析
» 中國具身智能市場趨勢量化預(yù)測:出貨量翻幾
» 中國具身智能區(qū)域產(chǎn)業(yè)集群:三大核心城市競
» 2026年中國具身智能行業(yè)深度分析報告-
» 2026年中國未來產(chǎn)業(yè)深度分析報告-機(jī)器
» 2026年全球及中國人形機(jī)器人關(guān)節(jié)模組市
» 基于世界模型的具身智能技術(shù)體系探索:破解
» 世界模型賦能具身智能的框架設(shè)計:四個層級
» 具身智能系統(tǒng)的“大腦”里都有什么?
 
== 機(jī)器人推薦 ==
 
迎賓講解服務(wù)機(jī)器人

服務(wù)機(jī)器人(迎賓、講解、導(dǎo)診...)

智能消毒機(jī)器人

智能消毒機(jī)器人

機(jī)器人底盤

機(jī)器人底盤

 

商用機(jī)器人  Disinfection Robot   展廳機(jī)器人  智能垃圾站  輪式機(jī)器人底盤  迎賓機(jī)器人  移動機(jī)器人底盤  講解機(jī)器人  紫外線消毒機(jī)器人  大屏機(jī)器人  霧化消毒機(jī)器人  服務(wù)機(jī)器人底盤  智能送餐機(jī)器人  霧化消毒機(jī)  機(jī)器人OEM代工廠  消毒機(jī)器人排名  智能配送機(jī)器人  圖書館機(jī)器人  導(dǎo)引機(jī)器人  移動消毒機(jī)器人  導(dǎo)診機(jī)器人  迎賓接待機(jī)器人  前臺機(jī)器人  導(dǎo)覽機(jī)器人  酒店送物機(jī)器人  云跡科技潤機(jī)器人  云跡酒店機(jī)器人  智能導(dǎo)診機(jī)器人 
版權(quán)所有 © 創(chuàng)澤智能機(jī)器人集團(tuán)股份有限公司     中國運營中心:北京·清華科技園九號樓5層     中國生產(chǎn)中心:山東日照太原路71號
銷售1:4006-935-088    銷售2:4006-937-088   客服電話: 4008-128-728