資訊動(dòng)態(tài)
高性能語(yǔ)音芯片提升人機(jī)交互性能,應(yīng)用家用電器設(shè)備,車載設(shè)備
伴隨著各種家用電器設(shè)備,車載設(shè)備的功能增加,設(shè)備的操控性越來(lái)越復(fù)雜;人機(jī)交互設(shè)計(jì)在系統(tǒng)設(shè)計(jì)中的地位越來(lái)越重要。受到系統(tǒng)成本、體積等多方面的限制,應(yīng)用開(kāi)發(fā)人員可以選擇的人機(jī)交互設(shè)計(jì)方法并不多。利用語(yǔ)音合成芯片來(lái)增強(qiáng)人機(jī)交互性能的方法又重新開(kāi)始受到應(yīng)用開(kāi)發(fā)人員的重視。 語(yǔ)音合成芯片的核心技術(shù)是語(yǔ)音數(shù)據(jù)壓縮。這項(xiàng)技術(shù)在二戰(zhàn)前就開(kāi)始被研究,但其轉(zhuǎn)化為芯片并被實(shí)際產(chǎn)品采用卻是在70年代末。由于受到存儲(chǔ)器容量的限制,當(dāng)時(shí)比較流行的是參數(shù)合成方式,這是一種模擬人體發(fā)聲器官,建立數(shù)學(xué)模型,并以此作為參數(shù)進(jìn)行壓縮合成的方法。但是這種方法的實(shí)際使用效果并不能滿足人們的要求,最終在市場(chǎng)上受到認(rèn)可的是基于ADPCM(Adaptive differential PCM)技術(shù)的語(yǔ)音壓縮合成方式。OKI公司從70年代就從事ADPCM的研究開(kāi)發(fā)工作,并不斷進(jìn)行改進(jìn),相繼推出了具有更大壓縮率和更高音質(zhì)的OKI ADPCM、OKI ADPCM2方式。OKI語(yǔ)音芯片完美的音質(zhì),優(yōu)秀的性能得到了客戶的認(rèn)可,25年的累計(jì)出貨量達(dá)到了4億個(gè)。 高音質(zhì)語(yǔ)音合成芯片增強(qiáng)人機(jī)交互性能 在使用語(yǔ)音合成芯片時(shí),最令應(yīng)用開(kāi)發(fā)人員頭痛的問(wèn)題是如何在有限的存儲(chǔ)器當(dāng)中,放入更多的語(yǔ)音數(shù)據(jù)。通常的做法是將播放內(nèi)容中重復(fù)出現(xiàn)的地方進(jìn)行切割,在需要利用的時(shí)候,對(duì)這些重復(fù)內(nèi)容進(jìn)行復(fù)用。雖然這個(gè)做法可以解決問(wèn)題,但一般在使用當(dāng)中,如果有大量需要復(fù)用的語(yǔ)音段出現(xiàn)時(shí),將會(huì)使播放控制程序非常冗長(zhǎng)。而且在不同的地方進(jìn)行復(fù)用時(shí),音調(diào)、語(yǔ)速等都會(huì)有微妙變化,這些變化如果不加以區(qū)分處理,就會(huì)在播放時(shí)造成不自然和失真。因此在播放不同內(nèi)容時(shí)需要適當(dāng)加入不同的延時(shí)。比如在實(shí)現(xiàn)圖1的播放內(nèi)容時(shí),一般需要程序?qū)懗扇缦滦问健? Play(Address1); Delay(xxx); Play(Address2); Delay(xxx); Play(Address4); Delay(xxx); Play(Address5); 這種實(shí)現(xiàn)方法無(wú)疑是對(duì)程序存儲(chǔ)器的一種極大浪費(fèi)。而且由于在播放指令發(fā)出時(shí),MCU必須對(duì)相應(yīng)的控制線或者IO進(jìn)行操作,指令的反復(fù)使用也是對(duì)CPU資源的浪費(fèi)。更糟糕的是在播放指令執(zhí)行過(guò)程當(dāng)中,一旦有中斷等意外發(fā)生的話,很容易出現(xiàn)播放異,F(xiàn)象。 OKI的語(yǔ)音芯片為了使控制MCU的開(kāi)銷最小,在語(yǔ)音芯片產(chǎn)品中加入了ROM Edit功能,通過(guò)在制作語(yǔ)音數(shù)據(jù)時(shí),指定需要復(fù)用和延時(shí)的部分,把絕大部分處理工作交給語(yǔ)音合成芯片來(lái)完成,大幅度降低控制MCU的開(kāi)銷。 例如使用OKI的ROM Edit功能播放圖示的兩段內(nèi)容時(shí),可以使用下述程序: Play(ROM Edit area1); Play(ROM Edit area2); 語(yǔ)音芯片接受到這兩條指令后,將自行按照ROM Edit領(lǐng)域的指定,自動(dòng)將相應(yīng)地址的語(yǔ)音數(shù)據(jù)進(jìn)行播放連接,這些過(guò)程將無(wú)須MCU參與。由于ROM Edit領(lǐng)域中使用的僅僅只是地址信息,所以對(duì)于存儲(chǔ)器的占用率是相當(dāng)?shù)偷摹.?dāng)然在ROM Edit領(lǐng)域指定存儲(chǔ)器地址的同時(shí),也可以插入相應(yīng)的延時(shí)信息,由芯片自行完成播放之間的延時(shí)處理。 簡(jiǎn)單應(yīng)對(duì)多國(guó)語(yǔ)言產(chǎn)品開(kāi)發(fā) 如何將同樣的核心設(shè)計(jì)適用到不同地區(qū)的市場(chǎng),是很多設(shè)備生產(chǎn)廠商都要考慮的問(wèn)題。對(duì)于使用語(yǔ)音芯片作為人機(jī)交互手段的產(chǎn)品來(lái)說(shuō),首要面臨的問(wèn)題就是如何設(shè)計(jì)多國(guó)語(yǔ)言的版本。到目前為止,當(dāng)提示語(yǔ)言改變時(shí),將不可避免地造成控制軟件的修改,而且針對(duì)不同語(yǔ)言的產(chǎn)品必須準(zhǔn)備不同版本的語(yǔ)音芯片,給庫(kù)存和管理都造成壓力。OKI的語(yǔ)音產(chǎn)品通過(guò)存儲(chǔ)器的庫(kù)切換功能,輕松實(shí)現(xiàn)了在同一塊芯片上整合不同語(yǔ)言版本的功能。 圖示為在同一塊芯片中存入了中英文兩種語(yǔ)言信息。各種語(yǔ)言信息所對(duì)應(yīng)的事件都是一樣的,使用完全一樣的控制軟件。在設(shè)計(jì)不同語(yǔ)言的產(chǎn)品時(shí),只需要簡(jiǎn)單地將SEL0,SEL1的設(shè)置進(jìn)行相應(yīng)切換,就可以輕松實(shí)現(xiàn)同一個(gè)設(shè)計(jì)的中英文版本。OKI的語(yǔ)音芯片最多可以劃分為4個(gè)庫(kù),也就是說(shuō)使用同一塊芯片可以實(shí)現(xiàn)4個(gè)語(yǔ)種的播放。 先進(jìn)的存儲(chǔ)器方式 語(yǔ)音芯片的應(yīng)用開(kāi)發(fā)人員面臨的一個(gè)棘手問(wèn)題是如何決定在開(kāi)發(fā)測(cè)試階段和規(guī)模量產(chǎn)階段進(jìn)行切換。語(yǔ)音數(shù)據(jù)需要進(jìn)行較長(zhǎng)時(shí)間音質(zhì)評(píng)估和適用性測(cè)試,這個(gè)過(guò)程一般都是使用Flash或者OTP(One-timeーprogramming)方式的存儲(chǔ)器,以便快速對(duì)語(yǔ)音數(shù)據(jù)進(jìn)行評(píng)估。一旦評(píng)估結(jié)束后,在量產(chǎn)產(chǎn)品中一般都傾向于使用性價(jià)比更高的MaskROM存儲(chǔ)器。但是MaskROM的漫長(zhǎng)生產(chǎn)周期,起訂數(shù)量的限制和不便宜的掩膜費(fèi)用都加重了開(kāi)發(fā)人員的壓力,客戶要求的頻繁變更更是雪上加霜。以至于很多應(yīng)用設(shè)計(jì)直接將Flash或者OTP方式的語(yǔ)音芯片應(yīng)用到了量產(chǎn)產(chǎn)品中,而這樣又對(duì)量產(chǎn)的效率和品質(zhì)管理直接造成了影響。 為了更好地平衡語(yǔ)音芯片評(píng)估階段的方便快捷和量產(chǎn)階段高品質(zhì)的大量廉價(jià)生產(chǎn),OKI的語(yǔ)音芯片采用了OKI獨(dú)自的P2ROM(Production programmed ROM)存儲(chǔ)器。這種獨(dú)特的存儲(chǔ)器不同于MaskROM需要在芯片生產(chǎn)的前端工藝流程中進(jìn)行寫入操作,可以在芯片的封裝測(cè)試階段進(jìn)行數(shù)據(jù)寫入操作。因此芯片生產(chǎn)廠可以事先準(zhǔn)備不同容量的空白芯片,等待客戶的數(shù)據(jù)定好后,在芯片的封裝測(cè)試階段進(jìn)行寫入操作。 由于不需要經(jīng)過(guò)前端工藝漫長(zhǎng)的生產(chǎn)流程,工廠可以在極短的時(shí)間內(nèi)(7-10天)完成數(shù)據(jù)的寫入測(cè)試和出貨,大大縮短了交貨時(shí)間。而且極低的起訂數(shù)量和零寫入費(fèi)用對(duì)于開(kāi)發(fā)工程師來(lái)說(shuō)更是極具吸引力。對(duì)于生產(chǎn)管理部門而言,P2ROM極短的交貨期,優(yōu)秀的量產(chǎn)應(yīng)對(duì)能力,以及工廠到工廠的點(diǎn)對(duì)點(diǎn)方式,減少了庫(kù)存,降低了生產(chǎn)成本,減少了貼片前的測(cè)試流程,大大提高了生產(chǎn)效率。OKI使用P2ROM 存儲(chǔ)器的語(yǔ)音芯片直接覆蓋了開(kāi)發(fā)、試產(chǎn)、量產(chǎn)的全部階段。設(shè)計(jì)工程師再也不用發(fā)愁如何應(yīng)對(duì)客戶規(guī)格的突然變更和量產(chǎn)成本之間的矛盾了。 方便快捷的語(yǔ)音數(shù)據(jù)開(kāi)發(fā)工具 語(yǔ)音芯片的應(yīng)用開(kāi)發(fā)人員面臨的另外一個(gè)棘手的問(wèn)題就是如何準(zhǔn)備語(yǔ)音數(shù)據(jù)。通常語(yǔ)音數(shù)據(jù)的制作都需要聘請(qǐng)專門的播音員,租用專用的錄音棚進(jìn)行錄音。不但費(fèi)用高,而且費(fèi)時(shí)費(fèi)力。 有些開(kāi)發(fā)商為了省事,干脆使用PC機(jī)加麥克風(fēng)進(jìn)行錄音,導(dǎo)致各種討厭的背景噪音和語(yǔ)音芯片如影隨形。這些問(wèn)題都直接或間接地限制了語(yǔ)音芯片的應(yīng)用。 OKI最新開(kāi)發(fā)了利用TTS(Text to Speech)技術(shù)的語(yǔ)音數(shù)據(jù)生成工具“隨心錄”。自然流暢的中、英、韓、日等多國(guó)語(yǔ)言的語(yǔ)音數(shù)據(jù)合成引擎,大大方便了語(yǔ)音芯片的應(yīng)用開(kāi)發(fā)人員,實(shí)現(xiàn)了“芯”隨字動(dòng)。使用OKI的專用工具可以完成從語(yǔ)音數(shù)據(jù)的生成、波形編輯、ROM編輯、測(cè)試、燒寫、聲音評(píng)估等一連串的工作。大幅縮短了開(kāi)發(fā)周期,節(jié)約了開(kāi)發(fā)成本。彈指間完成語(yǔ)音數(shù)據(jù)準(zhǔn)備的日子已經(jīng)來(lái)到,應(yīng)用開(kāi)發(fā)工程師可以將自己的更多才智和時(shí)間放在更有創(chuàng)造性、更具靈動(dòng)性的設(shè)計(jì)開(kāi)發(fā)工作上。
本文小結(jié) 為了獲得更好的用戶體驗(yàn),通用化設(shè)計(jì)(Universal design)已經(jīng)開(kāi)始在以家電,游戲機(jī),車載設(shè)備等為主的領(lǐng)域生根發(fā)展。作為通用化設(shè)計(jì)的一個(gè)側(cè)面,利用語(yǔ)音交互的人機(jī)接口設(shè)計(jì)今后會(huì)變得越來(lái)越普遍。OKI的語(yǔ)音合成芯片在各個(gè)方面都已經(jīng)做好準(zhǔn)備,可以方便快速地應(yīng)用到不同的設(shè)計(jì)領(lǐng)域中 |