資訊動(dòng)態(tài)
語(yǔ)音芯片介紹,語(yǔ)音芯片知識(shí),語(yǔ)音芯片市場(chǎng)
語(yǔ)音芯片供應(yīng)商:深圳思科電子有限公司
思科微--九齊NY語(yǔ)音芯片 語(yǔ)音芯片的定義? / 什么是語(yǔ)音芯片? / Voice IC?/語(yǔ)音IC?(提供各類(lèi)語(yǔ)音IC:思科微信息科技——九齊、華邦語(yǔ)音IC華東總代理。) 什么是語(yǔ)音芯片?語(yǔ)音芯片又稱:語(yǔ)音IC,又被叫做聲音芯片。 (一)、語(yǔ)音基礎(chǔ)知識(shí) 1、什么是語(yǔ)音芯片? http:// 語(yǔ)音芯片定義:將語(yǔ)音信號(hào)通過(guò)采樣轉(zhuǎn)化為數(shù)字,存儲(chǔ)在IC的ROM中,再通過(guò)電路將ROM中的數(shù)字還原成語(yǔ)音信號(hào)。 普通語(yǔ)音芯片放音功能實(shí)質(zhì)上是一個(gè)DAC過(guò)程,而ADC過(guò)程資料是由電腦完成,其中包括對(duì)語(yǔ)音信號(hào)的采樣、壓縮、EQ等處理。 錄音芯片包括ADC和DAC兩個(gè)過(guò)程,都是由芯片本身完成的,包括語(yǔ)音數(shù)據(jù)的采集、分析、壓縮、存儲(chǔ)、播放等步驟。 ADC=Analog Digital Change 模數(shù)轉(zhuǎn)換 DAC= Digital Analog Change 數(shù)模轉(zhuǎn)換 音質(zhì)的優(yōu)劣取決于ADC和DAC位數(shù)的多少。例如,華邦的W90P710系列,ADC和DAC均為32bit接近真人音質(zhì)。HELIOS公司的H224QP系列與九齊的NY3\NY5系列,ADC和DAC均為16bit,接近CD音質(zhì)。SUNLINK公司的SLP300系列與佑華的AMEFB系列的DAC為8bit,為普通音質(zhì)。 2、語(yǔ)音信號(hào)的量化表述:(分類(lèi):語(yǔ)音芯片 和 音樂(lè)芯片) (a) “語(yǔ)音芯片”介紹: (1)語(yǔ)音信號(hào)的量化 采樣率(f)、位數(shù)(n)、波特率(T) 采樣:將語(yǔ)音模擬信號(hào)轉(zhuǎn)化成數(shù)字信號(hào)。 采樣率:每秒采樣的個(gè)數(shù)(byte)。 波特率:每秒鐘采樣的位數(shù)(bit)。波特率直接決定音質(zhì)。Bps: bit per second 采樣位數(shù)指在二進(jìn)制條件下的位數(shù)。一般在沒(méi)有特別說(shuō)明的情況下,聲音的采樣位數(shù)指8位,由00H--FFH,靜音定為80H。 (2)采樣率 奈奎斯特抽樣定理(Nyquist Law):要從抽樣信號(hào)中無(wú)失真地恢復(fù)原信號(hào),抽樣頻率應(yīng)大于2倍信號(hào)最高頻率。抽樣頻率小于2倍頻譜最高頻率時(shí),信號(hào)的頻譜有混疊。抽樣頻率大于2倍頻譜最高頻率時(shí),信號(hào)的頻譜無(wú)混疊。 嗓音的頻帶寬度為20~20K HZ左右,普通的聲音大概在3KHZ以下。所以,一般CD取的音質(zhì)為44.1K和16bit,如果碰到某些特別的聲音,如樂(lè)器,音質(zhì)也有用48K和24bit的情況,但不是主流。 一般在我們處理針對(duì)普通語(yǔ)音IC的時(shí)候,采樣率最高達(dá)到16K就夠了、說(shuō)話聲一般取8K(如電話音質(zhì))、6K左右。低于6K效果比較差。 在應(yīng)用單片機(jī)的過(guò)程中,采樣越高,定時(shí)器中斷速度越快,會(huì)影響到其他信號(hào)的監(jiān)控和檢測(cè),所以要綜合考慮。 (3)語(yǔ)音壓縮技術(shù)。 由于語(yǔ)音數(shù)據(jù)量龐大,對(duì)語(yǔ)音數(shù)據(jù)進(jìn)行有效壓縮是很必要的,能夠使我們?cè)谟邢薜腞OM空間里錄入更多的語(yǔ)音內(nèi)容。有以下幾種方式: 語(yǔ)音分段:將語(yǔ)音中可以重復(fù)的部分截取出來(lái),通過(guò)排列組合將內(nèi)容完整地回放出來(lái)。 語(yǔ)音采樣:一般我們使用的喇叭頻響曲線在中頻部分,較少用到高頻,所以,在喇叭音質(zhì)可以接受的情況下,適當(dāng)降低采樣頻率,達(dá)到壓縮效果,這種過(guò)程是不可逆的,無(wú)法恢復(fù)原貌,叫有損壓縮。 數(shù)學(xué)壓縮:主要是針對(duì)采樣位數(shù)進(jìn)行壓縮,這種方式也是有損壓縮。例如,我們經(jīng)常采用的ADPCM壓縮格式,是將語(yǔ)音數(shù)據(jù)從16bit壓縮到4bit,壓縮率是4倍。MP3是對(duì)數(shù)據(jù)流進(jìn)行壓縮,涉及到數(shù)據(jù)預(yù)測(cè)問(wèn)題,它的波特率壓縮倍率為10倍左右。 通常,以上幾種壓縮方式都是綜合起來(lái)使用的。 (4)常用語(yǔ)音格式 PCM格式: Pulse Code Modulation 脈沖編碼調(diào)制,它將聲音模擬信號(hào)采樣后得到量化后的語(yǔ)音數(shù)據(jù),是最基本最原始的一種語(yǔ)音格式。同它極為類(lèi)似的還有RAW格式和SND格式。它們都是純語(yǔ)音格式。 WAV格式:Wave Audio Files 是微軟公司開(kāi)發(fā)的一種聲音文件格式,也叫波形聲音文件,被Windows平臺(tái)及其應(yīng)用程序廣泛支持。WAV格式支持許多壓縮算法,支持多種音頻位數(shù)、采樣頻率和聲道,但WAV格式對(duì)存儲(chǔ)空間需求太大不便于交流和傳播。WAV文件里面存放的每一塊數(shù)據(jù)都有自己獨(dú)立的標(biāo)識(shí),通過(guò)這些標(biāo)識(shí)可以告訴用戶究竟這是什么數(shù)據(jù),這些數(shù)據(jù)包括采樣頻率和位數(shù),單聲道(mono)還是立體聲(stero)等。 ADPCM格式:是利用對(duì)過(guò)去的幾個(gè)抽樣值來(lái)預(yù)測(cè)當(dāng)前輸入的樣值,并使其具有自適應(yīng)的預(yù)測(cè)功能與實(shí)際檢測(cè)值進(jìn)行比較,隨時(shí)對(duì)測(cè)得的差值自動(dòng)進(jìn)行量化級(jí)差的處理,使之始終保持與信號(hào)同步變化。它適用于語(yǔ)音變化率適中的情況,而且聲音回放過(guò)程簡(jiǎn)短。它的優(yōu)點(diǎn)是對(duì)于人聲的處理比較逼真,一般達(dá)到90%以上,已廣泛地應(yīng)用于電話通信領(lǐng)域。 MP3格式: Moving Picture Experts Group Audio Layer III,簡(jiǎn)稱為MP3。它是利用 MPEG Audio Layer 3 的技術(shù),采取了名為“感官編碼技術(shù)”的編碼算法:編碼時(shí)先對(duì)音頻文件進(jìn)行頻譜分析,然后用過(guò)濾器濾掉噪音電平,接著通過(guò)量化的方式將剩下的每一位打散排列,最后形成具有較高壓縮比的mp3文件,并使壓縮后的文件在回放時(shí)能夠達(dá)到較接近原音源的聲音效果。它的實(shí)質(zhì)是vbr(Variant Bitrate 可變波特率)可以根據(jù)編碼的內(nèi)容動(dòng)態(tài)地選擇合適的波特率,因此編碼的結(jié)果是在保證了音質(zhì)的同時(shí)又照顧了文件的大小。 mp3壓縮率10倍甚至12倍。是最初出現(xiàn)的一種高壓縮率的語(yǔ)音格式。 Linear Scale格式:根據(jù)聲音的變化率大小,把聲音分成若干段,對(duì)每段用線性比例進(jìn)行壓縮,但是它的比例是可變的。SUNLINK公司和ALPHA公司的Linear Scale格式為5bit。 Logpcm格式:基本上對(duì)整個(gè)聲音進(jìn)行線性壓縮,將最后若干位去掉。這種壓縮方式在硬件上很容易實(shí)現(xiàn),但音質(zhì)比Linear Scale差一些,特別是音量較小聲音比較細(xì)膩的情況下效果較差。主要用于pure speech方面。 (b)“音樂(lè)芯片”介紹: (1)音樂(lè)的通道與音色:http:// 包絡(luò)(envelope)方波(patch) 通道(channel) 包絡(luò):合成音色的一部分,單位時(shí)間內(nèi)音符輸出的變化,常見(jiàn)有“ADSR” 方波:合成音色的一部分,單位時(shí)間內(nèi)音符方波電流的變化。(另見(jiàn)三角波等) 通道:在同一時(shí)間內(nèi),芯片輸出的音符個(gè)數(shù),即“單音樂(lè)器”的個(gè)數(shù)。 PCT:模擬音色的一種,通過(guò)采樣256個(gè)點(diǎn)的樂(lè)器聲音來(lái)模擬出各個(gè)音符的音高。(音色柔和,占空間小,但不夠真實(shí)) FULL WAVE:通過(guò)采集一種樂(lè)器聲音來(lái)模擬各個(gè)音符音高。(樂(lè)器聲真實(shí),但占用空間大,且采集音色音質(zhì)要求高) (2)音樂(lè)的壓縮: 由于音樂(lè)數(shù)據(jù)量龐大,對(duì)音樂(lè)數(shù)據(jù)進(jìn)行有效壓縮是很必要的,能夠使我們?cè)谟邢薜腞OM空間里錄入更多的音樂(lè)內(nèi)容。有以下幾種方式: 音樂(lè)分段:將音樂(lè)中可以重復(fù)的部分截取出來(lái),通過(guò)排列組合將內(nèi)容完整地回放出來(lái)。 音色:根據(jù)音樂(lè)的豐滿程度、需求程度,來(lái)確定Full wave,PCT、dual tone的選擇,各個(gè)音色占用空間不懂,音色質(zhì)量也不同。。 數(shù)學(xué)壓縮:主要是針對(duì)采樣的音色(Full wave)進(jìn)行壓縮,這種方式也是有損壓縮,對(duì)于要采集的音色進(jìn)行降采樣、處理等減小采集音色的大。ㄍZ(yǔ)音類(lèi)的修音)。 (3)常用音樂(lè)格式: MID格式:MIDI(Musical Instrument Digital Interface)樂(lè)器數(shù)字接口 ,是20 世紀(jì)80 年代初為解決電聲樂(lè)器之間的通信問(wèn)題而提出的。MIDI 傳輸?shù)牟皇锹曇粜盘?hào) 而是音符、控制參數(shù)等指令。 WAV格式:(相見(jiàn)語(yǔ)音IC類(lèi)介紹)采集音色的格式。 3、語(yǔ)音ROM空間的表述http:// 語(yǔ)音芯片為表述的形象化,由語(yǔ)音長(zhǎng)度來(lái)表示 a)普通語(yǔ)音芯片以6K采樣率為語(yǔ)音長(zhǎng)度計(jì)算標(biāo)準(zhǔn)。 b)錄音IC以4K采樣率為語(yǔ)音長(zhǎng)度計(jì)算標(biāo)準(zhǔn)。 即:以6k(4k)采樣率芯片可以播放的長(zhǎng)度。 4、語(yǔ)音芯片的要素http:// 相同品種的芯片成本與芯片的大小成正比。 a)I/O口的分配和ROM的大。ㄕZ(yǔ)音秒數(shù))決定芯片成本。低秒數(shù)語(yǔ)音芯片其I/O口較少。 b)音質(zhì)提高,采樣提高,語(yǔ)音秒數(shù)縮短。 音質(zhì)降低,采樣降低,語(yǔ)音秒數(shù)變長(zhǎng) c) 語(yǔ)音秒數(shù)的計(jì)算方法:M/(n*f) M---ROM大小(bit) n*f---波特率 5、聲音處理軟件介紹http:// 1)SoundForge 2)Cooledit 3)goldwave 4)Calewalk 6、語(yǔ)音芯片分類(lèi):http:// 語(yǔ)音芯片根據(jù)集成電路類(lèi)型來(lái)分凡是與聲音有關(guān)系的集成電路被統(tǒng)稱為語(yǔ)音芯片(又稱語(yǔ)音IC這里應(yīng)該叫成Voice IC)但是在語(yǔ)音芯片的大類(lèi)型中又被分為語(yǔ)音IC(這里應(yīng)該叫成Speech IC)音樂(lè)IC(這里應(yīng)該叫成Music IC)兩種. (a)現(xiàn)在市場(chǎng)上常見(jiàn)語(yǔ)音芯片分類(lèi): 短時(shí)間芯片有10秒,20秒,40秒,80秒170秒的芯片,針對(duì)型號(hào):SK系列、ISD1700系列芯片和NY3系列芯片。 常用的模塊有:6分鐘,8分鐘,16分鐘,1小時(shí)的等。。針對(duì)型號(hào):SK588D系列語(yǔ)音模塊 長(zhǎng)時(shí)間的芯片有:340秒,500秒,1000秒,2000秒更長(zhǎng)。。針對(duì)型號(hào):SK340、ISD4000、NY5系列語(yǔ)音芯片 通用的芯片有:3秒到340秒。針對(duì)型號(hào):SK系列,SKB系列NY系列. (b)現(xiàn)在市場(chǎng)上常見(jiàn)音樂(lè)芯片分類(lèi): 單音片:是一種最基本的音樂(lè)IC是音樂(lè)單通道的同一時(shí)間音符輸出的多少?zèng)Q定了單音片的效果有70多100多音符等等. 音樂(lè)通道:2通道、3通道、4通道、8通道、12通道等更多。。。針對(duì)型號(hào):NY2系列、NY5系列 |