Linux音頻編程指南

一、數字音頻

音頻信號是一種連續變化的模擬信號，但計算機只能處理和記錄二進制的數字信號，由自然音源得到的音頻信號必須經過一定的變換，成為數字音頻信號之后，才能送到計算機中作進一步的處理。

數字音頻系統通過將聲波的波型轉換成一系列二進制數據，來實現對原始聲音的重現，實現這一步驟的設備常被稱為模/數轉換器（A/D）。A/D轉換器以每秒鐘上萬次的速率對聲波進行采樣，每個采樣點都記錄下了原始模擬聲波在某一時刻的狀態，通常稱之為樣本（sample），而每一秒鐘所采樣的數目則稱為采樣頻率，通過將一串連續的樣本連接起來，就可以在計算機中描述一段聲音了。對于采樣過程中的每一個樣本來說，數字音頻系統會分配一定存儲位來記錄聲波的振幅，一般稱之為采樣分辯率或者采樣精度，采樣精度越高，聲音還原時就會越細膩。

數字音頻涉及到的概念非常多，對于在Linux下進行音頻編程的程序員來說，最重要的是理解聲音數字化的兩個關鍵步驟：采樣和量化。采樣就是每隔一定時間就讀一次聲音信號的幅度，而量化則是將采樣得到的聲音信號幅度轉換為數字值，從本質上講，采樣是時間上的數字化，而量化則是幅度上的數字化。下面介紹幾個在進行音頻編程時經常需要用到的技術指標：

采樣頻率
采樣頻率是指將模擬聲音波形進行數字化時，每秒鐘抽取聲波幅度樣本的次數。采樣頻率的選擇應該遵循奈奎斯特（Harry Nyquist）采樣理論：如果對某一模擬信號進行采樣，則采樣后可還原的最高信號頻率只有采樣頻率的一半，或者說只要采樣頻率高于輸入信號最高頻率的兩倍，就能從采樣信號系列重構原始信號。正常人聽覺的頻率范圍大約在20Hz~20kHz之間，根據奈奎斯特采樣理論，為了保證聲音不失真，采樣頻率應該在 40kHz左右。常用的音頻采樣頻率有8kHz、11.025kHz、22.05kHz、16kHz、37.8kHz、44.1kHz、48kHz等，如果采用更高的采樣頻率，還可以達到DVD的音質。

量化位數
量化位數是對模擬音頻信號的幅度進行數字化，它決定了模擬信號數字化以后的動態范圍，常用的有8位、12位和16位。量化位越高，信號的動態范圍越大，數字化后的音頻信號就越可能接近原始信號，但所需要的存貯空間也越大。

聲道數
聲道數是反映音頻數字化質量的另一個重要因素，它有單聲道和雙聲道之分。雙聲道又稱為立體聲，在硬件中有兩條線路，音質和音色都要優于單聲道，但數字化后占據的存儲空間的大小要比單聲道多一倍。

二、聲卡驅動

出于對安全性方面的考慮，Linux下的應用程序無法直接對聲卡這類硬件設備進行操作，而是必須通過內核提供的驅動程序才能完成。在Linux上進行音頻編程的本質就是要借助于驅動程序，來完成對聲卡的各種操作。

對硬件的控制涉及到寄存器中各個比特位的操作，通常這是與設備直接相關并且對時序的要求非常嚴格，如果這些工作都交由應用程序員來負責，那么對聲卡的編程將變得異常復雜而困難起來，驅動程序的作用正是要屏蔽硬件的這些底層細節，從而簡化應用程序的編寫。目前Linux下常用的聲卡驅動程序主要有兩種：OSS和ALSA。

最早出現在Linux上的音頻編程接口是OSS（Open Sound System），它由一套完整的內核驅動程序模塊組成，可以為絕大多數聲卡提供統一的編程接口。OSS出現的歷史相對較長，這些內核模塊中的一部分（OSS/Free）是與Linux內核源碼共同免費發布的，另外一些則以二進制的形式由4Front Technologies公司提供。由于得到了商業公司的鼎力支持，OSS已經成為在Linux下進行音頻編程的事實標準，支持OSS的應用程序能夠在絕大多數聲卡上工作良好。

雖然OSS已經非常成熟，但它畢竟是一個沒有完全開放源代碼的商業產品，ALSA（Advanced Linux Sound Architecture）恰好彌補了這一空白，它是在Linux下進行音頻編程時另一個可供選擇的聲卡驅動程序。ALSA除了像OSS那樣提供了一組內核驅動程序模塊之外，還專門為簡化應用程序的編寫提供了相應的函數庫，與OSS提供的基于ioctl的原始編程接口相比，ALSA函數庫使用起來要更加方便一些。ALSA的主要特點有：

支持多種聲卡設備
模塊化的內核驅動程序
支持SMP和多線程
提供應用開發函數庫
兼容OSS應用程序

ALSA和OSS最大的不同之處在于ALSA是由志愿者維護的自由項目，而OSS則是由公司提供的商業產品，因此在對硬件的適應程度上OSS要優于 ALSA，它能夠支持的聲卡種類更多。ALSA雖然不及OSS運用得廣泛，但卻具有更加友好的編程接口，并且完全兼容于OSS，對應用程序員來講無疑是一個更佳的選擇。

三、編程接口

如何對各種音頻設備進行操作是在Linux上進行音頻編程的關鍵，通過內核提供的一組系統調用，應用程序能夠訪問聲卡驅動程序提供的各種音頻設備接口，這是在Linux下進行音頻編程最簡單也是最直接的方法。

3.1 訪問音頻設備

無論是OSS還是ALSA，都是以內核驅動程序的形式運行在Linux內核空間中的，應用程序要想訪問聲卡這一硬件設備，必須借助于Linux內核所提供的系統調用（system call）。從程序員的角度來說，對聲卡的操作在很大程度上等同于對磁盤文件的操作：首先使用open系統調用建立起與硬件間的聯系，此時返回的文件描述符將作為隨后操作的標識；接著使用read系統調用從設備接收數據，或者使用write系統調用向設備寫入數據，而其它所有不符合讀/寫這一基本模式的操作都可以由ioctl系統調用來完成；最后，使用close系統調用告訴Linux內核不會再對該設備做進一步的處理。

open系統調用
系統調用open可以獲得對聲卡的訪問權，同時還能為隨后的系統調用做好準備，其函數原型如下所示：
int open(const char *pathname, int flags, int mode);

參數pathname是將要被打開的設備文件的名稱，對于聲卡來講一般是 /dev/dsp。參數flags用來指明應該以什么方式打開設備文件，它可以是O_RDONLY、O_WRONLY或者O_RDWR，分別表示以只讀、只寫或者讀寫的方式打開設備文件；參數mode通常是可選的，它只有在指定的設備文件不存在時才會用到，指明新創建的文件應該具有怎樣的權限。
如果open系統調用能夠成功完成，它將返回一個正整數作為文件標識符，在隨后的系統調用中需要用到該標識符。如果open系統調用失敗，它將返回-1，同時還會設置全局變量errno，指明是什么原因導致了錯誤的發生。
read系統調用
系統調用read用來從聲卡讀取數據，其函數原型如下所示：
int read(int fd, char *buf, size_t count);

參數fd是設備文件的標識符，它是通過之前的open系統調用獲得的；參數 buf是指向緩沖區的字符指針，它用來保存從聲卡獲得的數據；參數count則用來限定從聲卡獲得的最大字節數。如果read系統調用成功完成，它將返回從聲卡實際讀取的字節數，通常情況會比count的值要小一些；如果read系統調用失敗，它將返回-1，同時還會設置全局變量errno，來指明是什么原因導致了錯誤的發生。
write系統調用
系統調用write用來向聲卡寫入數據，其函數原型如下所示：
size_t write(int fd, const char *buf, size_t count);

系統調用write和系統調用read在很大程度是類似的，差別只在于 write是向聲卡寫入數據，而read則是從聲卡讀入數據。參數fd同樣是設備文件的標識符，它也是通過之前的open系統調用獲得的；參數buf是指向緩沖區的字符指針，它保存著即將向聲卡寫入的數據；參數count則用來限定向聲卡寫入的最大字節數。
如果write系統調用成功完成，它將返回向聲卡實際寫入的字節數；如果read系統調用失敗，它將返回-1，同時還會設置全局變量errno，來指明是什么原因導致了錯誤的發生。無論是 read還是write，一旦調用之后Linux內核就會阻塞當前應用程序，直到數據成功地從聲卡讀出或者寫入為止。
ioctl系統調用
系統調用ioctl可以對聲卡進行控制，凡是對設備文件的操作不符合讀/寫基本模式的，都是通過ioctl來完成的，它可以影響設備的行為，或者返回設備的狀態，其函數原型如下所示：

int ioctl(int fd, int request, ...);

參數fd是設備文件的標識符，它是在設備打開時獲得的；如果設備比較復雜，那么對它的控制請求相應地也會有很多種，參數request的目的就是用來區分不同的控制請求；通常說來，在對設備進行控制時還需要有其它參數，這要根據不同的控制請求才能確定，并且可能是與硬件設備直接相關的。
close系統調用
當應用程序使用完聲卡之后，需要用close系統調用將其關閉，以便及時釋放占用的硬件資源，其函數原型如下所示：
int close(int fd);

參數fd是設備文件的標識符，它是在設備打開時獲得的。一旦應用程序調用了close系統調用，Linux內核就會釋放與之相關的各種資源，因此建議在不需要的時候盡量及時關閉已經打開的設備。

3.2 音頻設備文件

對于Linux應用程序員來講，音頻編程接口實際上就是一組音頻設備文件，通過它們可以從聲卡讀取數據，或者向聲卡寫入數據，并且能夠對聲卡進行控制，設置采樣頻率和聲道數目等等。

/dev/sndstat
設備文件/dev/sndstat是聲卡驅動程序提供的最簡單的接口，通常它是一個只讀文件，作用也僅僅只限于匯報聲卡的當前狀態。一般說來，/dev/sndstat是提供給最終用戶來檢測聲卡的，不宜用于程序當中，因為所有的信息都可以通過 ioctl系統調用來獲得。 Linux提供的cat命令可以很方便地從/dev/sndstat獲得聲卡的當前狀態： [xiaowp@linuxgam sound]$ cat /dev/sndstat
/dev/dsp

聲卡驅動程序提供的/dev/dsp是用于數字采樣（sampling）和數字錄音（recording）的設備文件，它對于Linux下的音頻編程來講非常重要：向該設備寫數據即意味著激活聲卡上的D/A轉換器進行放音，而向該設備讀數據則意味著激活聲卡上的A/D轉換器進行錄音。目前許多聲卡都提供有多個數字采樣設備，它們在Linux下可以通過/dev/dsp1等設備文件進行訪問。

DSP是數字信號處理器（Digital Signal Processor）的簡稱，它是用來進行數字信號處理的特殊芯片，聲卡使用它來實現模擬信號和數字信號的轉換。聲卡中的DSP設備實際上包含兩個組成部分：在以只讀方式打開時，能夠使用A/D轉換器進行聲音的輸入；而在以只寫方式打開時，則能夠使用D/A轉換器進行聲音的輸出。嚴格說來，Linux下的應用程序要么以只讀方式打開/dev/dsp輸入聲音，要么以只寫方式打開/dev/dsp輸出聲音，但事實上某些聲卡驅動程序仍允許以讀寫的方式打開 /dev/dsp，以便同時進行聲音的輸入和輸出，這對于某些應用場合（如IP電話）來講是非常關鍵的。

在從DSP設備讀取數據時，從聲卡輸入的模擬信號經過A/D轉換器變成數字采樣后的樣本（sample），保存在聲卡驅動程序的內核緩沖區中，當應用程序通過read系統調用從聲卡讀取數據時，保存在內核緩沖區中的數字采樣結果將被復制到應用程序所指定的用戶緩沖區中。需要指出的是，聲卡采樣頻率是由內核中的驅動程序所決定的，而不取決于應用程序從聲卡讀取數據的速度。如果應用程序讀取數據的速度過慢，以致低于聲卡的采樣頻率，那么多余的數據將會被丟棄；如果讀取數據的速度過快，以致高于聲卡的采樣頻率，那么聲卡驅動程序將會阻塞那些請求數據的應用程序，直到新的數據到來為止。

在向DSP設備寫入數據時，數字信號會經過D/A轉換器變成模擬信號，然后產生出聲音。應用程序寫入數據的速度同樣應該與聲卡的采樣頻率相匹配，否則過慢的話會產生聲音暫停或者停頓的現象，過快的話又會被內核中的聲卡驅動程序阻塞，直到硬件有能力處理新的數據為止。與其它設備有所不同，聲卡通常不會支持非阻塞（non-blocking）的I/O操作。

無論是從聲卡讀取數據，或是向聲卡寫入數據，事實上都具有特定的格式（format），默認為8位無符號數據、單聲道、8KHz采樣率，如果默認值無法達到要求，可以通過ioctl系統調用來改變它們。通常說來，在應用程序中打開設備文件/dev/dsp之后，接下去就應該為其設置恰當的格式，然后才能從聲卡讀取或者寫入數據。
/dev/audio
/dev/audio類似于 /dev/dsp，它兼容于Sun工作站上的音頻設備，使用的是mu-law編碼方式。如果聲卡驅動程序提供了對/dev/audio的支持，那么在 Linux上就可以通過cat命令，來播放在Sun工作站上用mu-law進行編碼的音頻文件：
[xiaowp@linuxgam sound]$ cat audio.au > /dev/audio

由于設備文件/dev/audio主要出于對兼容性的考慮，所以在新開發的應用程序中最好不要嘗試用它，而應該以/dev/dsp進行替代。對于應用程序來說，同一時刻只能使用/dev/audio或者/dev/dsp其中之一，因為它們是相同硬件的不同軟件接口。
/dev/mixer
在聲卡的硬件電路中，混音器（mixer）是一個很重要的組成部分，它的作用是將多個信號組合或者疊加在一起，對于不同的聲卡來說，其混音器的作用可能各不相同。運行在Linux內核中的聲卡驅動程序一般都會提供/dev/mixer這一設備文件，它是應用程序對混音器進行操作的軟件接口。混音器電路通常由兩個部分組成：輸入混音器（input mixer）和輸出混音器（output mixer）。
輸入混音器負責從多個不同的信號源接收模擬信號，這些信號源有時也被稱為混音通道或者混音設備。模擬信號通過增益控制器和由軟件控制的音量調節器后，在不同的混音通道中進行級別（level）調制，然后被送到輸入混音器中進行聲音的合成。混音器上的電子開關可以控制哪些通道中有信號與混音器相連，有些聲卡只允許連接一個混音通道作為錄音的音源，而有些聲卡則允許對混音通道做任意的連接。經過輸入混音器處理后的信號仍然為模擬信號，它們將被送到A/D轉換器進行數字化處理。
輸出混音器的工作原理與輸入混音器類似，同樣也有多個信號源與混音器相連，并且事先都經過了增益調節。當輸出混音器對所有的模擬信號進行了混合之后，通常還會有一個總控增益調節器來控制輸出聲音的大小，此外還有一些音調控制器來調節輸出聲音的音調。經過輸出混音器處理后的信號也是模擬信號，它們最終會被送給喇叭或者其它的模擬輸出設備。對混音器的編程包括如何設置增益控制器的級別，以及怎樣在不同的音源間進行切換，這些操作通常來講是不連續的，而且不會像錄音或者放音那樣需要占用大量的計算機資源。由于混音器的操作不符合典型的讀/寫操作模式，因此除了open和close兩個系統調用之外，大部分的操作都是通過ioctl系統調用來完成的。與/dev/dsp不同，/dev/mixer允許多個應用程序同時訪問，并且混音器的設置值會一直保持到對應的設備文件被關閉為止。
為了簡化應用程序的設計，Linux上的聲卡驅動程序大多都支持將混音器的ioctl操作直接應用到聲音設備上，也就是說如果已經打開了/dev/dsp，那么就不用再打開/dev/mixer來對混音器進行操作，而是可以直接用打開/dev/dsp時得到的文件標識符來設置混音器。
/dev/sequencer
目前大多數聲卡驅動程序還會提供/dev/sequencer這一設備文件，用來對聲卡內建的波表合成器進行操作，或者對MIDI總線上的樂器進行控制，一般只用于計算機音樂軟件中。

四、應用框架

在Linux下進行音頻編程時，重點在于如何正確地操作聲卡驅動程序所提供的各種設備文件，由于涉及到的概念和因素比較多，所以遵循一個通用的框架無疑將有助于簡化應用程序的設計。

4.1 DSP編程

對聲卡進行編程時首先要做的是打開與之對應的硬件設備，這是借助于open系統調用來完成的，并且一般情況下使用的是/dev/dsp文件。采用何種模式對聲卡進行操作也必須在打開設備時指定，對于不支持全雙工的聲卡來說，應該使用只讀或者只寫的方式打開，只有那些支持全雙工的聲卡，才能以讀寫的方式打開，并且還要依賴于驅動程序的具體實現。Linux允許應用程序多次打開或者關閉與聲卡對應的設備文件，從而能夠很方便地在放音狀態和錄音狀態之間進行切換，建議在進行音頻編程時只要有可能就盡量使用只讀或者只寫的方式打開設備文件，因為這樣不僅能夠充分利用聲卡的硬件資源，而且還有利于驅動程序的優化。下面的代碼示范了如何以只寫方式打開聲卡進行放音（playback）操作：

int handle = open("/dev/dsp", O_WRONLY);
if (handle == -1) {
perror("open /dev/dsp");
return -1;
}

運行在Linux內核中的聲卡驅動程序專門維護了一個緩沖區，其大小會影響到放音和錄音時的效果，使用ioctl系統調用可以對它的尺寸進行恰當的設置。調節驅動程序中緩沖區大小的操作不是必須的，如果沒有特殊的要求，一般采用默認的緩沖區大小也就可以了。但需要注意的是，緩沖區大小的設置通常應緊跟在設備文件打開之后，這是因為對聲卡的其它操作有可能會導致驅動程序無法再修改其緩沖區的大小。下面的代碼示范了怎樣設置聲卡驅動程序中的內核緩沖區的大小：

int setting = 0xnnnnssss;
int result = ioctl(handle, SNDCTL_DSP_SETFRAGMENT, &setting);
if (result == -1) {
perror("ioctl buffer size");
return -1;
}
// 檢查設置值的正確性

在設置緩沖區大小時，參數setting實際上由兩部分組成，其低16位標明緩沖區的尺寸，相應的計算公式為buffer_size = 2^ssss，即若參數setting低16位的值為16，那么相應的緩沖區的大小會被設置為65536字節。參數setting的高16位則用來標明分片（fragment）的最大序號，它的取值范圍從2一直到0x7FFF，其中0x7FFF表示沒有任何限制。

接下來要做的是設置聲卡工作時的聲道（channel）數目，根據硬件設備和驅動程序的具體情況，可以將其設置為0（單聲道，mono）或者1（立體聲，stereo）。下面的代碼示范了應該怎樣設置聲道數目：

int channels = 0; // 0=mono 1=stereo
int result = ioctl(handle, SNDCTL_DSP_STEREO, &channels);
if ( result == -1 ) {
perror("ioctl channel number");
return -1;
}
if (channels != 0) {
// 只支持立體聲
}

采樣格式和采樣頻率是在進行音頻編程時需要考慮的另一個問題，聲卡支持的所有采樣格式可以在頭文件soundcard.h中找到，而通過ioctl系統調用則可以很方便地更改當前所使用的采樣格式。下面的代碼示范了如何設置聲卡的采樣格式：

int format = AFMT_U8;
int result = ioctl(handle, SNDCTL_DSP_SETFMT, &format);
if ( result == -1 ) {
perror("ioctl sample format");
return -1;
}
// 檢查設置值的正確性

聲卡采樣頻率的設置也非常容易，只需在調用ioctl時將第二個參數的值設置為SNDCTL_DSP_SPEED，同時在第三個參數中指定采樣頻率的數值就行了。對于大多數聲卡來說，其支持的采樣頻率范圍一般為5kHz到44.1kHz或者48kHz，但并不意味著該范圍內的所有頻率都會被硬件支持，在Linux下進行音頻編程時最常用到的幾種采樣頻率是11025Hz、16000Hz、22050Hz、32000Hz和44100Hz。下面的代碼示范了如何設置聲卡的采樣頻率：

int rate = 22050;
int result = ioctl(handle, SNDCTL_DSP_SPEED, &rate);
if ( result == -1 ) {
perror("ioctl sample format");
return -1;
}
// 檢查設置值的正確性

4.2 Mixer編程

聲卡上的混音器由多個混音通道組成，它們可以通過驅動程序提供的設備文件/dev/mixer進行編程。對混音器的操作是通過ioctl系統調用來完成的，并且所有控制命令都由SOUND_MIXER或者MIXER開頭，表1列出了常用的幾個混音器控制命令：

名稱作用 SOUND_MIXER_VOLUME 主音量調節 SOUND_MIXER_BASS 低音控制 SOUND_MIXER_TREBLE 高音控制 SOUND_MIXER_SYNTH FM合成器 SOUND_MIXER_PCM 主D/A轉換器 SOUND_MIXER_SPEAKER PC喇叭 SOUND_MIXER_LINE 音頻線輸入 SOUND_MIXER_MIC 麥克風輸入 SOUND_MIXER_CD CD輸入 SOUND_MIXER_IMIX 回放音量 SOUND_MIXER_ALTPCM 從D/A 轉換器 SOUND_MIXER_RECLEV 錄音音量 SOUND_MIXER_IGAIN 輸入增益 SOUND_MIXER_OGAIN 輸出增益 SOUND_MIXER_LINE1 聲卡的第1輸入 SOUND_MIXER_LINE2 聲卡的第2輸入 SOUND_MIXER_LINE3 聲卡的第3輸入
表1 混音器命令

對聲卡的輸入增益和輸出增益進行調節是混音器的一個主要作用，目前大部分聲卡采用的是8位或者16位的增益控制器，但作為程序員來講并不需要關心這些，因為聲卡驅動程序會負責將它們變換成百分比的形式，也就是說無論是輸入增益還是輸出增益，其取值范圍都是從0到100。在進行混音器編程時，可以使用 SOUND_MIXER_READ宏來讀取混音通道的增益大小，例如在獲取麥克風的輸入增益時，可以使用如下的代碼：

int vol;
ioctl(fd, SOUND_MIXER_READ(SOUND_MIXER_MIC), &vol);
printf("Mic gain is at %d %%\n", vol);

對于只有一個混音通道的單聲道設備來說，返回的增益大小保存在低位字節中。而對于支持多個混音通道的雙聲道設備來說，返回的增益大小實際上包括兩個部分，分別代表左、右兩個聲道的值，其中低位字節保存左聲道的音量，而高位字節則保存右聲道的音量。下面的代碼可以從返回值中依次提取左右聲道的增益大小：

int left, right;
left = vol & 0xff;
right = (vol & 0xff00) >> 8;
printf("Left gain is %d %%, Right gain is %d %%\n", left, right);

類似地，如果想設置混音通道的增益大小，則可以通過SOUND_MIXER_WRITE宏來實現，此時遵循的原則與獲取增益值時的原則基本相同，例如下面的語句可以用來設置麥克風的輸入增益：

vol = (right << 8) + left;
ioctl(fd, SOUND_MIXER_WRITE(SOUND_MIXER_MIC), &vol);

在編寫實用的音頻程序時，混音器是在涉及到兼容性時需要重點考慮的一個對象，這是因為不同的聲卡所提供的混音器資源是有所區別的。聲卡驅動程序提供了多個ioctl系統調用來獲得混音器的信息，它們通常返回一個整型的位掩碼（bitmask），其中每一位分別代表一個特定的混音通道，如果相應的位為 1，則說明與之對應的混音通道是可用的。例如通過SOUND_MIXER_READ_DEVMASK返回的位掩碼，可以查詢出能夠被聲卡支持的每一個混音通道，而通過SOUND_MIXER_READ_RECMAS返回的位掩碼，則可以查詢出能夠被當作錄音源的每一個通道。下面的代碼可以用來檢查CD輸入是否是一個有效的混音通道：

ioctl(fd, SOUND_MIXER_READ_DEVMASK, &devmask);
if (devmask & SOUND_MIXER_CD)
printf("The CD input is supported");

如果進一步還想知道其是否是一個有效的錄音源，則可以使用如下語句：

ioctl(fd, SOUND_MIXER_READ_RECMASK, &recmask);
if (recmask & SOUND_MIXER_CD)
printf("The CD input can be a recording source");

目前大多數聲卡提供多個錄音源，通過SOUND_MIXER_READ_RECSRC可以查詢出當前正在使用的錄音源，同一時刻能夠使用幾個錄音源是由聲卡硬件決定的。類似地，使用SOUND_MIXER_WRITE_RECSRC可以設置聲卡當前使用的錄音源，例如下面的代碼可以將CD輸入作為聲卡的錄音源使用：

devmask = SOUND_MIXER_CD;
ioctl(fd, SOUND_MIXER_WRITE_DEVMASK, &devmask);

此外，所有的混音通道都有單聲道和雙聲道的區別，如果需要知道哪些混音通道提供了對立體聲的支持，可以通過SOUND_MIXER_READ_STEREODEVS來獲得。

4.3 音頻錄放框架

下面給出一個利用聲卡上的DSP設備進行聲音錄制和回放的基本框架，它的功能是先錄制幾秒種音頻數據，將其存放在內存緩沖區中，然后再進行回放，其所有的功能都是通過讀寫/dev/dsp設備文件來完成的：

/*
* sound.c
*/
#include
#include
#include
#include
#include
#include
#include
#define LENGTH 3 /* 存儲秒數 */
#define RATE 8000 /* 采樣頻率 */
#define SIZE 8 /* 量化位數 */
#define CHANNELS 1 /* 聲道數目 */
/* 用于保存數字音頻數據的內存緩沖區 */
unsigned char buf[LENGTH*RATE*SIZE*CHANNELS/8];
int main()
{
int fd;/* 聲音設備的文件描述符 */
int arg;/* 用于ioctl調用的參數 */
int status; /* 系統調用的返回值 */
/* 打開聲音設備 */
fd = open("/dev/dsp", O_RDWR);
if (fd < 0) {
perror("open of /dev/dsp failed");
exit(1);
}
/* 設置采樣時的量化位數 */
arg = SIZE;
status = ioctl(fd, SOUND_PCM_WRITE_BITS, &arg);
if (status == -1)
perror("SOUND_PCM_WRITE_BITS ioctl failed");
if (arg != SIZE)
perror("unable to set sample size");
/* 設置采樣時的聲道數目 */
arg = CHANNELS;
status = ioctl(fd, SOUND_PCM_WRITE_CHANNELS, &arg);
if (status == -1)
perror("SOUND_PCM_WRITE_CHANNELS ioctl failed");
if (arg != CHANNELS)
perror("unable to set number of channels");
/* 設置采樣時的采樣頻率 */
arg = RATE;
status = ioctl(fd, SOUND_PCM_WRITE_RATE, &arg);
if (status == -1)
perror("SOUND_PCM_WRITE_WRITE ioctl failed");
/* 循環，直到按下Control-C */
while (1) {
printf("Say something:\n");
status = read(fd, buf, sizeof(buf)); /* 錄音 */
if (status != sizeof(buf))
perror("read wrong number of bytes");
printf("You said:\n");
status = write(fd, buf, sizeof(buf)); /* 回放 */
if (status != sizeof(buf))
perror("wrote wrong number of bytes");
/* 在繼續錄音前等待回放結束 */
status = ioctl(fd, SOUND_PCM_SYNC, 0);
if (status == -1)
perror("SOUND_PCM_SYNC ioctl failed");
}
}

4.4 混音器框架

下面再給出一個對混音器進行編程的基本框架，利用它可以對各種混音通道的增益進行調節，其所有的功能都是通過讀寫/dev/mixer設備文件來完成的：

/*
* mixer.c
*/
#include
#include
#include
#include
#include
#include
/* 用來存儲所有可用混音設備的名稱 */
const char *sound_device_names[] = SOUND_DEVICE_NAMES;
int fd; /* 混音設備所對應的文件描述符 */
int devmask, stereodevs; /* 混音器信息對應的位圖掩碼 */
char *name;
/* 顯示命令的使用方法及所有可用的混音設備 */
void usage()
{
int i;
fprintf(stderr, "usage: %s \n"
" %s \n\n"
"Where is one of:\n", name, name);
for (i = 0 ; i < SOUND_MIXER_NRDEVICES ; i++)
if ((1 << i) & devmask) /* 只顯示有效的混音設備 */
fprintf(stderr, "%s ", sound_device_names[i]);
fprintf(stderr, "\n");
exit(1);
}
int main(int argc, char *argv[])
{
int left, right, level; /* 增益設置 */
int status; /* 系統調用的返回值 */
int device; /* 選用的混音設備 */
char *dev; /* 混音設備的名稱 */
int i;
name = argv[0];
/* 以只讀方式打開混音設備 */
fd = open("/dev/mixer", O_RDONLY);
if (fd == -1) {
perror("unable to open /dev/mixer");
exit(1);
}

/* 獲得所需要的信息 */
status = ioctl(fd, SOUND_MIXER_READ_DEVMASK, &devmask);
if (status == -1)
perror("SOUND_MIXER_READ_DEVMASK ioctl failed");
status = ioctl(fd, SOUND_MIXER_READ_STEREODEVS, &stereodevs);
if (status == -1)
perror("SOUND_MIXER_READ_STEREODEVS ioctl failed");
/* 檢查用戶輸入 */
if (argc != 3 && argc != 4)
usage();
/* 保存用戶輸入的混音器名稱 */
dev = argv[1];
/* 確定即將用到的混音設備 */
for (i = 0 ; i < SOUND_MIXER_NRDEVICES ; i++)
if (((1 << i) & devmask) && !strcmp(dev, sound_device_names[i]))
break;
if (i == SOUND_MIXER_NRDEVICES) { /* 沒有找到匹配項 */
fprintf(stderr, "%s is not a valid mixer device\n", dev);
usage();
}
/* 查找到有效的混音設備 */
device = i;
/* 獲取增益值 */
if (argc == 4) {
/* 左、右聲道均給定 */
left = atoi(argv[2]);
right = atoi(argv[3]);
} else {
/* 左、右聲道設為相等 */
left = atoi(argv[2]);
right = atoi(argv[2]);
}

/* 對非立體聲設備給出警告信息 */
if ((left != right) && !((1 << i) & stereodevs)) {
fprintf(stderr, "warning: %s is not a stereo device\n", dev);
}

/* 將兩個聲道的值合到同一變量中 */
level = (right << 8) + left;

/* 設置增益 */
status = ioctl(fd, MIXER_WRITE(device), &level);
if (status == -1) {
perror("MIXER_WRITE ioctl failed");
exit(1);
}
/* 獲得從驅動返回的左右聲道的增益 */
left = level & 0xff;
right = (level & 0xff00) >> 8;
/* 顯示實際設置的增益 */
fprintf(stderr, "%s gain set to %d%% / %d%%\n", dev, left, right);
/* 關閉混音設備 */
close(fd);
return 0;
}

編譯好上面的程序之后，先不帶任何參數執行一遍，此時會列出聲卡上所有可用的混音通道：

[xiaowp@linuxgam sound]$ ./mixer
usage: ./mixer
./mixer

Where is one of:
vol pcm speaker line mic cd igain line1 phin video

之后就可以很方便地設置各個混音通道的增益大小了，例如下面的命令就能夠將CD輸入的左、右聲道的增益分別設置為80%和90%：

[xiaowp@linuxgam sound]$ ./mixer cd 80 90
cd gain set to 80% / 90%

五、小結

隨著Linux平臺下多媒體應用的逐漸深入，需要用到數字音頻的場合必將越來越廣泛。雖然數字音頻牽涉到的概念非常多，但在Linux下進行最基本的音頻編程卻并不十分復雜，關鍵是掌握如何與OSS或者ALSA這類聲卡驅動程序進行交互，以及如何充分利用它們提供的各種功能，熟悉一些最基本的音頻編程框架和模式對初學者來講大有裨益。

閱讀全文

Linux下線程編程

Linux下線程編程

2022-08-24 15:42:45

1682

Linux C語言的編程規范

Linux有獨特的編程風格,在內核源代碼目錄Documentation/CodingStyle,詳細描述代碼風格。

2023-07-21 14:48:28

193

740族編程指南

瑞莎C語言編程指南

2015-07-07 15:26:34

LINUX音頻驅動架構相關資料分享

1、LINUX音頻驅動架構　　LINUX下音頻驅動開發，要遵循標準的ALSA架構，　　下面分別從硬件架構、軟件架構、驅動程序，3個方面分析。　　硬件架構　　硬件上音頻總線接口有很多，如I2S、PCM、TDM、SLIMBUS等，以I2S為例分析：原作者：DMCF

2022-11-04 15:57:35

LINUX環境編程指南資料合集

資料簡介：第 1 章著重介紹整個 Linux 的編程環境，包括如何安裝 Linux 系統，以及如何使用 Shell 來操作你的系統，在這一章中還給大家詳細介紹了 Linux 下編程的三大必備技能

2022-07-11 15:30:53

Linux音頻編程指南

Linux音頻編程指南，個人感覺還行

2012-10-26 21:28:08

Linux下音頻設備編程

Linux下音頻設備編程

2012-08-20 08:17:01

編程指南

請提供一下《CSU C編程指南》、《CSU ASM編程指南》，找了很多地方都沒下載的。richocean@petalmail.com

2023-01-03 15:49:30

音頻工程師關于程控交流電源設計指南是什么？

2021-06-04 06:38:59

Android編程權威指南

Android編程權威指南pdf版

2019-07-07 15:26:18

CC3200編程-TI編程指南

2016-03-07 14:15:18

FreeRTOS編程指南

2016-11-05 17:13:13

GUN linux編程指南第二版

分享一本好書《GUN linux編程指南（第二版）》，希望能幫助大家。。

2012-11-24 09:09:43

GUN linux編程指南第二版（源代碼）

GUN linux編程指南第二版（配套源代碼）

2012-11-24 08:58:28

Mini Linux

Mini Linux EMMC

2023-03-28 13:06:25

NiosII的Flash編程指南

2012-08-12 15:27:07

RTthread編程指南

2020-05-02 08:36:35

【資料】華為HarmonyOS 音頻開發與管理指南

華為HarmonyOS 音頻開發與管理指南回復帖子查看資料下載鏈接：[hide][/hide]

2021-08-12 12:08:12

【資料共享】SRIO編程及調測指南

附件是與之前發布的SRIO例程對應的編程指南手冊，請參考。 ?

2018-06-21 17:33:58

什么是Linux系統編程

什么是Linux系統編程？Linux系統編程也叫Linux下的高級編程，是介于應用層和驅動層之間的。學習了哪些知識后可以學習Linux系統編程？C語言基礎、Linux基本操作命令怎么學習Linux

2021-12-23 07:30:31

在Linux下如何實現音頻播放功能？

在Linux下如何實現音頻播放功能？

2022-01-26 06:35:37

嵌入式Linux音頻驅動開發的相關資料分享

1.嵌入式音頻系統硬件連接下圖所示的嵌入式設備使用IIS將音頻數據發送給編解碼器。對編解碼器的I/O寄存器的編程通過IIC總線進行。2.音頻體系結構-ALSAALSA是Advanced Linux Sound Architecture 的縮寫，目前已經成為了linux的主流音頻體系...

2021-12-24 07:43:01

求分享CTN730編程指南的相關資料

我們的客戶要求 CTN730進行編程。我們正在搜索CTN730系列的編程指南，我們將開發編程算法到我們的編程器平臺。你能幫忙提供編程指南給我們開發嗎？

2023-04-25 09:31:23

萌新求助關于基礎編程的指南

萌新求助關于基礎編程的指南硬件復位和設置全局數據格式

2021-05-12 06:41:14

資料推薦：LwIP編程指南

《LwIP編程指南》

2016-06-12 13:49:05

跪求LWIP的sequential API編程指南

誰有LWIP的sequential API編程指南，求網址，最好中文版的

2015-12-09 19:02:55

阿爾法Linux

阿爾法Linux ATK-IMX6F800E8GD512M-B 6~24V

2023-03-28 13:06:25

linux下c語言編程pdf

linux下c語言編程內容為：:基礎知識,進程介紹,文件操作,時間概念,信號處理,消息管理,線程操作,網絡編程,Linux 下C 開發工具介紹。

2008-12-08 10:00:24

Linux下C編程電子書

Linux下C編程電子書網絡編程摘要　通過使用套接字來達到進程間通信目的編程就是網絡編程。　　代碼,開發工具,數據庫,服務器架設和網頁設計這5部

2010-03-10 14:11:21

RedHat Linux 9入門指南

下面列出了 Red Hat Linux 的主要系統目錄及其簡單描述。要獲得額外的目錄信息，請參閱《Red Hat Linux 定制指南》和《Red Hat Linux 參考指南》。 /bin/ — 用來貯存用戶命令。目

2010-06-30 17:33:40

Linux音頻編程指南Linux認證考試

雖然目前的優勢主要體現在網絡服務方面，但事實上同樣也有著非常豐富的媒體功能，本文就是以多媒體應用中最基本的聲音為對象，介紹如何在平臺下開發實際的音頻應用程序，

2010-07-14 21:27:39

#硬聲創作季 #Linux 學Linux-4.26.4 音頻驅動使能

Linux音頻驅動

水管工發布于 2022-11-10 21:55:28

Linux系統命令指南

在“Linux 文件命令精通指南”中，我們討論了利用最基礎和最常用 Linux 文件命令所需的基本信息。在本文中，我將對 Linux 系統命令作同樣的討論。

2011-05-23 10:23:46

862

Linux+Socket編程

本內容詳細講述了Linux+Socket編程技巧指南，適合所有學習編程的廣大用戶使用

2011-06-10 11:19:51

Tiny6410 Linux開發指南詳解

Tiny6410 Linux 開發指南

2011-07-08 17:12:04

209

Linux管理者指南

本書為Linux管理者提供了指南，希望對 Linux 工作人員有所幫助，全書是英文版的，電子發燒友還有很多有關電子的資料，希望成為您工作學習的好幫手，好朋友！

2011-07-11 14:56:31

C語言SOCKET編程指南

這個文檔是一個指南，而不是參考書。如果你剛開始socket 編程并想找一本入門書，那么你是我的讀者。但這不是一本完全的socket 編程書。

2011-12-09 14:58:26

linux多線程編程開發

本文中我們針對 Linux 上多線程編程的主要特性總結出 5 條經驗，用以改善 Linux 多線程編程的習慣和避免其中的開發陷阱。在本文中，我們穿插一些 Windows 的編程用例用以對比 Linux 特性

2011-12-26 14:24:44

linux權威指南(第三版)

電子發燒友網站提供《linux權威指南(第三版).txt》資料免費下載

2014-02-27 10:15:44

Linux編程白皮書講解

。全書是從Linux操作系統的心臟——內核開始進行深入介紹的。所介紹的知識包括Linux硬件和軟件基礎、內核機制、進程、模塊、結構及源代碼、Linux內核模塊編程指南，把應用程序移植到Linux下。

2016-01-06 11:30:40

高質量C++C編程指南

高質量C++C編程指南高質量C++C編程指南

2016-01-15 16:26:16

音頻解決方案指南

音頻解決方案指南DSP應用，有興趣的參考下。

2016-01-19 14:07:56

TwinCAT_倍福編程指南

TwinCAT_倍福編程指南,用于倍福的控制器編程，操作說明。

2016-04-28 11:19:53

LINUX網絡編程

linux開發編程教程資料——LINUX網絡編程，感興趣的小伙伴們可以看一看。

2016-08-23 16:23:32

Linux下基于Socket的網絡編程

linux開發編程教程資料——Linux下基于Socket的網絡編程，感興趣的小伙伴們可以看一看。

2016-08-23 16:23:32

Linux下的網絡編程總結

linux開發編程教程資料——Linux下的網絡編程總結，感興趣的小伙伴們可以看一看。

2016-08-23 16:23:32

Linux-socket網絡編程

linux開發編程教程資料——Linux-socket網絡編程，感興趣的小伙伴們可以看一看。

2016-08-23 16:23:32

Linux網絡編程

linux開發編程教程資料——Linux網絡編程，感興趣的小伙伴們可以看一看。

2016-08-23 16:23:32

Linux下Socket網絡編程

linux開發編程教程資料——Linux下Socket網絡編程，感興趣的小伙伴們可以看一看。

2016-08-23 16:23:32

Linux__C網絡編程

linux開發編程教程資料——Linux__C網絡編程，感興趣的小伙伴們可以看一看。

2016-08-23 16:23:32

linux-socket網絡編程詳解

linux開發編程教程資料——linux-socket網絡編程詳解，感興趣的小伙伴們可以看一看。

2016-08-23 16:23:32

linux-網絡編程-socket編程

linux開發編程教程資料——linux-網絡編程-socket編程，感興趣的小伙伴們可以看一看。

2016-08-23 16:23:32

Linux網絡編程實例詳解

網絡通訊教程學習之Linux網絡編程實例詳解

2016-09-01 14:55:49

LINUX網絡編程

網絡通訊教程學習之 LINUX 網絡編程

2016-09-01 14:55:49

Linux下串口編程入門

嵌入式開發學習，關于Linux下串口編程入門，感興趣的小伙伴可以瞧一瞧。

2016-11-03 15:15:39

《Linux C編程從初學到精通》

《Linux C編程從初學到精通》

2016-12-10 00:09:36

Linux與Unix shell編程指南（完整高清版）

linux編程經典教材

2016-12-16 16:25:22

NOR FLASH編程指南

NOR FLASH編程指南,可以下來看看。

2016-12-11 21:31:55

高質量C、C++編程指南

c 語言編程指南

2017-03-19 19:49:39

Java編程指南

2017-03-19 11:26:35

Linux下Qt編程入門教程

Linux下Qt編程入門教程

2017-09-11 08:35:11

linux內核C語言的編程風格

linux 內核C語言的編程風格

2017-09-26 14:22:32

萬用編程座適配板焊接指南

2017-10-12 14:19:17

FM1702編程指南

2017-10-23 11:03:24

linux 下C編程

linux 下C編程

2017-10-25 08:54:36

高級Bash 腳本編程指南

2017-10-26 08:33:37

高質量的c編程指南

2017-10-26 16:00:29

音頻電路的設計指南

2017-10-26 16:07:53

《Linux設備驅動開發詳解》第17章、Linux音頻設備驅動

《Linux設備驅動開發詳解》第17章、Linux音頻設備驅動

2017-10-27 11:14:26

CC++編程指南

2017-10-27 14:45:22

Linux網絡的編程

Linux網絡的編程

2017-10-27 15:31:23

高質量C 編程指南

2017-10-30 10:10:35

Linux網絡編程

linux網絡編程筆記

2017-12-04 14:23:28

LINUX系統教程之如何在Linux系統下進行編程

本文檔的主要內容詳細介紹的是LINUX系統教程之如何在Linux系統下進行編程主要內容包括了：程序開發過程，Linux編程環境和開發工具，Linux下C語言編程，Linux下C++語言編程，Linux下JAVA語言編程

2018-12-18 19:09:42

你知道Linux 音頻設備驅動架構及應用編程？

最早出現在Linux上的音頻編程接口是OSS（Open Sound System），它由一套完整的內核驅動程序模塊組成，可以為絕大多數聲卡提供統一的編程接口。

2019-04-26 14:34:17

735

Linux驅動編程基礎知識講解

由于Linux驅動編程的本質屬于Linux內核編程，因此我們非常有必要熟悉Linux內核以及Linux內核的特點。這篇文章將會幫助讀者打下Linux驅動編程的基礎知識。

2020-03-01 08:27:00

3576

音頻項目FIN用戶指南

2021-04-28 12:34:47

Linux Add-in User Guide(Linux插件用戶指南)

Linux Add-in User Guide(Linux插件用戶指南)

2021-05-20 13:23:45

Linux系統命令及shell腳本實踐指南

Linux系統命令及shell腳本實踐指南資料下載。

2021-06-01 14:47:23

基于Linux的C語言編程入門教程

基于Linux的C語言編程入門教程

2021-06-15 10:56:44

嵌入式初學者學習嵌入式必看必看書籍列表，有電子檔的同學可以共享出來，謝謝 Linux基礎 1、《Linux與Unix Shell 編程指南》 2、《嵌入式Linux應用程序開發詳解》

基礎1、《Linux與Unix Shell 編程指南》2、《嵌入式Linux應用程序開發詳解》C語言基礎The C programming language 《C程序設計語言》Pointers on...

2021-10-20 12:06:01

嵌入式linux串口編程

嵌入式開發——Linux串口編程筆記

2021-11-02 10:21:18

Linux編程入門

Linux編程入門

2022-02-16 14:55:22

Linux開發_介紹目錄編程、標準文件編程

介紹Linux下目錄編程、標準文件編程、Linux系統文件接口編程、GDB調試等知識點。

2022-09-17 15:42:13

824

STM8在線編程指南

電子發燒友網站提供《STM8在線編程指南.pdf》資料免費下載

2022-10-14 15:21:06

基于鴻蒙系統的網絡編程指南

基于鴻蒙系統的網絡編程指南。

2022-10-24 11:40:56

RZ/V2M Linux 啟動指南

RZ/V2M Linux 啟動指南

2023-01-09 19:17:28

RZ/V2MA Linux 啟動指南

RZ/V2MA Linux 啟動指南

2023-01-10 18:55:23

IPS2550 編程指南

2023-01-13 19:02:20

Tina Linux配置開發指南

Tina Linux配置開發指南

2023-03-02 15:28:11

13959

Linux NOR開發指南

Linux NOR開發指南

2023-03-06 09:55:08

548

Linux 系統編程的難點是什么

對于有一定 Linux 開發基礎希望進階學習 Linux 系統編程的開發人員來說，其難點在于，Linux 所囊括的技術點繁雜，往往不知從何下手。

2023-06-28 12:54:01

361

358

TI音頻指南

電子發燒友網站提供《TI音頻指南.pdf》資料免費下載

2023-11-16 16:20:53

已全部加載完成

搜索歷史

Linux音頻編程指南

評論