這篇文章將對linux下udp socket編程重要知識點進行總結(jié),無論是開發(fā)人員應知應會的,還是說udp socket的一些偏僻知識點,本文都會講到。盡可能做到,讀了一篇文章之后,大家對udp socket有一個比較全面的認識。本文分為兩個專題,第一個是常用的upd socket框架,第二個是一些udp socket并不常用但又相當重要的知識點。
一、基本的udp socket編程
1. UDP編程框架
要使用UDP協(xié)議進行程序開發(fā),我們必須首先得理解什么是什么是UDP?這里簡單概括一下。
UDP(user datagram protocol)的中文叫用戶數(shù)據(jù)報協(xié)議,屬于傳輸層。UDP是面向非連接的協(xié)議,它不與對方建立連接,而是直接把我要發(fā)的數(shù)據(jù)報發(fā)給對方。所以UDP適用于一次傳輸數(shù)據(jù)量很少、對可靠性要求不高的或?qū)崟r性要求高的應用場景。正因為UDP無需建立類如三次握手的連接,而使得通信效率很高。
UDP的應用非常廣泛,比如一些知名的應用層協(xié)議(SNMP、DNS)都是基于UDP的,想一想,如果SNMP使用的是TCP的話,每次查詢請求都得進行三次握手,這個花費的時間估計是使用者不能忍受的,因為這會產(chǎn)生明顯的卡頓。所以UDP就是SNMP的一個很好的選擇了,要是查詢過程發(fā)生丟包錯包也沒關(guān)系的,我們再發(fā)起一個查詢就好了,因為丟包的情況不多,這樣總比每次查詢都卡頓一下更容易讓人接受吧。
UDP通信的流程比較簡單,因此要搭建這么一個常用的UDP通信框架也是比較簡單的。以下是UDP的框架圖。
由以上框圖可以看出,客戶端要發(fā)起一次請求,僅僅需要兩個步驟(socket和sendto),而服務器端也僅僅需要三個步驟即可接收到來自客戶端的消息(socket、bind、recvfrom)。
2. UDP程序設計常用函數(shù)
#include #include int socket(int domain, int type, int protocol);
參數(shù)domain:用于設置網(wǎng)絡通信的域,socket根據(jù)這個參數(shù)選擇信息協(xié)議的族
Name ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? Purpose?????????????????????????
AF_UNIX,?AF_LOCAL ? ? ? ? ?Local?communication??????????????
AF_INET ? ? ? ? ? ? ? ? ? ? ? ? ? IPv4?Internet?protocols??????????//用于IPV4
AF_INET6 ? ? ? ? ? ? ? ? ? ? ? ? IPv6?Internet?protocols??????????//用于IPV6
AF_IPX ? ? ? ? ? ? ? ? ? ? ? ? ? ? IPX?-?Novell?protocols
AF_NETLINK ? ? ? ? ? ? ? ? ? ? Kernel?user?interface?device?????
AF_X25 ? ? ? ? ? ? ? ? ? ? ? ? ? ?ITU-T?X.25?/?ISO-8208?protocol???
AF_AX25 ? ? ? ? ? ? ? ? ? ? ? ? ?Amateur?radio?AX.25?protocol
AF_ATMPVC ? ? ? ? ? ? ? ? ? ? ?Access?to?raw?ATM?PVCs
AF_APPLETALK ? ? ? ? ? ? ? ? AppleTalk????????????????????????
AF_PACKET ? ? ? ? ? ? ? ? ? ? ?Low?level?packet?interface???????
AF_ALG ? ? ? ? ? ? ? ? ? ? ? ? ? Interface?to?kernel?crypto?API
對于該參數(shù)我們僅需熟記AF_INET和AF_INET6即可
小插曲:PF_XXX和AF_XXX
我們在看Linux網(wǎng)絡編程相關(guān)代碼時會發(fā)現(xiàn)PF_XXX和AF_XXX會混著用,他們倆有什么區(qū)別呢?以下內(nèi)容摘自《UNP》。
AF_前綴表示地址族(Address?Family),而PF_前綴表示協(xié)議族(Protocol?Family)。歷史上曾有這樣的想法:單個協(xié)議族可以支持多個地址族,PF_的值可以用來創(chuàng)建套接字,而AF_值用于套接字的地址結(jié)構(gòu)。但實際上,支持多個地址族的協(xié)議族從來就沒實現(xiàn)過,而頭文件中為一給定的協(xié)議定義的PF_值總是與此協(xié)議的AF_值相同。
所以我在實際編程時還是偏向于使用AF_XXX。
參數(shù)type(只列出最重要的三個):
SOCK_STREAM ? ? ? ? Provides?sequenced,?reliable,?two-way,?connection-based?byte?streams. ? //用于TCP
SOCK_DGRAM ? ? ? ? ?Supports?datagrams?(connectionless,?unreliable?messages ).?//用于UDP
SOCK_RAW ? ? ? ? ? ? ?Provides?raw?network?protocol?access.??//RAW類型,用于提供原始網(wǎng)絡訪問
參數(shù)protocol:置0即可
返回值:成功:非負的文件描述符
失敗:-1
#include #include ssize_t sendto(int sockfd, const void *buf, size_t len, int flags, const struct sockaddr *dest_addr, socklen_t addrlen);
第一個參數(shù)sockfd:正在監(jiān)聽端口的套接口文件描述符,通過socket獲得
第二個參數(shù)buf:發(fā)送緩沖區(qū),往往是使用者定義的數(shù)組,該數(shù)組裝有要發(fā)送的數(shù)據(jù)
第三個參數(shù)len:發(fā)送緩沖區(qū)的大小,單位是字節(jié)
第四個參數(shù)flags:填0即可
第五個參數(shù)dest_addr:指向接收數(shù)據(jù)的主機地址信息的結(jié)構(gòu)體,也就是該參數(shù)指定數(shù)據(jù)要發(fā)送到哪個主機哪個進程
第六個參數(shù)addrlen:表示第五個參數(shù)所指向內(nèi)容的長度
返回值:成功:返回發(fā)送成功的數(shù)據(jù)長度
失敗:?-1
?
#include #include ssize_t recvfrom(int sockfd, void *buf, size_t len, int flags, struct sockaddr *src_addr, socklen_t *addrlen);
第一個參數(shù)sockfd:正在監(jiān)聽端口的套接口文件描述符,通過socket獲得
第二個參數(shù)buf:接收緩沖區(qū),往往是使用者定義的數(shù)組,該數(shù)組裝有接收到的數(shù)據(jù)
第三個參數(shù)len:接收緩沖區(qū)的大小,單位是字節(jié)
第四個參數(shù)flags:填0即可
第五個參數(shù)src_addr:指向發(fā)送數(shù)據(jù)的主機地址信息的結(jié)構(gòu)體,也就是我們可以從該參數(shù)獲取到數(shù)據(jù)是誰發(fā)出的
第六個參數(shù)addrlen:表示第五個參數(shù)所指向內(nèi)容的長度
返回值:成功:返回接收成功的數(shù)據(jù)長度
失敗:?-1
#include #include int bind(int sockfd, const struct sockaddr* my_addr, socklen_t addrlen);
第一個參數(shù)sockfd:正在監(jiān)聽端口的套接口文件描述符,通過socket獲得
第二個參數(shù)my_addr:需要綁定的IP和端口
第三個參數(shù)addrlen:my_addr的結(jié)構(gòu)體的大小
返回值:成功:0
失敗:-1
#include int close(int fd);
close函數(shù)比較簡單,只要填入socket產(chǎn)生的fd即可。
3. 搭建UDP通信框架
server:
1 #include 2 #include 3 #include 4 #include in.h> 5 #include
client:
1 #include 2 #include 3 #include 4 #include in.h> 5 #include
以上的框架用于一臺主機不同端口的UDP通信,現(xiàn)象如下:
我們先建立server端,等待服務;然后我們建立client端請求服務。
server端:
client端:
自己主機跟自己通信不是很爽,我們想跟其他主機通信怎么搞?很簡單,上面client的代碼的第49行的注釋打開,并注釋掉下面那行,在宏定義里填入自己想通信的serverip就可以了。現(xiàn)象如下:
server端:
client端:
這樣我們就實現(xiàn)了主機172.0.5.183和172.0.5.182之間的網(wǎng)絡通信。
UDP通用框架搭建完成,我們可以利用該框架跟指定主機進行通信了。
如果想學習UDP的基礎知識,以上的知識就足夠了;如果想繼續(xù)深入學習一下UDP SOCKET一些高級知識(奇技淫巧),可以花點時間往下看。
二、高級udp socket編程
1. udp的connect函數(shù)
什么?UDP也有conenct?connect不是用于TCP編程的嗎?
是的,UDP網(wǎng)絡編程中的確有connect函數(shù),但它僅僅用于表示確定了另一方的地址,并沒有其他含義。
有了以上認識后,我們可以知道UDP套接字有以下區(qū)分:
1)未連接的UDP套接字
2)已連接的UDP套接字
對于未連接的套接字,也就是我們常用的的UDP套接字,我們使用的是sendto/recvfrom進行信息的收發(fā),目標主機的IP和端口是在調(diào)用sendto/recvfrom時確定的;
在一個未連接的UDP套接字上給兩個數(shù)據(jù)報調(diào)用sendto函數(shù)內(nèi)核將執(zhí)行以下六個步驟:
1)連接套接字
2)輸出第一個數(shù)據(jù)報
3)斷開套接字連接
4)連接套接字
5)輸出第二個數(shù)據(jù)報
6)斷開套接字連接
對于已連接的UDP套接字,必須先經(jīng)過connect來向目標服務器進行指定,然后調(diào)用read/write進行信息的收發(fā),目標主機的IP和端口是在connect時確定的,也就是說,一旦conenct成功,我們就只能對該主機進行收發(fā)信息了。
已連接的UDP套接字給兩個數(shù)據(jù)報調(diào)用write函數(shù)內(nèi)核將執(zhí)行以下三個步驟:
1)連接套接字
2)輸出第一個數(shù)據(jù)報
3)輸出第二個數(shù)據(jù)報
由此可以知道,當應用進程知道給同一個目的地址的端口號發(fā)送多個數(shù)據(jù)報時,顯示套接字效率更高。
下面給出帶connect函數(shù)的UDP通信框架
具體框架代碼不再給出了,因為跟上面不帶connect的代碼大同小異,僅僅多出一個connect函數(shù)處理而已,下面給出處理conenct()的基本步驟。
void udp_handler(int s, struct sockaddr* to){ char buf[1024] = "TEST UDP !"; int n = 0; connect(s, to, sizeof(*to); n = write(s, buf, 1024); read(s, buf, n);}
2. udp報文丟失問題
因為UDP自身的特點,決定了UDP會相對于TCP存在一些難以解決的問題。第一個就是UDP報文缺失問題。
在UDP服務器客戶端的例子中,如果客戶端發(fā)送的數(shù)據(jù)丟失,服務器會一直等待,直到客戶端的合法數(shù)據(jù)過來。如果服務器的響應在中間被路由丟棄,則客戶端會一直阻塞,直到服務器數(shù)據(jù)過來。
防止這樣的永久阻塞的一般方法是給客戶的recvfrom調(diào)用設置一個超時,大概有這么兩種方法:
1)使用信號SIGALRM為recvfrom設置超時。首先我們?yōu)镾IGALARM建立一個信號處理函數(shù),并在每次調(diào)用前通過alarm設置一個5秒的超時。如果recvfrom被我們的信號處理函數(shù)中斷了,那就超時重發(fā)信息;若正常讀到數(shù)據(jù)了,就關(guān)閉報警時鐘并繼續(xù)進行下去。
2)使用select為recvfrom設置超時
設置select函數(shù)的第五個參數(shù)即可。
3. udp報文亂序問題
所謂亂序就是發(fā)送數(shù)據(jù)的順序和接收數(shù)據(jù)的順序不一致,例如發(fā)送數(shù)據(jù)的順序為A、B、C,但是接收到的數(shù)據(jù)順序卻為:A、C、B。產(chǎn)生這個問題的原因在于,每個數(shù)據(jù)報走的路由并不一樣,有的路由順暢,有的卻擁塞,這導致每個數(shù)據(jù)報到達目的地的順序就不一樣了。UDP協(xié)議并不保證數(shù)據(jù)報的按序接收。
解決這個問題的方法就是發(fā)送端在發(fā)送數(shù)據(jù)時加入數(shù)據(jù)報序號,這樣接收端接收到報文后可以先檢查數(shù)據(jù)報的序號,并將它們按序排隊,形成有序的數(shù)據(jù)報。
4. udp流量控制問題
總所周知,TCP有滑動窗口進行流量控制和擁塞控制,反觀UDP因為其特點無法做到。UDP接收數(shù)據(jù)時直接將數(shù)據(jù)放進緩沖區(qū)內(nèi),如果用戶沒有及時將緩沖區(qū)的內(nèi)容復制出來放好的話,后面的到來的數(shù)據(jù)會接著往緩沖區(qū)放,當緩沖區(qū)滿時,后來的到的數(shù)據(jù)就會覆蓋先來的數(shù)據(jù)而造成數(shù)據(jù)丟失(因為內(nèi)核使用的UDP緩沖區(qū)是環(huán)形緩沖區(qū))。因此,一旦發(fā)送方在某個時間點爆發(fā)性發(fā)送消息,接收方將因為來不及接收而發(fā)生信息丟失。
解決方法一般采用增大UDP緩沖區(qū),使得接收方的接收能力大于發(fā)送方的發(fā)送能力。
int?n?=?220?*?1024;?//220kB
setsocketopt(sockfd,?SOL_SOCKET,?SO_RCVBUF,?&n,?sizeof(n));
這樣我們就把接收方的接收隊列擴大了,從而盡量避免丟失數(shù)據(jù)的發(fā)生。
?
評論