1、什么是 socket?你经常听到人们谈论着“socket”,或许你还不知道它的确切含义。现在让我告诉你:它是使用标准 Unix 文件描述符(filedescriptor)和其它程序通讯的方式。什么?你也许听到一些 Unix 高手(hacker) 这样说过:“呀,Unix 中的一切就是文件!”那个家伙也许正在说到一个事实:Unix 程序在执行任何形式的 I/O 的时候,程序是在读或者写一个文件描述符。一个文件描述符只是一个和打开的文件相关联的整数。但是(注意后面的话),这个文件可能是一个网络连接,FIFO,管道,终端,磁盘上的文件或者什么其它的东西。Unix 中所有的东西就是文件!所以,你想和
2、Internet 上别的程序通讯的时候,你将要使用到文件描述符。你必须理解刚才的话。现在你脑海中或许冒出这样的念头:“那么我从哪里得到网络通讯的文件描述符呢?”,这个问题无论如何我都要回答:你利用系统调用 socket(),它返回套接字描述符 (socketdescriptor),然后你再通过它来进行 send()和 recv()调用。“但是.”,你可能有很大的疑惑, “如果它是个文件描述符,那么为什么不用一般调用 read()和 write()来进行套接字通讯?”简单的答案是:“你可以使用!” 。详细的答案是:“你可以,但是使用 send()和 recv()让你更好的控制数据传输。”存在这样
3、一个情况:在我们的世界上,有很多种套接字。有 DARPAInternet 地址(Internet 套接字),本地节点的路径名(Unix 套接字),CCITTX.25 地址( 你可以将 X.25 套接字完全忽略)。12.3.2 套接字接口的种类Linux 支持多种套接字种类,不同的套接字种类称为“地址族”,这是因为每种套接字种类拥有自己的通讯寻址方法。Linux 所支持的套接字地址族见表 12.3。Linux 将上述套接字地址族抽象为统一的 BSD 套接字接口,应用程序关心的只是 BSD 套接字接口,而 BSD 套接字由各地址族专有的软件支持。一般而言,BSD 套接字可支持多种套接字类型,不同的
4、套接字类型提供的服务不同,Linux 所支持的部分 BSD 套接字类型见表 12.4,但表 12.3 中的套接字地址族并不一定全部支持表 12.4 中的这些套接字类型。表 12. 3 Linux 支持的套接字地址族套接字地址族 描述UNIX UNIX 域套接字INET 通过 TCP/IP 协议支持的 Internet 地址族AX25 Amater radio X25APPLETALK Appletalk DDPIPX Novell IPXX25 X25表 12.4 Linux 所支持的 BSD 套接字类型BSD 套接字类型 描述流(stream)这种套接字提供了可靠的双向顺序数据流,可保证数据
5、不会在传输过程中丢失、破坏或重复出现。流套接字通过 INET 地址族的 TCP 协议实现。数据报(datagram)这种套接字也提供双向的数据传输,但是并不对数据的传输提供担保,也就是说,数据可能会以错误的顺序传递,甚至丢失或破坏。这种类型的套接字通过 INET 地址族的 UDP 协议实现。原始(raw)利用这种类型的套接字,进程可以直接访问底层协议(因此称为原始)。例如,可在某个以太网设备上打开原始套接字,然后获取原始的 IP 数据传输信息。可靠发送的消息和数据报套接字类似,但保证数据被正确传输到目的端。 顺序数据包 和流套接字类似,但数据包大小是固定的。数据包(packet)这并不是标准的 BSD 套接字类型,它是 Linux 专有的 BSD 套接字扩展,可允许进程直接在设备级访问数据包。下面我们以 INET 套接字地址族、流套接字类型为例,详细介绍套接字的工作原理和通信过程。