码迷,mamicode.com
首页 > 其他好文 > 详细

TCP网络编程学习小结

时间:2015-08-30 19:42:46      阅读:151      评论:0      收藏:0      [点我收藏+]

标签:网络编程   socket   linux   tcp   

TCP协议是TCP/IP协议族中的一个十分重要的名字(看到TCP/IP这个名字就知道TCP有多重要了),同时也是一个十分复杂的协议,在使用这个协议的时候可能会带来很多问题,这使得使用的程序员会十分头大。如果想了解TCP协议的细节,可以参考《TCP/IP详解1:协议》。闲话不多说,我们进入正题:


一、报文头

首先我们来看一下TCP协议的报文头:

技术分享

TCP是传输层协议,其报文头并不包含TP地址,IP地址会在IP层添加,当然,IP层处于TCP的下层,IP层的报文内容就是TCP报文。

TCP/IP协议网络传输使用大端表示。网络之间传输的数据全部使用大端表示,这意味着,Source Port和Destination Port都是大端表示的两个字节的无符号数字(unsigned short/uint16_t);

Sequence Nember是包的序号,用来解决网络乱序问题;

Acknowledgement Number就是ACK,是对已收到数据的确认,用来解决网络丢包的问题;

Window就是注明的滑动窗口,用来进行流量控制和拥塞控制;

TCP Flag是包的类型,主要用于操控TCP的状态。

Checksum是校验和,是用来对已收到的报文进行校验的。


二、TCP状态转换

实际上网络传输是不可靠的,然而TCP却要在不可靠的网络环境中实现可靠的传输,其实现的原理是确认-重发机制,通过对已收到的片段数据进行确认,没有确认的数据会重发,于是就需要有一种机制用来识别接下来还有没有数据,这种机制就是“链接”。链接的意思并不是真正意义上的链接,而是Client端和Server端的协议链接,是双方维护的一种“链接状态”,TCP Client和Server之间从关闭到链接中间有一个“TCP建立链接”、“传输数据”和“TCP断开链接”的过程,下面是TCP协议的状态转换图:

技术分享技术分享

1、3次握手链接

3次握手链接主要是为了是TCP链接从CLOSED(LISTEN)状态转换成ESTABLISHED状态,其具体变化过程如下:

第一次握手:Client向Server发送一个{SYN|seq=x}信号,请求建立链接,Client由CLOSED状态变成SYN_SENT状态;

第二次握手:Server收到Client发来的建立链接请求之后,回复Client一条确认{SYN|seq=y,ack=x+1},Server由LISTEN状态变成SYN_RCVD状态,其中seq是Server自己的数据编号,ack是对Client发来的数据的确认;

第三次握手:Client收到Server发来的同意建立请求之后,向Server发送一条确认{ACK=y+1},由SYN_SENT状态变成ESTABLISHED状态,如此,Client变建立好了链接,Server收到Client发来的确认之后便进入ESTABLISHED状态,Server完成链接的建立。


2、4次握手断开

4次握手断开的目的是断开TCP链接,由ESTABLISHED状态变成CLOSED状态;

第一次握手:Client主动发起断开链接,向Server发送断开连接请求{FIN|seq=x+2,ACK=y+1},然后Client由ESTABLISHED状态变成FIN_WAIT_1状态;

第二次握手:Server收到断开连接请求之后,对断开链接请求恢复一个确认{ACK=x+3},然后Server进入CLOSE_WAIT状态,Client收到确认之后进入FIN_WAIT_2状态,此时Client端的写链接断开;

第三次握手:Server向Client发送断开联接请求{FIN|seq=y+1},Server由CLOSE_WAIT状态变成LAST_ACK状态,Client收到请求之后,回复一个确认{ACK=y+2},状态由TIME_WAIT状态;

第四次握手:Server收到确认之后进入CLOSED状态,由此Server端写链接断开,Client端经过一段时间之后自动进入CLOSED状态。


3、几点说明

a.建立链接时,Server端一定先进入LISTEN状态,才能接受建立链接;

b.建立链接时,一定是由Client端发起的;

c.断开链接时,不一定是Client端发起的,Server也可以发起断开链接,这里的Client代指发起断开链接的一方;

d.TIME_WAIT状态其实就是等待一段时间,确保Server已经收到自己回复的确认,如果Server没有收到确认会在这段时间里重复发送上一条数据{FIN|seq=y+1};

e.如果两边同时发起断开链接,则会进入特殊的状态CLOSING:

第一次握手:Clientf发起断开链接,向Server发送一条请求{FIN|seq=x+2,ACK=y+1},由ESTABLISHED状态变成FIN_WAIT_1状态;

第二次握手:Server发起断开链接,向Client发送一条请求{FIN|seq=y+1,ACK=x+2},由ESTABLISHED状态变成FIN_WAIT_1状态;

第三次握手:Server收到Client发来的断开链接请求(而不是对自己的确认),于是回复一条确认{ACK=x+3},由FIN_WAIT_1状态变成CLOSING状态;

第四次握手:Client收到Server发来的断开链接请求(而不是对自己的确认),于是回复一条确认{ACK=y+2},由FIN_WAIT_1状态变成CLOSING状态;

Client和Server各自收到对自己的确认之后进入TIME_WAIT状态,一段时间之后自动进入CLOSED状态。

f.如果server端接到了clien发的SYN后回了SYN-ACK后client掉线了,server端没有收到client回来的ACK,那么,这个连接处于一个中间状态,即没成功,也没失败。于 是,server端如果在一定时间内没有收到的TCP会重发SYN-ACK。在Linux下,默认重试次数为5次,重试的间隔时间从1s开始每次都翻售,5次的重试时间间隔为1s, 2s, 4s, 8s, 16s,总共31s,第5次发出后还要等32s都知道第5次也超时了,所以,总共需要 1s + 2s + 4s+ 8s+ 16s + 32s = 2^6 -1 = 63s,TCP才会把断开这个连接。

g.关于SYN Flood攻击:一些恶意的人就为此制造了SYN Flood攻击--给服务器发了一个SYN后,就下线了,于是服务器需要默认等63s才会断开连接,这样,攻击者就可以 把服务器的syn连接的队列耗尽,让正常的连接请求不能处理。于是,Linux下给了一个叫tcp_syncookies的参数来应对这个事——当SYN队列满了后,TCP会通过源地址 端口、目标地址端口和时间戳打造出一个特别的Sequence Number发回去(又叫cookie),如果是攻击者则不会有响应,如果是正常连接,则会把这个 SYN Cookie发回 来,然后服务端可以通过cookie建连接(即使你不在SYN队列中)。请注意,请先千万别用tcp_syncookies来处理正常的大负载的连接的情况。因为,synccookies是妥协 版的TCP协议,并不严谨。对于正常的请求,你应该调整三个TCP参数可供你选择,第一个是:tcp_synack_retries 可以用他来减少重试次数;第二个是: tcp_max_syn_backlog,可以增大SYN连接数;第三个是:tcp_abort_on_overflow 处理不过来干脆就直接拒绝连接了。

h.关于TIME_WAIT数量太多:TIME_WAIT是个很重要的状态,但是如果在大并发的短链接下,TIME_WAIT 就会太多,这也会消耗很多系统资源。只要搜一下,你就会发 现,十有八九的处理方式都是教你设置两个参数,一个叫tcp_tw_reuse,另一个叫tcp_tw_recycle的参数,这两个参数默认值都是被关闭的,后者recyle比前者resue更为 激进,resue要温柔一些。另外,如果使用tcp_tw_reuse,必需设置tcp_timestamps=1,否则无效。这里,你一定要注意,打开这两个参数会有比较大的坑--可能会让TCP 连接出一些诡异的问题。


三、Linux网络编程


socket:

int socket(int domain, int type,intprotocol)

  domain:说明我们网络程序所在的主机采用的通讯协族(AF_UNIX和AF_INET等)。

AF_UNIX只能够用于单一的Unix 系统进程间通信,而AF_INET是针对Internet的,因而可以允许在远程主机之间通信(当我们 mansocket时发现domain可选项是 PF_*而不是 AF_*,因为glibc是posix的实现所以用PF代替了AF,不过我们都可以使用的)。

type:我们网络程序所采用的通讯协议(SOCK_STREAM,SOCK_DGRAM等)

        SOCK_STREAM表明我们用的是TCP 协议,这样会提供按顺序的,可靠,双向,面向连接的比特流。

        SOCK_DGRAM 表明我们用的是UDP协议,这样只会提供定长的,不可靠,无连接的通信。

protocol:由于我们指定了type,所以这个地方我们一般只要用0来代替就可以了socket为网络通讯做基本的准备。

成功时返回文件描述符,失败时返回-1,看errno可知道出错的详细情况。

bind:

int bind(int sockfd, struct sockaddr*my_addr, int addrlen) 

sockfd:是由socket调用返回的文件描述符。

addrlen:是sockaddr结构的长度。

my_addr:是一个指向sockaddr的指针。

其中sockaddr的定义如下: 

        struct sockaddr{

                unisgned short  as_family;

                char            sa_data[14];

        }; 

不过由于系统的兼容性,我们一般不用这个头文件,而使用另外一个结构(struct sockaddr_in) 来代替。在中有sockaddr_in的定义

        struct sockaddr_in{

                unsigned short          sin_family;    

                unsigned short int      sin_port;

                struct in_addr          sin_addr;

                unsigned char           sin_zero[8];

        }

我们主要使用Internet所以

        sin_family一般为AF_INET,

        sin_addr设置为INADDR_ANY表示可以和任何的主机通信,

        sin_port是我们要监听的端口号。sin_zero[8]是用来填充的。

bind将本地的端口同socket返回的文件描述符捆绑在一起.成功是返回0,失败的情况和socket一样。


listen:

int listen(int sockfd,int backlog)

sockfd:是bind后的文件描述符。

backlog:设置请求排队的最大长度。当有多个客户端程序和服务端相连时, 使用这个表示可以介绍的排队长度。

listen函数将bind的文件描述符变为监听套接字。回的情况和bind一样。

accept:

int accept(int sockfd, structsockaddr *addr,int *addrlen)

sockfd:是listen后的文件描述符。

  addr,addrlen是用来给客户端的程序填写的,服务器端只要传递指针就可以了。bind,listen和accept是服务器端用的函数,accept调用时,服务器端的程序会一直阻塞到有一个客户程序发出了连接。accept成功时返回最后的服务器端的文件描述符,这个时候服务器端可以向该描述符写信息了,失败时返回-1。


connect:

int connect(int sockfd, structsockaddr * serv_addr,int addrlen)

   sockfd:socket返回的文件描述符。

  serv_addr:储存了服务器端的连接信息.其中sin_add是服务端的地址

    addrlen:serv_addr的长度

connect函数是客户端用来同服务端连接的,成功时返回0,sockfd是同服务端通讯的文件描述符失败时返回-1。


write:

ssize_t write(int fd, const void*buf, size_t count);

fd:文件描述符,就是socket的返回的值(非负),

buf:指向要发送的数据,count为要发送的字符数。

返回发送的数据的字节数。如果失败,则返回-1。


read:

ssize_t read(int fd,void *buf,size_t nbyte)

fd:文件描述符,就是socket的返回的值(非负),

buf:指向用于写数据的缓存,nbyte为缓存的大小。

返回读取的数据的字节数。如果失败,则返回-1。


close:

int close(int fd);

用于关闭连接,fd为文件描述符,就是socket返回的非负值。

关闭成功,则返回0,失败返回-1。


几点说明:

1、Client端connect一定要在Server端listen之后调用才有可能成功,否则立即返回错误;

2、Server端listen之后,Client端的connect会阻塞,直到Server端accept之后才会返回;

3、Server端的accept会一直阻塞,直到Client端connect之后才返回;

4、在Server端listen之后,Client端发起connect,但是在Server端accept之前有放弃了链接(可能是发来了复位信号,也可能等待超时),然后Server端再accept,此时accept会返回一个错误(-1),遇到这种错误,只需要再次调用accept即可。

5、read数据时,如果此时没有数据,会一直阻塞,直到收到数据之后才返回。

6、write数据时,只是先将数据写到内核的发送缓存中,并没有真正的发送出去。

7、如果内核缓存满了,此时write会阻塞,直到内核缓存里的数据被发送出去,才会把数据写到缓存,在返回。

8、connect和accept都是在3次握手完成之后才返回(如果3次握手没有成功,则返回失败)。

9、close并不是在4次握手完成之后返回,发送了断开链接请求就返回,可以设置TCP选项来是close在4次握手完成之后再返回。

版权声明:本文为博主原创文章,未经博主允许不得转载。

TCP网络编程学习小结

标签:网络编程   socket   linux   tcp   

原文地址:http://blog.csdn.net/ghaitian/article/details/48104633

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!