摘要: 具体每种重传类型的wireshark示例解说参考前文 来自为知笔记(Wiz) 阅读全文
posted @ 2016-11-07 14:54 lshs 阅读(2390) 评论(3) 推荐(0) 编辑
摘要: 目前已经有了英文版第二版的TCPIP详解,中文版暂时还没有,但是英文版还是有好几处错误,作者和官方竟然没有维护一个勘误表。 个人阅读过程中针对TCP部分可能有问题的地方简单勘误一下 P596:示意图中最后一条TCP消息,Seq=K+1,作者写成了Seq=K。 P600:TCP同关示意图中最后一条TC 阅读全文
posted @ 2016-11-07 14:52 lshs 阅读(1989) 评论(0) 推荐(0) 编辑
摘要: 一、epoll_create & epoll_create1 SYSCALL_DEFINE1(epoll_create, int, size) sys_epoll_create->sys_epoll_create1 SYSCALL_DEFINE1(epoll_create1, int, flags) 阅读全文
posted @ 2016-11-07 14:50 lshs 阅读(2797) 评论(0) 推荐(1) 编辑
摘要: 一、概述 ECN的相关内容是在RFC3168中定义的,这里我简单描述一下RFC3168涉及的主要内容。 1、AQM和RED 目前TCP中多数的拥塞控制算法都是通过缓慢增加拥塞窗口直到检测到丢包来进行慢启动的,这就会导致数据包在路由器缓存队列堆积,当路由器没有复杂的调度和缓存管理策略的时候,路由器一般 阅读全文
posted @ 2016-11-07 14:40 lshs 阅读(8910) 评论(0) 推荐(0) 编辑
摘要: 前面我们演示分析了100+个wireshark TCP实例,拥塞控制部分也介绍常见的拥塞处理场景以及4种拥塞撤销机制,但是我们一直使用的都是reno拥塞控制算法。实际上拥塞控制发展到今天已经有了各种各样的拥塞控制算法,而且普遍认为单纯基于丢包的reno拥塞控制算法已经不适应当前internet网络了,最近谷歌又折腾出了一个BBR拥塞控制算法,对比国内,还没有一个在TCP领域有突出贡献的公司,谷歌在... 阅读全文
posted @ 2016-11-07 14:40 lshs 阅读(4813) 评论(0) 推荐(0) 编辑
摘要: 一、概述我们之前介绍过rtt、ssthresh等变量,这些变量一般在TCP连接建立的时候有个初始值,然后随着TCP的数据交互逐渐调整到适应对应的网络状态的值。但是如果每次TCP建立连接都依靠默认初始值逐渐调整,那么可能需要一段时间才能调整到合适值,这显然会降低TCP性能,对于这种场景一种优化方案就是destination metrics。RFC2140中描述,如果新建立的连接从已经关闭的连接缓存的... 阅读全文
posted @ 2016-11-07 14:37 lshs 阅读(2348) 评论(0) 推荐(0) 编辑
摘要: 利用crash工具,我们可以很方便的查看正在运行内核的一些全局变量的数据结构,如TCP的ehash、bhash哈希桶,全局变量的查看比较简单。Crash工具还允许我们查看调用堆栈内部的局部变量,下面示例查看一个进程的listen sock结构(实际上从file->private_data中查看更为方 阅读全文
posted @ 2016-11-07 14:36 lshs 阅读(1826) 评论(0) 推荐(0) 编辑
摘要: 一、概述这里主要简单分析一个丢包重传并恢复的场景,通过不同的设置让这个相同的场景分别触发RACK重传和前向重传,通过对比说明以下问题:Forward Retransmit可以产生只有重传标记的数据包,也可以产生同时具有重传标记和SACK标记的数据包,注意这里说的这些数据包是没有Lost标记的,这是前向重传与之前介绍的快速重传及其变种的差异,进而会对in_flight的统计产生影响。Recovery... 阅读全文
posted @ 2016-11-07 14:36 lshs 阅读(2455) 评论(0) 推荐(0) 编辑
摘要: 一、概述这里的重点是介绍TLP、ER与拥塞控制并不是介绍TLP和ER本身,因此TLP和ER的详细内容请翻前文。在TLP与拥塞控制的交互中有几个点需要注意1、TLP触发的重传后,TCP仍然处于Open状态,TLP重传也不会更新lost_out等状态变量,TLP重传发出的是探测报文并不是因为当前确定丢包而重传。2、TLP与ER/FACK是相互组合的,TLP触发的FACK重传与之前介绍的FACK下快速恢... 阅读全文
posted @ 2016-11-07 14:35 lshs 阅读(2197) 评论(0) 推荐(0) 编辑
摘要: 一、概述我们之前在SACK关闭场景下的拥塞撤销那篇文章中提到过Eifel探测算法(Eifel Detection Algorithm),最早在介绍DSACK和FRTO的时候我们就有提到过Eifel探测算法。Eifel探测算法是基于TSopt选项中TSV的单调非减特性设计的。简单介绍一下Linux中Eifel探测算法的实现,Linux会在TCP进行第一次重传的时候把重传数据包的TSV记录在状态变量r... 阅读全文
posted @ 2016-11-07 14:34 lshs 阅读(1591) 评论(0) 推荐(0) 编辑
摘要: 一、概述DSACK下的虚假重传的检测我们之前重传部分的文章已经介绍过了,这里简单说一下拥塞控制部分的实现。linux内部会维护一个undo_retrans状态变量,其值为已经重传的次数减掉被DSACK检测到的虚假重传的次数,例如当前总共重传了5个数据包,DSACK检测到3个虚假重传,那么undo_retrans即为2。undo_retrans初始化为-1,当发生重传的时候,如果undo_retra... 阅读全文
posted @ 2016-11-07 14:33 lshs 阅读(1668) 评论(0) 推荐(0) 编辑
摘要: 一、概述FRTO虚假超时重传检测我们之前重传章节的文章已经介绍过了,这里不再重复介绍,针对后面的示例在说明两点1、FRTO只能用于虚假超时重传的探测,不能用于虚假快速重传的探测。2、延迟ER重传触发的进入Recovery状态时候,并不会立即更新cwnd。本篇在演示FRTO的同时,还会涉及到ER超时重传、TLP探测、SACK关闭场景下的拥塞撤销,后面或者前面都会有针对这些场景的专门介绍文章。一、wi... 阅读全文
posted @ 2016-11-07 14:32 lshs 阅读(1681) 评论(0) 推荐(0) 编辑
摘要: 一、概述FACK下的重传我们在之前的重传部分已经进行了介绍,这里简单介绍一下随着FACK提出的拥塞控制算法的改进及随后的进一步改进。从我们之前介绍的RFC2582和RFC5681中可以看到,快速恢复下当探测到丢包的时候,会设置ssthresh = max (FlightSize / 2, 2*MSS)、 cwnd=ssthresh+3*MSS,随后发送端收到dup ACK的时候进行cwnd的inf... 阅读全文
posted @ 2016-11-07 14:31 lshs 阅读(4036) 评论(2) 推荐(0) 编辑
摘要: 一、概述 1、SACK下的特殊处理过程 SACK下的拥塞控制处理是linux中拥塞控制的实现依据,再次强调一遍RFC6675的重要性,linux中拥塞控制主体框架的实现是与RFC6675一致的,所以如果要理解linux中拥塞控制的实现,强烈建议看一下RFC6675。我这里给出RFC6675中SACK 阅读全文
posted @ 2016-11-07 14:31 lshs 阅读(1626) 评论(2) 推荐(0) 编辑
摘要: 一、概述这篇文章介绍一下TCP从Recovery状态恢复到Open状态的时候cwnd的更新。我们在tcp重传部分的文章中曾经介绍过虚假重传的概念,Linux在探测到虚假重传的时候就会执行拥塞撤销操作。所谓的拥塞撤销是指撤销虚假的快速重传或者RTO超时重传对拥塞窗口的影响。有多种方法可能会触发拥塞撤销如前面介绍的DSACK和FRTO以及后面要介绍的Eifel算法以及本文介绍的SACK关闭场景下的拥塞... 阅读全文
posted @ 2016-11-07 14:30 lshs 阅读(2808) 评论(0) 推荐(0) 编辑
摘要: 修改linux内核代码或者内核模块的时候,搞不好就会造成linux死机崩溃,crash死机后/var/log/kern.log里面不会有任何异常信息记录。这时候kdump就会派上用场了,网上kdump的中英文介绍资料很多,但是很多都是基于系统自带的linux进行说明的,这里记录一下在新编译的内核上使 阅读全文
posted @ 2016-11-07 14:30 lshs 阅读(6283) 评论(0) 推荐(0) 编辑
摘要: 一、概述我们之前介绍过Tahoe版本中,无论是快速重传还是RTO超时重传,都会触发乘法减小,将cwnd置为1,然后重新开始慢启动过程。在reno版本中引入快速回复,当发生快速重传的时候,就会触发快速恢复过程,但是reno中的快速恢复过程在收到partial ACK的时候就会退出。在new reno中对快速恢复进行了改进,只有当收到的ack number越过recovery point的时候,才会退... 阅读全文
posted @ 2016-11-07 14:28 lshs 阅读(4611) 评论(0) 推荐(0) 编辑
摘要: 一、概述在RFC2861中,区分了TCP连接数据传输的三种状态network-limited:TCP的数据传输受限于拥塞窗口而不能发送更多的数据application-limited:TCP的数据传输速率受限与应用层的数据写入速率,并没有到达拥塞窗口上限,有些文档也称呼这种场景为data-limitedidle:发送端没有额外的数据等待发送,当数据发送间隔超过一个RTO的时候就认为是ilde态。之... 阅读全文
posted @ 2016-11-07 14:26 lshs 阅读(3365) 评论(4) 推荐(0) 编辑
摘要: 在本篇中我们继续上一篇文章wireshark的示例讲解,上一篇介绍了一个综合示例后,本篇介绍一些简单的示例,在读本篇前建议先把上一篇读完,为了节省篇幅,本篇只针对一些特殊的场景点报文进行讲解,不会像上一篇一样对每个报文都进行讲解并随报文更新相关状态变量的值了。一、wireshark示例本篇示例的TCP测试仍然设置初始拥塞窗口为3,并关闭TSO、GSO等功能。同时设置wireshark使其不在inf... 阅读全文
posted @ 2016-11-07 14:24 lshs 阅读(2599) 评论(5) 推荐(0) 编辑
摘要: 一、Linux中的慢启动和拥塞避免 Linux中采用了Google论文的建议把IW初始化成了10了。在linux中一般有三种场景会触发慢启动过程1、连接初始建立发送数据的时候,此时cwnd初始化为10,ssthresh初始化为0x7fffffff,因此会触发慢启动。但是当路由表中有对应的设置的时候,cwnd和ssthresh会被路由表中的设置的值覆盖,有可能连接建立后直接进入拥塞避免阶... 阅读全文
posted @ 2016-11-07 14:22 lshs 阅读(4298) 评论(0) 推荐(0) 编辑