重要的性能指标 两个最重要的性能指标: ·吞吐量:每秒处理的包数(pps)或比特数(bps) 延迟:处理一个数据包的时间(通常关注最坏情况延迟) 性能测量分为: 全局性能测量:如端到端延迟和带宽,使用网络管理工 具(如 Open view)进行测量 ●本地性能测量:如路由器查找速度,使用计算机内部的 性能测量工具(如 Oprofile,Ⅴtune)测量 ●本课程关注数据包在本地的处理速度,线速处理是系 统优化的重要目标之
重要的性能指标 两个最重要的性能指标: 吞吐量:每秒处理的包数(pps)或比特数(bps) 延迟:处理一个数据包的时间(通常关注最坏情况延迟) 性能测量分为: 全局性能测量:如端到端延迟和带宽,使用网络管理工 具(如OpenView)进行测量 本地性能测量:如路由器查找速度,使用计算机内部的 性能测量工具(如Oprofile, Vtune)测量 本课程关注数据包在本地的处理速度,线速处理是系 统优化的重要目标之一
因特网环境的特点 ●链路速度已达到万兆量级 LoGbps已普及,40Gbps在数据中心很常见,1 ooDbs已出现 TCP流量占主导 ●大量应用使用TCP协议 小包很多 ·路由器收到的包中大约一半为最小长度(40字节)的包 移动互联网、即时通讯应用中大量都是小包 局部性很差 骨干网上,在一个非常短的时间内大约有一百万个并发流经 过一个路由器 ●这意味着,在一个包上执行的计算,在未来短时间内重用到 另一个包上的可能性很小
因特网环境的特点 链路速度已达到万兆量级 10Gbps已普及,40Gbps在数据中心很常见,100Gbps已出现 TCP流量占主导 大量应用使用TCP协议 小包很多 路由器收到的包中大约一半为最小长度(40字节)的包 移动互联网、即时通讯应用中大量都是小包 局部性很差 骨干网上,在一个非常短的时间内大约有一百万个并发流经 过一个路由器 这意味着,在一个包上执行的计算,在未来短时间内重用到 另一个包上的可能性很小
网络计算机系统面临的挑战 ●高速链路+大量小包: 包速率很高 线速处理难度大:处理一个包的时间必须非常短 高速链路+大规模并发流: 数据局部性很差 Cache用不上(命中率低),消除访存瓶颈困难 TCP流占主导+TCP处理开销大: 优化TCP实现很重要
网络计算机系统面临的挑战 高速链路 + 大量小包: 包速率很高 线速处理难度大:处理一个包的时间必须非常短 高速链路 + 大规模并发流: 数据局部性很差 Cache用不上(命中率低),消除访存瓶颈困难 TCP流占主导 + TCP处理开销大: 优化TCP实现很重要
2.2存储器 ●在现代计算机系统结构中,访存是最大的性能瓶颈: 存储器访问时间比指令执行时间长很多 处理器速度和访存速度之间的鸿沟越来越宽,使得访 存瓶项问题更加突出 访存构成了端节点和路由器的主要性能瓶颈: 数据包、状态信息、指令等都保存在内存中 ●许多系统优化工作都是围绕访存优化而展开的 2021/1/26
2.2 存储器 在现代计算机系统结构中,访存是最大的性能瓶颈: 存储器访问时间比指令执行时间长很多 处理器速度和访存速度之间的鸿沟越来越宽,使得访 存瓶项问题更加突出 访存构成了端节点和路由器的主要性能瓶颈: 数据包、状态信息、指令等都保存在内存中 许多系统优化工作都是围绕访存优化而展开的 2021/1/26
存储器的种类 寄存器: ●由一组有序的触发器构成,访问同一个片上寄存器的耗 时大约为051ns SRAM: 由一组寄存器构成。一般情况下,片上SRAM的访问时 间为1-2ns,片外SRAM的访问时间为510ns DRAM: 存储单元组织成行、列二维结构。片上DRAM的访存延 迟大约为3ons,最快的片外DRAM访存延迟为40-6ons, 连续读的延迟约为0ons 2021/1/26
存储器的种类 寄存器: 由一组有序的触发器构成,访问同一个片上寄存器的耗 时大约为0.5-1 ns。 SRAM: 由一组寄存器构成。一般情况下,片上SRAM的访问时 间为1-2ns,片外SRAM的访问时间为5-10ns。 DRAM: 存储单元组织成行、列二维结构。片上DRAM的访存延 迟大约为30ns,最快的片外DRAM访存延迟为40-60ns, 连续读的延迟约为100ns。 2021/1/26