研究论文

优先：通过表依赖项解析启用压缩程序布局

作者:

克里斯托弗利特牌手表,

凯高，以及

杨·理查德杨作者信息和声明

SOSR’19：2019年ACM SDN研究研讨会会议记录

2019年4月

页1-7

https://doi.org/10.1145/3314148.3314348

出版:2019年4月3日出版历史

获取访问权限

摘要

可编程交换ASIC的兴起使交换机能够处理现代网络程序的复杂性和多样性，同时满足现代网络的性能要求。然而，利用这些交换机的灵活性，使路由程序的规模激增：最近提出的程序包含100[11]张甚至1000[10]张表。在可编程交换机中实现这些程序需要找到深度最小的布局：如果布局的匹配操作阶段比交换机的管道提供的多，则交换机必须再循环，从而降低吞吐量。即使布局适合交换机的管道，因为大多数商业管道都无法将内存自由分配给阶段，非紧凑管道也可能导致阶段负载不足和内存利用率严重不足。虽然表间控制和数据依赖性严重限制了编译器紧凑地布局表的能力，但还没有提出可以完全解决依赖性的交换体系结构。为了解决这个问题，我们引入了优先级，这是RMT交换ASIC的一个扩展，它使依赖项链接的表能够并行执行，甚至可以无序执行。优先级可以解决近70%的switch.p4[11]的依赖性（一个真实世界的路由程序），将其管道深度减少48%，并且仅适度增加硅面积。

工具书类

[1]

Broadcom三叉戟3。{n.d.}。XPliant以太网交换机产品系列。https://www.broadcom.com/products/ethernet-connectivity/switching/strataxgs/bcm56870-series/。访问时间：2018-11-15。

[2]

Pat Bosshart、Dan Daly、Glen Gibb、Martin Izzard、Nick McKeown、Jennifer Rexford、Cole Schlesinger、Dan Talayco、Amin Vahdat、George Varghese和David Walker。2014.P4：编程协议相关数据包处理器。SIGCOMM计算。Commun公司。第44版，第3版（2014年7月），87-95。

数字图书馆

[3]

Pat Bosshart、Glen Gibb、Hun-Seok Kim、George Varghese、Nick McKeown、Martin Izzard、Fernando Mujica和Mark Horowitz。2013.转发变形：SDN硬件中的快速可编程匹配操作处理。ACM SIGCOMM Computer Communication Review，第43卷。美国医学会，99-110。

数字图书馆

[4]

Pat Bosshart、Glen Gibb、Hun Seok Kim、George Varghese、Nick McKeown、Martin Izzard、Fernando Mujica和Mark Horowitz。2013年，转发变形：SDN硬件中的快速可编程匹配操作处理。ACM SIGCOMM 2013 SIGCOMM会议记录（SIGCOMM'13）。ACM，美国纽约州纽约市，99-110。

数字图书馆

[5]

洞穴。{n.d.}。XPliant以太网交换机产品系列。https://www.cavium.com/xpliant-ethernet-switch-product-family.html。访问时间：2018-11-15。

[6]

Sharad Chole、Andy Fingerhut、Sha Ma、Anirudh Sivaraman、Shay Vargaftik、Alon Berger、Gal Mendelson、Mohammad Alizadeh、Shang Tse Chuang、Isaac Keslassy等，2017年。drmt：非聚合可编程切换。在ACM数据通信特别兴趣小组会议记录中。ACM，1-14。

数字图书馆

[7]

戴金泉（Jinquan Dai）、黄波（Bo Huang）、李龙（Long Li）和路迪·哈里森（Luddy Harrison）。2005.自动划分流水线体系结构的数据包处理应用程序。SIGPLAN不是。40,6（2005年6月），237--248。

数字图书馆

[8]

G.Diamos和S.Yalamanchili。2010.多GPU系统上的推测执行。2010年IEEE并行分布式处理（IPDPS）国际研讨会。1--12.

[9]

兰斯·哈蒙德（Lance Hammond）、马克·威利（Mark Willey）和昆勒·奥卢科顿（Kunle Olukotun）。1998年。支持芯片多处理器的数据推测。ACM SIGOPS操作系统评论32，5（1998），58-69。

数字图书馆

[10]

大卫·汉考克（David Hancock）和雅各布斯·范德默威（Jacobus van der Merwe）。2016.HyPer4:使用P4虚拟化可编程数据平面。在第12届新兴网络实验与技术国际会议论文集（CoNEXT’16）。ACM，美国纽约州纽约市，35-49。

数字图书馆

[11]

2019年赤脚公司。开关.p4。https://github.com/p4lang/switch/blob/master/p4src/switch.p4

[12]

英特尔。{n.d.}。Intel以太网交换机硅。https://www.intel.com/content/www/us/en/products/network-io/ethernet/switches.html。访问时间：2018-11-15。

[13]

Lavanya Jose、Lisa Yan、George Varghese和Nick McKeown。2015.为可配置交换机编译数据包程序。在第12届USENIX网络系统设计与实现会议（NSDI’15）的会议记录中。USENIX协会，美国加利福尼亚州伯克利，103-115。http://dl.acm.org/citation.cfm？id=2789770.2789778

数字图书馆

[14]

Andrew B Kahng、Bill Lin和Siddhartha Nath。2012.用于改进NoC路由器估计的控制和数据的显式建模。2012年第49届ACM/EDAC/IEEE设计自动化会议（DAC）。IEEE，392--397。

数字图书馆

[15]

刘韶山、克里斯汀·艾森贝斯和Jean-Luc Gaudiot。2011年，GPU的价值预测和投机执行。国际并行编程杂志39，5（2011年10月），533--552。

[16]

Scott A.Mahlke、David C.Lin、William Y.Chen、Richard E.Hank和Roger A.Bringmann。1992.编译器对使用超块的谓词执行的有效支持。载于第25届国际微建筑年会论文集（MICRO 25）。IEEE计算机学会出版社，美国加利福尼亚州洛斯阿拉米托斯，45-54。http://dl.acm.org/citation.cfm？id=144953.144998

数字图书馆

[17]

J.Menon、M.de Kruijf和K.Sankaralingam。2012.iGPU：GPU上的异常支持和推测执行。2012年，第39届计算机体系结构国际年会（ISCA）。72--83.

数字图书馆

[18]

里希尤尔·尼基尔（Rishiyur Nikhil）。2004年。Bluespec System Verilog：高效、正确的RTL来自高级规范。《协同设计的形式方法和模型》，2004年。04年备忘录。诉讼程序。第二届ACM和IEEE国际会议，IEEE，69-70。

数字图书馆

[19]

Jeffrey T Oplinger、David L Heine和Monica S Lam。1999.寻找推测的线程级并行。《并行体系结构和编译技术》，1999年。诉讼程序。1999年IEEE国际会议，303-313。

数字图书馆

[20]

David A.Patterson和John L.Hennessy。1990年，《计算机体系结构：定量方法》。Morgan Kaufmann Publishers Inc.，美国加利福尼亚州旧金山。

数字图书馆

[21]

B Ramakrishna Rau和Joseph A Fisher。1993.教学级并行处理：历史、概述和观点。在指令级并行中。施普林格，9-50。

数字图书馆

[22]

Anirudh Sivaraman、Alvin Cheung、Mihai Budiu、Changhoon Kim、Mohammad Alizadeh、Hari Balakrishnan、George Varghese、Nick McKeown和Steve Licking。2016.分组事务：线速交换机的高级编程。2016年ACM SIGCOMM会议记录。美国医学会，15--28。

数字图书馆

[23]

Anirudh Sivaraman、Changhoon Kim、Ramkumar Krishnamoorthy、Advait Dixit和Mihai Budiu。2015年12月。p4：对数据中心交换机的转发平面进行编程。在第一届ACM SIGCOMM软件定义网络研究研讨会的会议记录中。ACM，2。

数字图书馆

[24]

唐纳德·托马斯和菲利普·穆比。2008年。Verilog®硬件描述语言。施普林格科技与商业媒体。

引用人

陈X刘浩黄Q王P张D周H吴C(2020)SPEED：数据平面程序的资源高效和高性能部署2020 IEEE第28届网络协议国际会议（ICNP）10.1109/ICNP49622.2020.9259384(1-12)在线发布日期：2020年10月13日
https://doi.org/10.109/ICNP49622.2020.9259384

索引术语

优先顺序：通过表依赖项解析启用压缩程序布局
1. 网络
  1. 网络组件
    1. 中间节点
      1. 路由器

建议

知识、定时优先和时钟
阅读更多信息
通过动态优先级图提高多核FPGA器件的存储性能
FCCM’13：2013 IEEE第21届现场可编程定制计算机年度国际研讨会会议记录

新兴的FPGA设备集成了丰富的RAM块和高性能处理器内核，为有效实现单片机分布式逻辑存储器（DLM）体系结构提供了前所未有的机会[1]。作为“以内存为中心”的DLM。。。
阅读更多信息
外循环矢量化：针对短SIMD架构重新访问
PACT'08：第17届并行体系结构和编译技术国际会议论文集

在过去的三十年里，矢量化一直是使用数据级并行度来加速Cray等矢量机上的科学工作负载的一种重要方法。在过去的十年中，它还被证明对加速多媒体和。。。
阅读更多信息

评论

信息和贡献者

问询处

发布于

封面图片ACM会议

SOSR’19：2019年ACM SDN研究研讨会会议记录

2019年4月

166页

国际标准图书编号：9781450367103

内政部：10.1145/3314148

版权所有©2019 ACM。

允许制作本作品的全部或部分数字或硬拷贝供个人或课堂使用，但不收取任何费用，前提是复制品的制作或分发不是为了盈利或商业利益，并且复制品在首页注明本通知和完整引文。必须尊重ACM以外的其他人对本作品组成部分的版权。允许用信用证进行摘要。要以其他方式复制或重新发布，在服务器上发布或重新发布到列表，需要事先获得特定许可和/或付费。从请求权限[电子邮件保护]

赞助商

SIGCOMM:ACM数据通信特别兴趣小组

出版商

计算机协会

美国纽约州纽约市

出版历史

出版：2019年4月3日

权限

请求对此文章的权限。

检查更新

限定符

研究文章
研究
推荐有限公司

会议

SOSR’19

赞助商：

SIGCOMM公司

SOSR’19：SDN研究研讨会

2019年4月3-4日

加利福尼亚州圣何塞市，美国

接受率

总体接受率43份提交中的7份，16%

贡献者

其他指标

查看文章指标

文献计量学和引文

文献计量学

文章指标

1
引文总数
查看引文
234
总下载次数

下载次数（过去12个月）11
下载次数（最近6周）1

其他指标

查看作者指标

引文

引用人

陈X刘浩黄Q王P张D周H吴C(2020)SPEED：数据平面程序的资源高效和高性能部署2020 IEEE第28届网络协议国际会议（ICNP）10.1109/ICNP49622.2020.9259384(1-12)在线发布日期：2020年10月13日
https://doi.org/10.109/ICNP49622.2020.9259384

视图选项

获取访问权限

登录选项

检查您是否可以通过登录凭据或您的机构访问本文。

完全访问权限

获取此出版物

视图选项

PDF格式

以PDF文件查看或下载。

电子阅读器

使用联机查看电子阅读器.

电子阅读器

媒体

数字

其他

桌子