研究论文 在上共享 优先:通过表依赖项解析启用压缩程序布局作者:克里斯托弗 利特牌手表,深圳 陈,凯 高,以及杨·理查德 杨作者信息和声明SOSR’19:2019年ACM SDN研究研讨会会议记录2019年4月页1-7https://doi.org/10.1145/3314148.3314348出版:2019年4月3日 出版历史 获取引文提醒新增引文提醒!此警报已成功添加,将发送到:只要您选择的记录被引用,您就会收到通知。新引文提醒!拜托登录到您的帐户 获取访问权限目录SOSR’19:2019年ACM SDN研究研讨会会议记录优先:通过表依赖项解析启用压缩程序布局页1-7下一篇文章使用可编程开关ASIC实现数据平面中的精确时间同步下一步摘要工具书类信息和贡献者文献计量学和引文获取访问权限工具书类媒体桌子分享摘要可编程交换ASIC的兴起使交换机能够处理现代网络程序的复杂性和多样性,同时满足现代网络的性能要求。然而,利用这些交换机的灵活性,使路由程序的规模激增:最近提出的程序包含100[11]张甚至1000[10]张表。在可编程交换机中实现这些程序需要找到深度最小的布局:如果布局的匹配操作阶段比交换机的管道提供的多,则交换机必须再循环,从而降低吞吐量。即使布局适合交换机的管道,因为大多数商业管道都无法将内存自由分配给阶段,非紧凑管道也可能导致阶段负载不足和内存利用率严重不足。虽然表间控制和数据依赖性严重限制了编译器紧凑地布局表的能力,但还没有提出可以完全解决依赖性的交换体系结构。为了解决这个问题,我们引入了优先级,这是RMT交换ASIC的一个扩展,它使依赖项链接的表能够并行执行,甚至可以无序执行。优先级可以解决近70%的switch.p4[11]的依赖性(一个真实世界的路由程序),将其管道深度减少48%,并且仅适度增加硅面积。工具书类[1]Broadcom三叉戟3。{n.d.}。XPliant以太网交换机产品系列。https://www.broadcom.com/products/ethernet-connectivity/switching/strataxgs/bcm56870-series/。访问时间:2018-11-15。谷歌学者[2]Pat Bosshart、Dan Daly、Glen Gibb、Martin Izzard、Nick McKeown、Jennifer Rexford、Cole Schlesinger、Dan Talayco、Amin Vahdat、George Varghese和David Walker。2014.P4:编程协议相关数据包处理器。SIGCOMM计算。Commun公司。第44版,第3版(2014年7月),87-95。数字图书馆谷歌学者[3]Pat Bosshart、Glen Gibb、Hun-Seok Kim、George Varghese、Nick McKeown、Martin Izzard、Fernando Mujica和Mark Horowitz。2013.转发变形:SDN硬件中的快速可编程匹配操作处理。ACM SIGCOMM Computer Communication Review,第43卷。美国医学会,99-110。数字图书馆谷歌学者[4]Pat Bosshart、Glen Gibb、Hun Seok Kim、George Varghese、Nick McKeown、Martin Izzard、Fernando Mujica和Mark Horowitz。2013年,转发变形:SDN硬件中的快速可编程匹配操作处理。ACM SIGCOMM 2013 SIGCOMM会议记录(SIGCOMM'13)。ACM,美国纽约州纽约市,99-110。数字图书馆谷歌学者[5]洞穴。{n.d.}。XPliant以太网交换机产品系列。https://www.cavium.com/xpliant-ethernet-switch-product-family.html。访问时间:2018-11-15。谷歌学者[6]Sharad Chole、Andy Fingerhut、Sha Ma、Anirudh Sivaraman、Shay Vargaftik、Alon Berger、Gal Mendelson、Mohammad Alizadeh、Shang Tse Chuang、Isaac Keslassy等,2017年。drmt:非聚合可编程切换。在ACM数据通信特别兴趣小组会议记录中。ACM,1-14。数字图书馆谷歌学者[7]戴金泉(Jinquan Dai)、黄波(Bo Huang)、李龙(Long Li)和路迪·哈里森(Luddy Harrison)。2005.自动划分流水线体系结构的数据包处理应用程序。SIGPLAN不是。40,6(2005年6月),237--248。数字图书馆谷歌学者[8]G.Diamos和S.Yalamanchili。2010.多GPU系统上的推测执行。2010年IEEE并行分布式处理(IPDPS)国际研讨会。1--12.谷歌学者[9]兰斯·哈蒙德(Lance Hammond)、马克·威利(Mark Willey)和昆勒·奥卢科顿(Kunle Olukotun)。1998年。支持芯片多处理器的数据推测。ACM SIGOPS操作系统评论32,5(1998),58-69。数字图书馆谷歌学者[10]大卫·汉考克(David Hancock)和雅各布斯·范德默威(Jacobus van der Merwe)。2016.HyPer4:使用P4虚拟化可编程数据平面。在第12届新兴网络实验与技术国际会议论文集(CoNEXT’16)。ACM,美国纽约州纽约市,35-49。数字图书馆谷歌学者[11]2019年赤脚公司。开关.p4。https://github.com/p4lang/switch/blob/master/p4src/switch.p4谷歌学者[12]英特尔。{n.d.}。Intel以太网交换机硅。https://www.intel.com/content/www/us/en/products/network-io/ethernet/switches.html。访问时间:2018-11-15。谷歌学者[13]Lavanya Jose、Lisa Yan、George Varghese和Nick McKeown。2015.为可配置交换机编译数据包程序。在第12届USENIX网络系统设计与实现会议(NSDI’15)的会议记录中。USENIX协会,美国加利福尼亚州伯克利,103-115。http://dl.acm.org/citation.cfm?id=2789770.2789778数字图书馆谷歌学者[14]Andrew B Kahng、Bill Lin和Siddhartha Nath。2012.用于改进NoC路由器估计的控制和数据的显式建模。2012年第49届ACM/EDAC/IEEE设计自动化会议(DAC)。IEEE,392--397。数字图书馆谷歌学者[15]刘韶山、克里斯汀·艾森贝斯和Jean-Luc Gaudiot。2011年,GPU的价值预测和投机执行。国际并行编程杂志39,5(2011年10月),533--552。交叉参考谷歌学者[16]Scott A.Mahlke、David C.Lin、William Y.Chen、Richard E.Hank和Roger A.Bringmann。1992.编译器对使用超块的谓词执行的有效支持。载于第25届国际微建筑年会论文集(MICRO 25)。IEEE计算机学会出版社,美国加利福尼亚州洛斯阿拉米托斯,45-54。http://dl.acm.org/citation.cfm?id=144953.144998数字图书馆谷歌学者[17]J.Menon、M.de Kruijf和K.Sankaralingam。2012.iGPU:GPU上的异常支持和推测执行。2012年,第39届计算机体系结构国际年会(ISCA)。72--83.数字图书馆谷歌学者[18]里希尤尔·尼基尔(Rishiyur Nikhil)。2004年。Bluespec System Verilog:高效、正确的RTL来自高级规范。《协同设计的形式方法和模型》,2004年。04年备忘录。诉讼程序。第二届ACM和IEEE国际会议,IEEE,69-70。数字图书馆谷歌学者[19]Jeffrey T Oplinger、David L Heine和Monica S Lam。1999.寻找推测的线程级并行。《并行体系结构和编译技术》,1999年。诉讼程序。1999年IEEE国际会议,303-313。数字图书馆谷歌学者[20]David A.Patterson和John L.Hennessy。1990年,《计算机体系结构:定量方法》。Morgan Kaufmann Publishers Inc.,美国加利福尼亚州旧金山。数字图书馆谷歌学者[21]B Ramakrishna Rau和Joseph A Fisher。1993.教学级并行处理:历史、概述和观点。在指令级并行中。施普林格,9-50。数字图书馆谷歌学者[22]Anirudh Sivaraman、Alvin Cheung、Mihai Budiu、Changhoon Kim、Mohammad Alizadeh、Hari Balakrishnan、George Varghese、Nick McKeown和Steve Licking。2016.分组事务:线速交换机的高级编程。2016年ACM SIGCOMM会议记录。美国医学会,15--28。数字图书馆谷歌学者[23]Anirudh Sivaraman、Changhoon Kim、Ramkumar Krishnamoorthy、Advait Dixit和Mihai Budiu。2015年12月。p4:对数据中心交换机的转发平面进行编程。在第一届ACM SIGCOMM软件定义网络研究研讨会的会议记录中。ACM,2。数字图书馆谷歌学者[24]唐纳德·托马斯和菲利普·穆比。2008年。Verilog®硬件描述语言。施普林格科技与商业媒体。谷歌学者 引用人查看全部陈X刘浩黄Q王P张D周H吴C(2020)SPEED:数据平面程序的资源高效和高性能部署2020 IEEE第28届网络协议国际会议(ICNP)10.1109/ICNP49622.2020.9259384(1-12)在线发布日期:2020年10月13日https://doi.org/10.109/ICNP49622.2020.9259384 索引术语 优先顺序:通过表依赖项解析启用压缩程序布局网络网络组件中间节点路由器 建议 知识、定时优先和时钟阅读更多信息通过动态优先级图提高多核FPGA器件的存储性能FCCM’13:2013 IEEE第21届现场可编程定制计算机年度国际研讨会会议记录 新兴的FPGA设备集成了丰富的RAM块和高性能处理器内核,为有效实现单片机分布式逻辑存储器(DLM)体系结构提供了前所未有的机会[1]。作为“以内存为中心”的DLM。。。阅读更多信息外循环矢量化:针对短SIMD架构重新访问PACT'08:第17届并行体系结构和编译技术国际会议论文集 在过去的三十年里,矢量化一直是使用数据级并行度来加速Cray等矢量机上的科学工作负载的一种重要方法。在过去的十年中,它还被证明对加速多媒体和。。。阅读更多信息 评论 Please enable JavaScript to view thecomments powered by Disqus. 信息和贡献者问询处发布于 SOSR’19:2019年ACM SDN研究研讨会会议记录2019年4月166页国际标准图书编号:9781450367103内政部:10.1145/3314148 版权所有©2019 ACM。允许制作本作品的全部或部分数字或硬拷贝供个人或课堂使用,但不收取任何费用,前提是复制品的制作或分发不是为了盈利或商业利益,并且复制品在首页注明本通知和完整引文。必须尊重ACM以外的其他人对本作品组成部分的版权。允许用信用证进行摘要。要以其他方式复制或重新发布,在服务器上发布或重新发布到列表,需要事先获得特定许可和/或付费。从请求权限[电子邮件保护]赞助商SIGCOMM:ACM数据通信特别兴趣小组出版商计算机协会美国纽约州纽约市出版历史出版:2019年4月3日权限请求对此文章的权限。请求权限检查更新限定符研究文章研究推荐有限公司会议SOSR’19赞助商:SIGCOMM公司SOSR’19:SDN研究研讨会2019年4月3-4日加利福尼亚州圣何塞市,美国 接受率总体接受率43份提交中的7份,16% 贡献者 其他指标查看文章指标文献计量学和引文文献计量学 文章指标 1引文总数查看引文234总下载次数下载次数(过去12个月)11下载次数(最近6周)1 其他指标查看作者指标引文 引用人查看全部陈X刘浩黄Q王P张D周H吴C(2020)SPEED:数据平面程序的资源高效和高性能部署2020 IEEE第28届网络协议国际会议(ICNP)10.1109/ICNP49622.2020.9259384(1-12)在线发布日期:2020年10月13日https://doi.org/10.109/ICNP49622.2020.9259384 视图选项获取访问权限 登录选项检查您是否可以通过登录凭据或您的机构访问本文。登录完全访问权限获取此出版物 视图选项 PDF格式以PDF文件查看或下载。PDF格式 电子阅读器使用联机查看电子阅读器.电子阅读器媒体数字其他桌子分享分享共享此出版物链接复制链接已复制!复制失败。在社交媒体上分享Linkedin公司重新编辑电子邮件附属公司克里斯托弗 利特牌手表耶鲁大学查看个人资料深圳 陈耶鲁大学和同济大学查看个人资料Kai公司 高四川大学查看个人资料杨理查 杨耶鲁大学和同济大学查看个人资料