2016年协议:以色列海法
阿亚尔·扎克斯 , 比尔哈·门德尔森 , 劳伦斯·劳什沃格 , 文美·W·Hwu :
2016年国际并行架构与编译会议记录,2016年PACT,以色列海法,2016年9月11-15日。 ACM公司 2016 ,国际标准图书编号 978-1-4503-4121-9
第1部分: 主题演讲
阿尔文德 :
使用加速器对闪存进行大数据分析。 1
第2A部分: GPU-架构
精卫家滩 , 宋帅文 , 凯歌燕 , 幸福 , 安德烈斯·马尔克斯 , 达伦·科尔比森 :
应对低电源电压下GPU寄存器文件的可靠性挑战。 3月15日 Onur Kayiran公司 , Adwait慢跑 , 阿舒托什·帕特奈克 , 拉查塔·奥萨瓦隆尼伦 , 唐旭龙 , 马赫穆特·坎德米尔 , 加布里埃尔·H·卢 , Onur Mutlu公司 , 契塔·R·达斯 :
μC状态:细粒度GPU数据路径电源管理。 17-30 阿舒托什·帕特奈克 , 唐旭龙 , Adwait慢跑 , Onur Kayiran公司 , 阿西特·米什拉 , 马赫穆特·坎德米尔 , Onur Mutlu公司 , 契塔·R·达斯 :
具有内存处理功能的GPU体系结构的调度技术。 31-44 Bin Wang(王斌) , 岳朱 , 魏宽于 :
OAWS:内存阻塞感知扭曲调度。 45-55
第2B部分: 性能优化
布鲁诺·博丹 , 路易吉·纳尔迪 , M.泽珊·齐亚 , 哈里·瓦格斯塔夫 , 戈文德·斯雷卡·谢诺伊 , 穆拉里·克里希纳·埃马尼 , 约翰·马沃 , 克里斯托斯·科塞利迪斯 , 安迪·尼斯贝特 , 米凯尔·卢扬 , 比约恩·弗兰克 , 保罗·H·J·凯利 , 迈克尔·F·P·奥博伊尔 :
在3D场景理解中,将算法参数集成到基准测试和设计空间探索中。 57-69 Mads鲁本·伯格道夫·克里斯滕森 , 西蒙·安德烈亚斯·弗里曼·隆德 , 特洛伊斯·布鲁姆 , 詹姆斯·艾弗里 :
并行阵列操作的融合。 71-85 钱丹·雷迪 , 克鲁斯 , 阿尔伯特·柯恩 :
简约绘图:GPU上简约的语言构造和多面体编译。 87年至97年 Prashant Singh Rawat公司 , 长湾红 , 马赫什·拉维桑卡 , 维诺德·格罗弗 , 路易斯·诺埃尔·普切特 , 阿塔纳斯·鲁恩特夫 , P.萨达亚潘 :
GPU的资源意识重用驱动平铺。 99-111
第三部分: 最佳论文
Byungchul Hong公司 , 金光顺 , 郑浩安 , 永记权 , Hongsik Kim公司 , 约翰·金 :
通过近数据处理加速Linked-list遍历。 113-124 安迪·德雷贝斯 , Antoniu流行音乐 , 卡琳·海德曼 , 阿尔伯特·柯恩 , 纳塔利·德拉赫 :
NUMA的可伸缩任务并行性:用于协调调度和内存管理的统一抽象。 125-137 岩崎慎太郎 , Kenjiro Taura公司 :
任务并行程序的静态截止。 139-150
第4部分: 主题演讲
耶鲁·N·帕特 :
更高的性能和更高的效率:预测执行为我们指明了方向。 151
第5A节: 系统优化I
三亚姆·梅塔 , 约塞普·托雷拉斯 :
WearCore:可穿戴工作负载的核心。 153-164 苏达顺·坎南 , 莫努丁·库雷希 , 阿达·加夫里洛夫斯卡 , 卡斯滕·施万 :
能量感知持久性:减少NVM中基于内存的持久性的能量开销。 165-177 Neha Gholkar公司 , 弗兰克·米勒 , 巴里·朗特里 :
功率控制系统上的功率调节HPC作业。 179-191年 赵永云 , 苏里姆噢 , 伯恩哈德·艾格 :
多核数据并行程序的在线可伸缩性特征。 191-205
第5B部分: 并行软件优化
黄嘉璐 , 普拉卡什·普拉布 , 托马斯·贾布林 , Soumyadeep Ghosh公司 , 索蒂里斯·阿波斯托拉基斯 , Jae W.Lee(李在伟) , 戴维·奥古斯特 :
推测性地利用交叉调用并行性。 207-221 邱俊巧 , Zhijia Zhao(赵志佳) , 宾仁 :
MicroSpec:FSM计算的以推测为中心的细粒度并行。 221-233 迪巴卡尔峡谷 , 米科·利帕斯蒂 :
哈希映射内联。 235-246 洪博荣 , Jongsoo公园 , 灵香香 , 托德·安德森 , 米哈伊尔·斯梅尔扬斯基 :
稀疏线性代数的上下文驱动优化。 247-259
第6A部分: 缓存一致性
余向尧 , 刘洪哲 , 邹伊森(Ethan Zou) , 斯里尼瓦斯·德瓦达斯 :
Tardis 2.0:松弛一致性模型的优化时间旅行一致性。 261-274 保罗·卡赫尼 , 马克·卡萨斯 , Miquel Moretó , 埃尔维·格洛根 , 马克西姆·圣特斯 , 爱德华·伊瓜德 , 杰苏斯·拉巴特 , 马特奥·瓦莱罗 :
使用分层目录缓存和支持NUMA的运行时调度减少缓存一致性流量。 275-286
第6B部分: 内存访问效率
第7部分: 主题演讲
昆勒·奥卢科顿 :
使用摩尔定律缩放数据分析。 313
第8A部分: 系统加速度
宋明聪 , 杨虎 , 徐云龙 , 李超(音) , 陈慧翔 , 晶凌苑 , 陶莉 :
缩小基于扩展CNN的大数据处理的GPU加速的语义差距:想大,看小。 315-326 尼丁·丘格 , 瓦西斯塔葡萄酒 , 苏雷什·普里尼 , 乌代·邦杜古拉 :
用于加速FPGA上图像处理管道的DSL编译器。 327-338 金光顺 , Jeong吉云 , 约翰·金 , 马克斯蒂芬森 :
自动利用GPU的多个相关内核的隐式管道并行性。 341至352 王一鹏 , 王仁(音) , 安德鲁·赫德里奇 , 蔡英文(James Tsai) , 严索林 :
CAF:核心对核心通信加速框架。 351-362
第8B部分: 系统优化II
安德鲁·安德森 , 大卫·格雷格 :
多字节浮点数据格式的矢量化。 363-372 Sankaralingam Panneerselvam公司 , 迈克尔·斯威夫特 :
Rinnegan:异构体系结构中的高效资源使用。 373-386 甄佳 , 赵雪 , 陈冠诚 , 詹建峰 , 张立新 , 林永华 , H.彼得·霍夫斯蒂 :
在POWER8上自动调整Spark大数据工作负载:基于预测的动态SMT线程。 387-400 海纳·利茨 , 本杰明·布劳恩 , 大卫·R·切里顿 :
EXCITE-VM:扩展虚拟内存系统以支持快照隔离事务。 401-412
墙报交流
拉胡尔·博亚帕蒂 , 黄嘉怡 , 王宁远 , 金敬勋 , Ki Hwan百胜 , 金永中(Eun Jung Kim) :
海报:飞越:一种用于节能网络芯片的轻型分布式功率分配机制。 413-414 卡莉亚·科洛纳基 , Miquel Moretó , 马克·卡萨斯 , 亚历杭德罗·里科 , 罗莎·M·巴迪亚 , 爱德华·伊瓜德 , 杰苏斯·拉巴特 , 马特奥·瓦莱罗 :
海报:利用灵活的系统软件开发非对称多核处理器。 415-417 法迪·加尼姆 , 拉杰夫·巴鲁阿 , 乌兹·维什金 :
海报:使用ICE轻松实现基于PRAM的高性能并行编程。 419-420 弗洛里安·哈斯 , 塞巴斯蒂安·魏斯 , 西奥·昂格勒 , 吉尔斯·波卡姆 , 吴友峰 :
海报:具有硬件事务内存支持的COTS多核处理器上的容错执行。 421至422 Guray Ozen公司 , 爱德华·伊瓜德 , 杰苏斯·拉巴特 :
海报:基于指令的GPU编程语言和编译器的集体动态并行性。 423-424 Panneerselvam的Sankaralingam , 迈克尔·斯威夫特 :
海报:Firestorm:Power-Constrained Architecture的操作系统。 425-427 Miquel Pericás公司 :
海报:ξ-TAO:深度并行多核拓扑的以缓存为中心的执行模型和运行时。 429-431 阿尔贝托·罗斯 , 卡尔·伦纳德森 , 克里斯托斯·萨卡利斯 , 斯特凡诺斯·卡西拉斯 :
海报:对具有放松语义的关键部分进行有效的自我失效/自我降级。 433-434 Jee Ho Ryoo先生 , 米特斯·梅斯瓦尼 , Reena熊猫 , 莉齐·K·约翰 :
海报:SILC-FM:子块InterLeaved Cache Like Flat Memory Organization。 435-437 迪奥戈·努内斯·桑帕约 , 阿兰·凯特林 , 路易斯·诺埃尔·普切特 , 法布里斯·拉斯特罗 :
海报:循环转换的混合数据依赖性分析。 439-440 沈晓伟 , 叶晓春 , 徐坦 , 大王 , 张志敏 , 东瑞风机 , 唐志敏 :
海报:科学应用数据流架构的优化。 441-442 普拉卡尔普·斯里瓦斯塔瓦 , 玛丽亚·科齐法库 , 马修·辛克莱 , 拉凯什·科穆拉维利 , 维克拉姆·S·阿德 , 莎莉塔V.Adve :
海报:hVISC:异构并行系统的可移植抽象。 443-445 米兰·斯坦尼克 , 奥斯卡·帕洛玛 , 蒂莫西·海耶斯 , 伊万·拉特科维奇 , 奥斯曼·S·安萨尔 , 阿德里安·克里斯塔尔 , 马特奥·瓦莱罗 :
海报:基于In-order ARM内核的集成矢量标量设计。 447-448 宗太业 , 阿米特·萨本 , 普特·萨克德纳格尔 , 鲁道夫·艾根曼 , 蒂莫西·罗杰斯 :
海报:宝塔:在有限并行性的数据并行任务中最大化GPU利用率的运行时系统。 449-450
学生研究海报展示
沙特都柏林 :
学生研究海报:GPU中的松弛软件共享带宽管理。 451-452 罗曼·卡普兰 :
学生研究海报:从内存中的处理到存储中的处理。 453 亚瑟·基亚诺夫斯基 :
学生研究海报:未修改虚拟机的侧核网络控制器仿真。 454 维森特·塞尔法 , 朱利奥·萨胡基略 , 萨尔瓦多·佩蒂 , 玛丽亚·恩格拉西亚·戈麦斯 :
学生研究海报:解决系统公平性问题的低复杂性缓存共享机制。 455 孙佳文 :
学生研究海报:用于大规模图形处理的可扩展通用系统。 456 弗拉迪斯拉夫·塔塔科夫斯基 :
学生研究海报:将布尔电路编译成由光开关电路实现的非确定性分支程序。 457 Kim-Anh Tran先生 :
学生研究海报:有序体系结构的软件无序执行。 458