2014年协议:加拿大阿联酋埃德蒙顿
何塞·纳尔逊·阿马拉尔 , 约塞普·托雷拉斯 :
2014年8月24日至27日,加拿大阿联酋埃德蒙顿第14届国际并行架构与编译会议。 ACM公司 2014 ,国际标准图书编号 978-1-4503-2809-8
主题演讲一
克拉拉·纳赫斯特特 :
移动物联网:挑战与机遇。 1-2
最佳论文
努诺·迪格尔 , 保罗·罗曼诺 , 路易斯·罗德里格斯 :
商品硬件事务内存的优点和局限性。 3-14 詹妮弗·萨托 , 维姆·海尔曼 , 斯蒂芬·M·布莱克本 , Lieven Eeckhout公司 , 凯瑟琳·麦金利 :
协同缓存清理。 15-26 哈什瓦尔丹 , 亚当·菲德尔 , 南希·M·阿马托 , 劳伦斯·劳什沃格 :
KLA:一种新的并行图计算算法范例。 27-38 乌代·邦杜古拉 , 维纳亚卡·班迪什蒂 , 阿尔伯特·柯恩 , 吉兰·波特隆 , 尼古拉·瓦西拉切 :
在周期域上划分和优化时间迭代计算。 39-50
第2A部分: 缓存层次结构(I)
程彩霞 , 维杰·纳加拉扬 :
ATCache:通过小型SRAM标记缓存减少DRAM缓存延迟。 51-60 张伦凯 , 德米特里·B·斯特鲁科夫 , 希巴塔拉·萨德尔丁 , 东瑞风机 , 张明哲 , 戴安娜·富兰克林 :
海绵目录:利用多级忆阻器的灵活稀疏目录。 61-74 高拉夫·查达 , 斯科特·马勒克 , 萨蒂什·纳拉亚纳萨米 :
EFetch:优化事件驱动Web应用程序的指令获取。 75-86 比斯瓦班丹大熊猫 , 香卡·巴拉昌德兰 :
XStream:基于跨核空间流的MLC预取器,用于CMP中的并行应用程序。 87-98
第2B1部分: 平行性研究
塞多米尔·塞古利亚 , 塔里克·S·阿卜杜勒拉赫曼 :
弱决定论的代价是什么? 99-112 Ehsan Fatehi公司 , 保罗·格拉茨 :
共享内存应用中的ILP和TLP:一项极限研究。 113-126
第2B2课时: 算法
Wookeun Jung公司 , Jongsoo公园 , 李政宰 :
多功能和可扩展的平行直方图结构。 127-138 罗伯特·D·卡梅隆 , 托马斯·谢尔默 , Arrvindh Shriraman公司 , 肯尼思·赫迪 , 丹·林 , 本杰明·赫尔 , 孟林 :
正则表达式匹配中的逐位数据并行。 139-150
第3A节: gpu(I)
拉希德·卡利姆 , 拉基肖尔·巴里克 , 塔蒂亚娜·施佩斯曼 , 布莱恩·刘易斯 , 胡春玲 , 凯沙夫·平加里 :
集成GPU的自适应异构调度。 151-162 詹姆斯·贾布林 , 托马斯·贾布林 , Onur Mutlu公司 , 赫利希 :
GPU的Warp-aware跟踪调度。 163-174 李新英 , 卡罗尔·让·吴 :
CAWS:GPGPU工作负载的关键感知扭曲调度。 175-186
第3B部分: 事务性存储器
伊琳娜·卡西乌 , 贾斯汀·戈奇利奇 , 塔蒂亚娜·施佩斯曼 , 吉尔斯·波卡姆 , 赫利希 :
Invyswell:用于haswell的受限事务内存的混合事务内存。 187-200 赵丽航(Lihang Zhao) , 杰弗里·德雷珀 :
针对硬件事务性内存的整合冲突检测。 201-212 考希克·拉维坎德兰 , 阿达·加夫里洛夫斯卡 , 桑托什·潘德 :
DeSTM:利用STM中的确定性进行应用程序开发。 213-224
第4A部分: 能源效率
徐秋明 , 穆拉利·阿纳瓦拉姆 :
PATS:GPGPU的模式感知调度和电源门控。 225-236 安德鲁·卢克法尔 , Shruti Padmanabha公司 , Reetuparna Das公司 , 罗纳德·德雷斯林斯基 , 托马斯·韦尼施 , 斯科特·马勒克 :
异构微体系结构胜过低功耗内核的电压缩放。 237-250 哈米德·雷扎·加西米 , 南宋金 :
RCS:电源约束多核处理器的运行时资源和核心扩展。 251-262
第4B部分: 运行时系统
肖恩·特里克勒 , 迈克尔·鲍尔 , 亚历克斯·艾肯 :
Realm:分布式内存体系结构的基于事件的低级运行时。 263-276 马蒂亚斯·迪纳 , 爱德华多·恩里克·莫利娜·达克鲁斯 , 菲利普·奥利维尔·亚历山大·纳沃 , Anselm Busse公司 , Hans-Ulrich Heiß :
kMAF:线程和数据关联的自动内核级管理。 277-288 基肖尔·库马尔·普苏库里 , 拉吉夫·古普塔 , Laxmi N.Bhuyan :
Shuffling:多核多处理器系统中支持锁争用的线程调度框架。 289-300
主题演讲二
鲍勃·布莱尼 :
分析创新的领域特定模型。 301-302
第5A1节: 编译器框架
杰森·安塞尔 , Shoaib Kamil公司 , Kalyan Veeramachaneni公司 , 乔纳森·拉根-凯利 , 杰弗里·博斯布姆 , 乌纳·梅·奥莱利 , 萨曼·阿马拉辛格 :
OpenTuner:用于程序自动调优的可扩展框架。 303-316 拉胡尔·加格 , 劳里·J·亨德伦 :
Velociraptor:针对CPU和GPU的数字程序的嵌入式编译器工具包。 317-330
第5A2部分: 行程安排
王浩(Hao Wang) , 里普达曼·辛格 , 迈克尔·舒尔特 , 南宋金 :
面向高吞吐量协同异构计算的内存调度。 331-342 Dragos Sbirlea公司 , 佐兰·布迪姆利奇 , 维维克·萨卡尔 :
动态任务图的有界内存调度。 343-356
第6A部分: 缓存层次结构(II)
魏丁 , 马赫穆特·坎德米尔 , 戴安娜·古特曼 , Adwait慢跑 , 契塔·R·达斯 , 普拉文·叶德拉帕利 :
以缓存命中率换取内存性能。 357-368 吉尔赫梅·皮科利 , 恩里克·纳扎雷·桑托斯 , 拉斐尔·埃纳尼·罗德里格斯 , 克里斯蒂安·波萨 , 埃德森·鲍林 , 费尔南多·马格诺·昆托·佩雷拉 :
编译器支持NUMA体系结构中的选择性页面迁移。 369-380 应业 , 理查德·韦斯特 , 卓群诚 , 叶莉 :
COLORIS:使用页面着色的动态缓存分区系统。 381-392
第6B部分: 性能工具和i/o
Arnamoy Bhattacharyya公司 , 托尔斯滕·霍夫勒 :
PEMOGEN:程序运行期间的自动自适应性能建模。 393-404 徐柳 , 分析师夏尔马 , 约翰·梅勒·克鲁米 :
ArrayTool:一个用于指导数组重组的轻量级分析器。 405-416 阿拉什·塔瓦库尔 , 穆罕默德·阿乔曼德 , 哈米德·萨巴齐·阿扎德 :
企业SSD中的可扩展性设计。 417-430
第7部分: gpus(二)
达武德·阿努什·贾姆希迪 , 梅赫扎德·萨马迪 , 斯科特·马勒克 :
天 2 MA:加速GPU的粗粒度数据传输。 431-442 李章亨 , 梅赫扎德·萨马迪 , 斯科特·马勒克 :
VAST:为GPU提供大内存空间的错觉。 443-454 阿尔贝托·马格尼 , 克里斯托夫·杜巴赫 , 迈克尔·F·P·奥博伊尔 :
图形处理器螺纹处理的自动优化。 455-466
海报展
哈维尔·卡贝萨斯 , 路易斯·维拉诺娃 , 艾萨克·盖拉多 , 托马斯·贾布林 , 纳乔·纳瓦罗 , 文美·W·Hwu :
跨多个GPU自动执行单GPU计算。 467-468 亚历山大·赫罗托斯·哈里塔斯 , 乔治奥斯·古马斯 , 尼科斯·阿纳斯托普洛斯 , 康斯坦蒂诺斯·尼卡斯 , Kornilios Kourtis公司 , Koziris油桃 :
LCA:CMP的内存链接和缓存软件联合调度方法。 469-470 西蒙·霍姆巴卡 , 塞巴斯蒂安·拉方德 , 约翰·利利乌斯 :
利用软件并行性的运行时电源管理器。 471-472 马格努斯·贾勒 :
芯片多处理器存储系统的基于图形的性能计算。 473-474 斯内哈西什·库马尔 , Arrvindh Shriraman公司 , 维贾亚拉克什米·斯里尼瓦桑 , 丹·林 , 乔登·菲利普斯 :
SQRL:用于收集软件数据结构的硬件加速器。 475-476 罗玉龙 , 谭光明 :
通过计算局部性优化模具代码。 477-478 Deepak Majeti公司 , 库尔德普·S·梅尔 , 拉基肖尔·巴里克 , 维维克·萨卡尔 :
ADHA:异构体系结构的自动数据布局框架。 479-480 威廉·F·奥吉尔维 , 帕夫洛斯·佩托梅诺斯 , 王征 , 休皮革 :
主动学习加速了并行程序映射的自动启发式构造。 481-482 Sreepathi Pai公司 , R.戈文达拉扬 , 马修·塔朱塔维提尔 :
基于并行GPGPU内核在线结构运行时预测的抢占式线程块调度。 483-484 香潘 , 拉杜·特奥多雷斯库 :
使用STT-RAM实现节能的近阈值芯片多处理器。 485-486 拉杰·帕里哈尔 , 雅各布·布洛克 , 陈丁 , 迈克尔·C·黄 :
通过定量配给保护和利用共享缓存。 487-488 普什卡尔·拉特纳利卡尔 , Arun Chauhan公司 :
通过高级数组语言中的宏数据流实现自动并行。 489-490 苏达珊·斯里尼瓦桑 , 黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹黑腹 , 以色列可兰经 , 兰斯·罗德里格斯 , 山迪普·昆都 :
一种运行时支持机制,用于快速切换自变形内核的模式,以提高功率效率。 491-492 Bradley Thwaites公司 , Gennady Pekhimenko先生 , 哈迪·埃斯迈伊尔扎德 , 阿米尔·亚兹丹巴赫(Amir Yazdanbakhsh) , Onur Mutlu公司 , Jongse公园 , 吉里什·穆鲁鲁 , 托德·莫瑞 :
使用近似负载进行无回滚值预测。 493-494 埃里克·托木斯克 , 克里斯托夫·杜巴赫 , 迈克尔·F·P·奥博伊尔 :
测量单个ISA异构处理器的灵活性。 495-496 吴波 , 陈国阳 , 董丽(Dong Li) , 沈喜鹏 , 杰弗里·维特 :
以SM为中心的转换:规避硬件限制,实现灵活的GPU调度。 497-498
海报板
塞尔盖·马卡洛夫 , 安吉拉·登克·布朗 , 阿什文·戈尔 :
用于动态二进制翻译框架的基于事件的语言。 499-500 李鹏 , 杰里米·布勒 :
通过过滤和控制消息提高流应用程序的性能。 501-502 杰瓦·鲍代尔 , 何塞·纳尔逊·阿马拉尔 :
分层采样以实现均匀的工作负载分区。 503-504 特贾斯维·阿加瓦尔 , 米歇拉·贝基 :
为CPU-GPU集群设计一个混合MPI-CUDA基准测试套件。 505-506 Sudharsan Jagathrakshakan公司 , 文卡塔·卡利安·塔夫娃 , 马杜·穆提亚姆 :
DRAM内存系统中节能突发数据重映射。 507-508 亚历山大·伊萨德 :
使用参数化平铺大小进行流水线平铺的数据重用优化。 509-510 亚当·菲德尔 , 南希·M·阿马托 , 劳伦斯·劳什沃格 :
从petascale到pocket:为移动SoC自适应扩展并行程序。 511-512 亚历山德罗·范法利洛 , 托比亚斯·伯纳斯 , 瓦莱丽亚·卡德利尼 , Salvatore Filippone公司 , 丹·纳格尔 , 达米安·W·I·鲁森 :
GNU Fortran中的coarray。 513-514 托马斯·R·W·斯科格兰 , 吴春峰 :
OpenMP中多目标工作共享的本地感知内存关联。 515-516 哈什瓦尔丹 , 南希·M·阿马托 , 劳伦斯·劳什沃格 :
在内存受限的系统上处理大数据图。 517-518
![](https://dblp.uni-trier.de/img/cog.dark.24x24.png)