第22届ICS 2008:希腊科斯岛
Pin Zhou公司 :
2008年6月7日至12日,希腊科斯岛,ICS 2008,第22届超级计算国际年会会议记录。 ACM公司 2008 ,国际标准图书编号 978-1-60558-158-3 马克·哈里斯 :
NVIDIA CUDA多核GPU计算。 1 蒂拉克·阿格瓦拉 :
exascale计算道路上的挑战。 2 大卫·E·凯斯 :
Petaflop/s,说真的。 三
算法与应用1
哈立德·易卜拉欣 , 弗朗索瓦·博丹 :
在蜂窝宽带引擎上实施Wilson-Dirac运营商。 4-14 蒂莫西·D·R·哈特利 , U mit V.Joatalyürek公司 , 安东尼奥·鲁伊斯 , 弗朗西斯科·伊古尔 , 拉斐尔·梅奥 , 曼纽尔·乌贾尔登 :
基于GPU和多核协同集群的生物医学图像分析。 15-25 格雷戈里·布埃勒 , 斯里尼瓦桑Parthasarathy , 马修·戈德 :
蜂窝宽带引擎上的数据挖掘。 26-35
绩效评估1
乔纳森·温伯格 , 艾伦·斯内维利 :
HPC应用程序的准确内存签名和合成地址跟踪。 36-45 Prasun Ratn公司 , 弗兰克·穆勒 , 布朗尼斯·德苏宾斯基 , 马丁·舒尔茨 :
在大规模通信跟踪中保留时间。 46-55
架构1
米歇尔·维克多 , 阿里斯·西尔扎斯 , 爱德华·S·戴维森 :
多核处理器的自由空间交叉杆。 56-62 宋柳 , 塞达·奥格伦西·梅米克 , 张宇 , 戈坎·梅米克 :
一种自适应DRAM温度和电源管理方法。 63-72 杰弗里·布朗 , 院长M.Tullsen :
共享线程多处理器。 73-82
通信与同步1
卡西姆·阿里 , Vijay S.Pai公司 , 塞缪尔·米奇夫 :
阿斯彭高级集体沟通。 83-93 萨米尔·库马尔 , 戈博尔·多萨 , 盖奥盖·阿尔马西 , 菲利普·海德伯格 , 董晨 , 马克·詹帕帕 , 迈克尔·布洛克森 , 艾哈迈德·法拉杰 , 杰夫·帕克 , 拉特曼 , 布莱恩·史密斯 , 查尔斯·阿彻 :
深度计算消息传递框架:在蓝色基因/P超级计算机上传递通用可伸缩消息。 94-103 布莱恩·怀特 , 萨利·麦基 , 丹尼尔·昆兰 :
基于投影的抽象优化框架,应用于非结构化网格领域。 104-113
文件系统
薛瑞妮 , 陈文光 , 郑伟民 :
CprFS:一个用户级文件系统,支持检查点和重启的一致文件状态。 114-123 亨利·蒙蒂 , 阿里·拉扎·布特 , 苏达尔珊·瓦日库代 :
在HPC中心及时卸载结果数据。 124-133 朱慧君 , 彭古 , 王军 :
移位去簇:一种用于多路复制存储体系结构的放置-处理布局方案。 134-144
容错性
马修·库普 , 拉胡尔·库马尔 , Dhabaleswar K.熊猫 :
在高性能互连上,软件可靠性是否优于硬件可靠性 infiniband上MPI的案例研究。 145-154 格雷格·布罗尼夫茨基 , 布朗尼斯·德苏宾斯基 :
迭代线性代数方法的软错误漏洞。 155-164
操作系统
埃迪·什穆埃利 , 乔治·阿尔马西 , 若泽·布伦赫罗托 , 何塞·卡斯塔尼奥斯 , 戈博尔·多萨 , 萨米尔·库马尔 , 德里克·利伯 :
评估用linux替换CNK对blue基因/l计算节点的影响。 165-174 阿克沙特·维尔马 , 普尼特·阿胡加 , 安妮迪亚·尼奥吉 :
HPC应用程序的Power-aware动态放置。 175-184 Hyung Won Choi先生 , Hukeun Kwak公司 , 安德鲁·桑 , Kyusik Chung公司 :
自主学习,有效利用动态虚拟机迁移的资源。 185-194
算法与应用2
李赛永(Seyong Lee) , 鲁道夫·艾根曼 :
分布式存储系统上并行稀疏矩阵向量乘法的自适应运行时调整。 195-204 尤里·多森科 , Naga K.Govindaraju公司 , 彼得·派克·J·斯隆 , 查尔斯·博伊德 , 约翰·曼弗德利 :
图形处理器上的快速扫描算法。 205-213 安德烈·切尔尼科夫 , Nikos Chrisochoides公司 :
多核处理器的三维delaunay优化。 214-224
代码性能调整
穆图·曼尼坎丹·巴斯卡兰 , 乌代·邦杜古拉 , 斯里拉姆·克里希纳莫奥斯蒂 , J.拉马努贾姆 , 阿塔纳斯·鲁恩特夫 , P.萨达亚潘 :
用于优化gpgpu仿射循环嵌套的编译器框架。 225-234 Suhyun Kim公司 , Soo-Book月亮 :
具有多个旋转分支的旋转寄存器分配。 235-244 易信寿 , 罗伯特·范·恩格伦 :
复发链的自动SIMD矢量化。 245-255
通信与同步2
Seung-Jai Min先生 , 鲁道夫·艾根曼 :
为集群优化不规则共享内存应用程序。 256-265 科斯汀·伊恩库 , 魏晨 , 凯瑟琳·耶利克 :
包含通信操作的循环的性能可移植优化。 266-276 Jun Shirako先生 , 大卫·M·佩克索托 , 维维克·萨卡尔 , 威廉·谢勒三世 :
相位器:用于集体和点对点同步的统一无死锁结构。 277-288
内存管理
童晨 , 林海波 , 张涛(Tao Zhang) :
协调cell/B.E.处理器的数据传输。 289-298 艾萨克·盖拉多 , 约翰·凯尔姆 , 谢恩·瑞欧 , 史蒂文·卢梅塔 , 纳乔·纳瓦罗 , 文美·W·Hwu :
CUBA:高效CPU/协处理器数据通信的体系结构。 299-308 马克·西尔伯斯坦 , 阿萨夫·舒斯特 , 丹·盖革 , 安朱尔·帕特尼 , 约翰·欧文斯 :
通过软件管理的缓存在GPU上高效计算和积。 309-318
架构2
方璐 , 王磊(Lei Wang) , 冯小兵 , 李志远 , 张肇庆 :
利用空闲寄存器类实现快速溢出目标。 319-326 威廉·劳埃德·伯彻 , 莉兹·K·约翰 :
多核处理器上的动态电源管理分析。 327-338 R.马尼坎坦 , R.戈文达拉扬 :
聚焦预取:基于提交暂停的面向性能的预取。 339-348
绩效评估2
马克·卡萨斯 , 罗莎·M·巴迪亚 , 杰苏斯·拉巴特 :
MPI应用程序加速的自动分析。 349-358 刘丽霞 , 李志远 , 艾哈迈德·萨米赫 :
分析多核并行程序中的内存访问强度。 359-367 布拉德利·J·巴恩斯 , 巴里·朗特里 , 大卫·K·洛文塔尔 , 杰克斯·里夫斯 , 布朗尼斯·德苏宾斯基 , 马丁·舒尔茨 :
基于回归的可伸缩性预测方法。 368-377