SC 2010:美国洛杉矶新奥尔良
高性能计算网络、存储和分析会议,2010年11月13日至19日,美国洛杉矶新奥尔良,SC 2010。 电气与电子工程师协会 2010 ,国际标准图书编号 978-1-4244-7559-9 滨田聪(Tsuyoshi Hamada) , Keigo Nitadori公司 :
190 TFlops GPU集群上的天体物理N体模拟。 1-9 卡斯滕·伯斯特德 , 奥马尔·加塔斯 , 迈克尔·格尼斯 , 托宾·艾萨克 , 乔治·斯塔德勒 , 蒂姆·沃伯顿 , 卢卡斯·威尔科克斯 :
极端规模AMR。 1-12 崔一峰 , 金·奥尔森 , 托马斯·乔丹 , Kwangyoon Lee(李光耀) , 周军(音) , 帕特里克·斯莫尔 , 丹尼尔·罗滕 , 杰弗里·伊利 , Dhabaleswar K.熊猫 , Amit Chourasia公司 , 约翰·列夫斯克 , 史蒂文·M·戴 , 菲利普·梅奇林 :
Petascale超级计算机上的可伸缩地震模拟。 1-20 阿曼达·彼得斯·兰德斯 , 西蒙·麦基昂纳 , Efthimios Kaxiras公司 , 乔纳斯·莱特 , 乔伊·K·西卡 , 马西莫·贝纳斯基 , 毛罗·比森 , 索罗·苏奇 :
在IBM Bluegene/P:红细胞分辨率下的全心循环系统上对心血管流量进行多尺度模拟。 1-10 阿布汀·拉希米安 , 伊利亚·拉舒克 , Shravan K.韦拉帕尼 , 阿帕尔娜·钱德拉莫利什瓦兰 , Dhairya Malhotra公司 , 洛根月亮 , 拉胡尔·桑帕斯 , Aashay Shringarpure公司 , 杰弗里·维特 , 理查德·瓦杜克 , 丹尼斯·佐林 , 比洛斯 :
200K岩心和非均质结构上血流的Petascale直接数值模拟。 1-11 安东·科热夫尼科夫 , 阿道夫·埃奎卢斯 , 托马斯·舒尔赫斯 :
纳米与材料科学中激发态和强关联的第一原理电子结构模拟。 1-10 宋凤光 , Hatem Ltaief公司 , 比勒尔·哈德里 , 杰克·J·东加拉 :
可伸缩瓷砖通信——避免多核集群系统上的QR分解。 1-11 拉胡尔·桑帕斯 , 哈里·桑达尔 , Shravan K.Veerapaneni公司 :
并行快速高斯变换。 1-10 Jun Doi公司 , 根岸安史 :
环面连接大规模并行超级计算机的全对全通信和FFT算法的重叠方法。 1-9 韩戎·金 , Seulki Heo先生 , Junghoon Lee(李俊勋) , Jaehyuk Huh先生 , 约翰·金 :
芯片上网络评估框架。 10 吉尔伯特·亨德利 , 埃里克·罗宾逊 , 维塔利·格雷泽 , Johnnie Chan公司 , 卢卡·卡洛尼 , 纳迪亚·特拉维宁·布利斯 , 凯伦·伯格曼 :
用于高性能嵌入式计算的光子互连网络中的电路交换存储器访问。 1-12 阿西特·米什拉 , Shekhar Srikantaiah公司 , 马赫穆特·坎德米尔 , 契塔·R·达斯 :
CMP中的CPM:芯片多处理器中的协调电源管理。 1-12 阿基拉·胡索伊 , Takumi Washio先生 , 冈田俊一 , 吉马萨·卡杜卡 , 中岛研吾 , 久田俊彦 :
大规模并行计算机上的多尺度心脏模拟。 1-11 安东尼·D·阮 , 纳达图尔·萨蒂什 , 贾廷·丘加尼 , Changkyu Kim(金昌奎) , 普拉迪普·杜比 :
用于现代CPU和GPU上的模具计算的3.5-D块优化。 1-13 Takashi Shimokawabe公司 , 青木Takayuki , Chiashi Muroi先生 , 石田纯一 , Kohei Kawano公司 , 东藤俊雄 , 阿基拉·努卡达 , Naoya Maruyama先生 , 松冈佐治 :
80倍加速,15.0 TFlops全GPU加速非静力天气模型ASUCA生产代码。 1-11 阿德里安·考菲尔德 , 乔尔·科本 , 托多尔·莫洛夫 , Arup De公司 , 阿梅恩·阿克尔 , 何家华 , 阿伦·贾加瑟森 , 拉杰什·古普塔 , 艾伦·斯内维利 , 史蒂文·斯旺森 :
了解新兴非易失性存储器对高性能、IO-集成计算的影响。 1-11 何家华 , Arun Jagatheesan公司 , 桑迪普·K·S·古普塔 , 杰弗里·贝内特 , 艾伦·斯内维利 :
DASH:基于Flash的数据密集型超级计算机的配方。 1-11 香玉洞 , 袁燮 , 纳文·穆拉利马诺哈 , 诺曼·乔比 :
简单而有效的异构主存储器,支持片上内存控制器。 1-11 罗恩·德罗 , J.P.格罗斯曼 , 肯尼思·麦肯齐 , 布莱恩·托尔斯 , 周爱德蒙德(Edmond Chow) , 约翰·萨尔蒙 , 克利夫·杨 , 约瑟夫·A·班克 , 布兰诺·巴森 , 马丁·丹罗夫(Martin M.Deneroff) , 杰弗里·库斯金 , 理查德·拉森 , 马克·莫莱斯 , 大卫·E·肖 :
在Anton上利用162纳秒的端到端通信延迟。 1-12 阿达兰·坎加罗 , 萨汉游戏 , Ramana Rao Kompella公司 , 徐东燕 :
vSnoop:通过确认卸载提高虚拟化环境中的TCP吞吐量。 1-11 穆罕默德·巴尔曼 , Evangelos Chaniotakis公司 , 阿里·肖沙尼 , 亚历克斯·西姆 :
一种用于高级网络配置的灵活预留算法。 1-11 亚当·穆迪 , 格雷格·布罗尼夫茨基 , 凯瑟琳·莫罗 , 布朗尼斯·德苏宾斯基 :
可扩展多级检查点系统的设计、建模和评估。 1-11 马克·詹帕帕 , 托马斯·古丁 , 托德·英格利特 , 罗伯特·维斯涅夫斯基 :
轻量级超级计算机内核的使用经验:从Blue Gene的CNK中吸取的教训。 1-10 托尔斯滕·霍夫勒 , 蒂莫·施奈德 , 安德鲁·卢姆斯代恩 :
通过仿真表征系统噪声对大规模应用的影响。 1-11 郭敬聪 , 乔治·阿尔马西 , 维杰·萨拉斯瓦特 :
分布式图形算法的快速PGAS实现。 1-11 罗杰·皮尔斯 , 玛雅·B.戈哈勒 , 南希·M·阿马托 :
内存和半外部内存的多线程异步图形遍历。 1-11 维拉·阿加瓦尔 , 法布里奇奥·佩里尼 , 戴维德·帕塞托 , 大卫·A·巴德 :
多核处理器上的可缩放图形探索。 1-11 Jae-Seung Yeom先生 , 迪米特里奥斯·尼科洛普洛斯 :
Strider:在具有显式管理内存的多核上优化Strided数据访问的运行时支持。 1-11 路易斯·诺埃尔·普切特 , 乌代·邦杜古拉 , 塞德里克·巴斯托尔 , 阿尔伯特·柯恩 , J.拉马努贾姆 , P.萨达亚潘 :
在自动并行框架中结合迭代和模型驱动优化。 1-11 普雷蒂·马拉卡尔 , 维杰·纳塔拉扬 , 萨蒂什·瓦迪亚尔 :
资源受限环境中关键气候应用的自适应模拟和在线远程可视化框架。 1-11 李赛永(Seyong Lee) , 鲁道夫·艾根曼 :
OpenMPC:针对GPU的扩展OpenMP编程和调整。 1-11 蒂莫西·马特森 , 迈克尔·里彭 , 托马斯·莱尼格 , 保罗·西布莱特 , 哈斯 , 帕特里克·肯尼迪 , 杰森·霍华德 , 斯里拉姆·万加尔 , 尼丁·博卡尔 , 格雷戈里·鲁尔 , Saurabh Dighe公司 :
48核SCC处理器:程序员的观点。 1-11 贝弗利·A·桑德斯 , 罗德尼·J·巴特利特 , 埃里克·戴蒙斯 , 维克托·洛特里奇 , 马克·蓬顿 :
超大数组张量代数的面向块语言和运行时系统。 1-11 文卡特拉姆·维什瓦纳 , 马克·赫雷尔德 , 卡米尔·伊斯克拉 , Dries Kimpe公司 , 维塔利A.莫罗佐夫 , 迈克尔·帕普卡 , 罗伯特·B·罗斯 , 吉井和通 :
加快IBM Blue Gene/P系统中的I/O转发。 1-10 杰伊·洛夫斯特德 , 方正 , 刘青(音) , 斯科特·克拉斯基 , 罗恩·奥尔德菲尔德 , 托德·科登布罗克 , 卡斯滕·施万 , 马修·沃尔夫 :
管理Petascale存储系统IO性能的可变性。 1-12 张雪晨 , 基·戴维斯 , 宋江 :
IOrchestrator:通过服务器间协调提高多节点I/O系统的性能。 1-11 Anh Vo公司 , 斯里拉姆·阿南塔克利什南 , 加内什·戈帕拉克里什南 , 布朗尼斯·德苏宾斯基 , 马丁·舒尔茨 , 格雷格·布罗尼夫茨基 :
MPI程序的可扩展分布式动态形式验证程序。 1-10 陈哲哲 , 齐高 , 张文斌 , 冯琴 :
FlowChecker:通过消息流检查检测MPI库中的Bug。 1-11 内森·塔伦特 , 拉克索诺·阿迪安托 , 约翰·梅勒·克鲁米 :
使用调用路径配置文件可扩展地识别并行执行中的负载不平衡。 1-11 王晓丹 , 埃里克·帕尔曼 , Randal C.Burns公司 , 塔努·马利克 , 塔马斯·布达瓦里 , 查尔斯·梅内沃 , 亚历山大·萨莱 :
JAWS:湍流模拟探索的工作感知工作负载调度。 1-11 托瓦尔德·纳特维格 , 安妮·埃尔斯特 , 简·克里斯蒂安·迈耶 :
自动运行时并行化和I/O转换。 1-10 李敏(音) , 苏达尔珊·瓦日库代 , 阿里·拉扎·布特 , 费蒙 , 马晓松 , Youngjae Kim(金永嘉) , 克里斯蒂安·恩格曼 , 盖伦·M·希普曼 :
功能分区以优化多核架构上的端到端性能。 1-12 阿帕尔娜·钱德拉莫利什瓦兰 , 卡梅什·马杜里 , 理查德·瓦杜克 :
多核性能的诊断、调整和重新设计:快速多极方法的案例研究。 1-12 盖伊·布莱洛赫 , Ioannis Koutis公司 , 加里·米勒 , 卡纳特·唐王山 :
分层对角线分块和精度降低在组合多重网格中的应用。 1-12 穆罕默德·乔卡尔 , 劳尔·德拉克鲁斯 , 何塞·马里亚·塞拉 :
探索Cell/B.E.架构上有限元代码的新收集方法。 1-11 Pritish Jetley公司 , 卢卡斯·韦索洛夫斯基 , 菲利波·乔阿钦 , 拉克西坎特·V·卡莱 , 托马斯·奎因 :
GPU集群上的缩放层次化N体仿真。 1-11 阿卜杜拉·加拉贝赫 , 马泰·里佩努 :
尺寸问题:空间/时间权衡,以提高GPGPU应用程序的性能。 1-12 斯科特·汉普顿 , 萨达夫·R·阿拉姆 , 保罗·克罗齐 , 普拉图尔·阿加瓦尔 :
生物分子模拟中异质资源的优化利用。 1-11 大卫·邱 , 阿佩克莎·谢蒂 , 加甘·阿格拉瓦尔 :
用于加速面向服务计算的弹性云缓存。 1-11 吉迪恩·尤文 , 埃瓦·迪尔曼 , 卡兰·瓦希 , 高朗·梅塔 , G.布鲁斯·贝里曼 , 本杰明·伯曼 , 菲利普·梅奇林 :
Amazon EC2上科学工作流的数据共享选项。 1-9 钱朱 , 朱杰丹 , 加甘·阿格拉瓦尔 :
虚拟化环境中科学工作流的Power-Aware整合。 1-12 罗纳德·巴比奇 , 迈克尔·克拉克 , 巴林特·乔奥 :
格点量子色动力学中多-GPU计算的QUDA库的并行化。 1-11 马修·路易斯尔 :
在高达95k核的纳米电子器件中并行实现电子-声子散射。 1-11 扬·戈茨 , 克劳斯·伊格伯格 , 马库斯·施蒂尔默 , 乌尔里希·吕德 :
294912处理器芯上颗粒流的直接数值模拟。 1-11 大卫·塔尔扬 , 凯文·斯卡德隆 :
共享跟踪器:利用缓存一致性硬件的思想减少非一致缓存的片外内存流量。 1-10 安德烈亚斯·桑德伯格 , 大卫·埃克洛夫 , 埃里克·哈格斯滕 :
通过检测和消除非临时内存访问来减少缓存污染。 1-11 马丁·伯彻尔 , Byoung-Do Kim先生 , 杰弗里·戴蒙德 , 约翰·麦卡宾 , 拉尔斯·科斯特克 , 詹姆斯·布朗 :
PerfExpert:用于HPC应用程序的易于使用的性能诊断工具。 1-11
![](https://dblp.uni-trier.de/img/cog.dark.24x24.png)