摘要
cilk运行时系统的代码。 https://github.com/mirrors/gcc/tree/cilkplus/libcilkrts。 谷歌学者 Intel Cilk Plus。 http://software.intel.com/en-us/articles/intel-cilk-plus/。 谷歌学者 Openmp文章。 http://intel.ly/9h7c7B。 谷歌学者 线程构建块参考手册,2011年。 http://threadingbuildingblocks.org/documentation.php。 谷歌学者 N.S.Arora、R.D.Blumofe和C.G.Plaxton。 多道程序多处理机的线程调度。 在1998年美国纽约州纽约市第十届ACM并行算法和体系结构研讨会论文集上,SPAA'98,第119-129页。 ACM公司。 谷歌学者 数字图书馆 S.Blagodurov、S.Zhuravlev、A.Fedorova和A.Kamali。 多核系统上的numa-aware争用管理案例。 《第19届并行体系结构和编译技术国际会议论文集》,PACT’10,第557-558页,美国纽约州纽约市,2010年。 ACM公司。 谷歌学者 数字图书馆 G.Blelloch、P.Gibbons、Y.Matias和G.Narlikar。 具有同步变量的并行性的空间效率调度。 第九届ACM并行算法和体系结构研讨会论文集,第12-23页,新港,RI,1997年6月。 谷歌学者 数字图书馆 R.D.Blumofe、C.F.Joerg、B.C.Kuszmaul、C.E.Leiserson、K.H.Randall和Y.Zhou。 Cilk:一个高效的多线程运行时系统。 SIGPLAN否。, 1995年8月30日207-216分。 谷歌学者 数字图书馆 M.M.Chakravarty、G.Keller、S.Lee、T.L.McDonell和V.Grover。 使用多核gpu加速haskell数组代码。 在关于多核编程的声明性方面的第六次研讨会论文集中,DAMP’11,第3-14页,美国纽约州纽约市,2011年。 ACM公司。 谷歌学者 数字图书馆 J.Chhugani、A.D.Nguyen、V.W.Lee、W.Macy、M.Hagog、Y.-K.Chen、A.Baransi、S.Kumar和P.Dubey。 在多核simd cpu体系结构上高效实现排序。 PVLDB,1(2):1313--13242008年。 谷歌学者 数字图书馆 K.克莱森。 穷人的并发单体。 J.功能。 程序。, 1999年5月9日313--323分。 谷歌学者 数字图书馆 D.多尔。 矢量算法包。 http://hackage.haskell.org/package/vector-algorithms。 矢量阵列的高效算法。 谷歌学者 M.Dybdal先生。 hopencl包。 http://hackage.haskell.org/package/hoopencl。 OpenCL的Haskell绑定。 谷歌学者 J.Epstein、A.P.Black和S.Peyton-Jones。 朝向云中的哈斯克尔。 2011年,美国纽约州纽约市,第四届ACM Haskell研讨会论文集,Haskell'11,第118-129页。 ACM公司。 谷歌学者 数字图书馆 M.Fluet、M.Rainey、J.Reppy、A.Shaw和Y.Xiao。 Manticore:一种异构并行语言。 《2007年多核编程声明性方面研讨会论文集》,DAMP'07,第37-44页,美国纽约州纽约市,2007年。 ACM公司。 谷歌学者 数字图书馆 C.T.Haynes、D.P.Friedman和M.Wand。 用continuation获取协同程序。 计算机语言,11(3.4):143--1531986。 谷歌学者 数字图书馆 C.Lauterback、Q.Mo和D.Manocha。 GPU上的工作分配方法。 北卡罗来纳大学技术报告TR009-16。 谷歌学者 D.李。 java fork/join框架。载于2000年美国纽约州纽约市2000年关于java Grande的ACM 2000会议记录,java’00,第36-43页。 ACM公司。 谷歌学者 数字图书馆 D.Leijen、W.Schulte和S.Burckhardt。 任务并行库的设计。 SIGPLAN否。, 2009年10月44:227-242。 谷歌学者 数字图书馆 P.Li、S.Marlow、S.Peyton Jones和A.Tolmach。 用于ghc的轻量级并发原语。 2007年,美国纽约州纽约市,2007年,《ACM SIGPLAN Haskell研讨会论文集》,Haskell'07,第107-118页。 ACM公司。 谷歌学者 数字图书馆 P.Li和S.Zdancewic。 结合事件和线程实现可伸缩的网络服务,并评估一元、应用程序级并发原语。 《2007年ACM SIGPLAN编程语言设计与实现会议论文集》,PLDI’07,第189-199页,美国纽约州纽约市,2007年。 ACM公司。 谷歌学者 数字图书馆 J.P.Magalháes、A.Dijkstra、J.Jeuring和A.Löh。 haskell的通用派生机制。 2010年,美国纽约州纽约市,第三届ACM Haskell Haskell'研讨会论文集,Haskell'10,第37-48页。 ACM公司。 谷歌学者 数字图书馆 P.Maier、P.Trinder和H.-W.Loidl。 在Haskell中实现高级分布式内存并行Haskell2011。 提交至IFL 2011。 谷歌学者 G.大陆和G.莫里塞特。 Nikola:在haskell中嵌入编译的gpu函数。 2010年,美国纽约州纽约市,第三届ACM Haskell Haskell'研讨会论文集,Haskell'10,第67-78页。 ACM公司。 谷歌学者 数字图书馆 S.马洛、R.牛顿和S.佩顿-琼斯。 确定性并行的单子。 2011年,美国纽约州纽约市,第四届ACM Haskell研讨会论文集,Haskell'11,第71-82页。 ACM公司。 谷歌学者 数字图书馆 S.马洛、S.佩顿-琼斯和S.辛格。 多核haskell的运行时支持。 第14届ACM SIGPLAN功能编程国际会议论文集,ICFP’09,第65-78页,美国纽约州纽约市,2009年。 ACM公司。 谷歌学者 数字图书馆 T·L·麦克唐纳。 库达。 http://hackage.haskell.org/package/cuda。 FFI绑定到CUDA接口以编程NVIDIA GPU。 谷歌学者 C.Newburn、B.So、Z.Liu、M.McCool、A.Ghuloum、S.Toit、Z.G.Wang、Z.H.Du、Y.Chen、G.Wu、P.Guo、Z.刘和D.Zhang。 英特尔的数组构建块:一种可重定向的动态编译器和嵌入式语言。 代码生成与优化(CGO),2011年4月第9届IEEE/ACM国际年会,第224--235页。 谷歌学者 数字图书馆 R.Newton、C.-P.Chen和S.Marlow。 针对Haskell的英特尔并发集合,2011年3月。 麻省理工学院CSAIL技术报告,MIT-CSAIL-TR-2011-015。 谷歌学者 B.O'Sullivan和J.Tibell。 用于ghc的可扩展i/o事件处理。 SIGPLAN否。, 45(11):103-1082010年9月。 谷歌学者 数字图书馆 H.Pan、B.Hindman和K.Asanović。 使用Lithe高效地编写并行软件。 SIGPLAN否。, 2010年6月,45:376-387。 谷歌学者 数字图书馆 J.莱因德斯。 英特尔线程构建块:为多核处理器并行性配备C++。 O'Reilly Media,2007年7月。 谷歌学者 数字图书馆 T.Rompf、I.Maier和M.Odersky。 通过类型定向的选择性cps变换实现一级多态定界延续。 SIGPLAN否。, 2009年8月44:317-328。 谷歌学者 数字图书馆 D.Spoonhower、G.E.Blelloch、P.B.Gibbons和R.Harper。 超越嵌套并行:对并行期货的工作密封开销有严格限制。 在第二十一届算法和架构并行性年度研讨会论文集中,SPAA'09,第91-100页,美国纽约州纽约市,2009年。 ACM公司。 谷歌学者 数字图书馆 D.Spoonhower、G.E.Blelloch、R.Harper和P.B.Gibbons。 并行功能程序的空间分析。 《第13届ACM SIGPLAN功能编程国际会议论文集》,ICFP'08,第253-264页,美国纽约州纽约市,2008年。 ACM公司。 谷歌学者 数字图书馆 J.Svensson、M.Sheeran和K.Claessen。 Obsidian:一种特定于领域的嵌入式语言,用于图形处理器的并行编程。 S.-B.Scholz和O.Chitil主编,《函数语言的实现和应用》,《计算机科学讲义》第5836卷,第156-173页。 施普林格-柏林/海德堡,2011年。 谷歌学者 数字图书馆 D.Syme、T.Petricek和D.Lomov。 f#异步编程模型。 《第13届声明性语言实用方面国际会议论文集》,PADL'11,第175-189页,柏林,海德堡,2011年。 斯普林格·弗拉格。 谷歌学者 数字图书馆
建议
DWS:多程序多核体系结构中的需求软件工作稳定 PMAM’14:多核和多核编程模型与应用程序 传统的工作密封调度器在多编程的多核体系结构中性能很差,因为所有程序都倾向于使用所有内核,因此会引发严重的内核争用。 为了缓解这一问题,本文提出了一种需求软件工作模式。。。 DWS:多程序多核体系结构中的需求软件工作稳定 PMAM’14:多核和多核编程模型与应用程序 传统的工作密封调度器在多编程的多核体系结构中性能很差,因为所有程序都倾向于使用所有内核,因此会引发严重的内核争用。 为了缓解这一问题,本文提出了一种需求感知工作。。。