摘要
1 A.J.C.Bik、M.Girkar、P.M.Grey和X.Tian,“英特尔®;体系结构的自动寄存器内矢量化”,《国际并行编程》,第30卷,第2期,第65-98页,2002年4月。 谷歌学者 数字图书馆 2 S.Larsen和S.Amarasinghe,“利用多媒体指令集的超字级并行性”,Proc。 编程语言设计与实现会议,第145-156页,2000年6月。 谷歌学者 数字图书馆 三 R.Leupers,《嵌入式处理器的代码优化技术》,Kluwer学术出版社,2000年。 谷歌学者 数字图书馆 4 A.E.Eichenberger、P.Wu和K.O'Brien,“带对齐约束的SIMD架构的矢量化”,Proc。 ACM SIGPLAN 2004年编程语言设计与实现会议,第82–93页,2004年6月。 谷歌学者 数字图书馆 5 P.Wu、A.E.Eichenberger和A.Wang,“针对运行时对齐和长度转换的高效SIMD代码生成”,CGO’05:Proc。 代码生成和优化国际研讨会,第153-164页,美国华盛顿特区,2005年。 谷歌学者 数字图书馆 6 P.Wu、A.E.Eichenberger、A.Wang和P.Zhao,“使用虚拟向量的集成模拟框架”,ICS'05:Proc。 第19届超级计算国际年会,第169-178页,美国纽约州纽约市,ACM出版社,2005年。 谷歌学者 数字图书馆 7 A.Kudriavtsev和P.Kogge,“SIMD处理器排列的生成”,Proc。 2005年ACM SIGPLAN/SIGBED嵌入式系统语言、编译器和工具会议,第147-156页,2005年6月。 谷歌学者 数字图书馆 8 D.Nuzman、I.Rosen和A.Zaks,“simd交错数据的自动矢量化”,PLDI'06:Proc。 2006年ACM SIGPLAN编程语言设计与实现会议,第132-143页,美国纽约州纽约市,2006年。 谷歌学者 数字图书馆 9 S.Larsen、R.M.Rabbah和S.P.Amarasinghe,“利用软件流水线循环中的向量并行性”,Proc。 第38届IEEE/ACM国际微体系结构年会,第119-1292005页。 谷歌学者 数字图书馆 10 A.V.Aho、M.Ganapathi和S.W.K.Tjiang,“使用树匹配和动态编程生成代码”,ACM Trans。 程序。 语言系统。, 第11卷,第4期,第491-516页,1989年10月。 谷歌学者 数字图书馆 11 A.Srinivasan、T.Kam、S.Malik和R.K.Brayton,“离散函数操作的算法”,Proc。 IEEE国际计算机辅助设计会议,第92–95页,1990年11月。 谷歌学者 交叉引用 12 T.Miyamori、J.Tanabe、Y.Taniguchi、K.Furukawa、T.Kozakaya、H.Nakai、Y.Miyamoto、K.Maeda和M.Matsui,“基于可配置处理器的图像识别处理器的开发”,J.Robotics and Mechatronics,第17卷,第4期,第437-446页,2005年。 谷歌学者 交叉引用 13 V.Zivojnovic、J.Martinez、C.Schlger和H.Meyr,“DSPstone:面向DSP的基准测试方法”,信号处理应用与技术国际会议,第715-720页,1994年10月。 谷歌学者 14 D.M.Miller和R.Drechsler,“实现多值决策图包”,多值逻辑国际研讨会,第52–57页,1998年5月。 谷歌学者 数字图书馆
建议
使用多值决策图生成媒体p的打包指令 CODES+ISSS'06:第四届硬件/软件代码设计与系统综合国际会议论文集 SIMD指令通常在现代多媒体处理器中实现。 尽管SIMD指令对许多数字信号处理应用程序很有用,但大多数编译器并不利用SIMD指令。 使用中的困难。。。 用通用处理器和浮点SIMD指令开发几何处理中的并行性 三维(3D)图形应用程序已经成为当今计算机系统上运行的非常重要的工作负载。 一个经济高效的图形解决方案是在主机CPU上执行3D图形的几何处理,并具有专用硬件。。。 同时多线程处理器上推测指令执行的评估 现代超标量处理器的性能严重依赖于推测执行。 例如,我们的测量表明,在一个6问题的超标量上,针对SPECINT95的93%的提交指令是推测性的。 没有推测,处理器资源。。。