瑞吉·苏达
人员信息
附属: 东京大学
优化列表
2020年–今天
2024 [公元9年] Takuto Mitsunobu公司 , 瑞吉·苏达 , 沃拉蓬·苏帕基特帕伊萨 :
少数非相同处理器上LPT调度的最坏情况分析。 信息处理。 莱特。 183 : 106424 ( 2024 ) 2023 [公元50年] 彭昌仁 , 瑞吉·苏达 , 沃拉蓬·苏帕基特帕伊萨 :
SIMD大整数的有效加法和Montgomery约简。 ARITH公司 2023 : 48-59 [i7] 彭昌仁 , 瑞吉·苏达 , 沃拉蓬·苏帕基特帕伊萨 :
SIMD大整数的有效加法和Montgomery约简。 CoRR公司 abs/2308.16432 ( 2023 ) 2022 [公元49年] 彭昌仁 , 瑞吉·苏达 , 沃拉蓬·苏帕基特帕伊萨 :
在矢量化ARM SVE处理器上实现基于异构密码的吞吐量优化。 坎达尔 2022 : 165-171 [i6] Takuto Mitsunobu公司 , 瑞吉·苏达 , 沃拉蓬·苏帕基特帕伊萨 :
少数非同类型处理器上LPT调度的最坏情况分析。 CoRR公司 abs/2203.02724 ( 2022 ) 2020 [j8] 小松和彦 , 阿尤穆·戈米 , 井川良介 , 高桥大辅 , 瑞吉·苏达 , Hiroyuki Takizawa公司 :
Xevolver:用于将系统意识与应用程序代码分离的代码转换框架。 同意。 计算。 实际。 支出。 32 ( 7 ) ( 2020 ) [公元48年] 埃米尔·瓦泰 , 乌萨夫·辛哈尔 , 瑞吉·苏达 :
钻石矩阵为内核提供能量。 亚洲高速计算会议 2020 : 102-113 [公元47年] 邱玉石 , 瑞吉·苏达 :
逐行重新连接:将重量位置与其值解耦。 NeurIPS公司 2020 [i5] 邱玉石 , 瑞吉·苏达 :
Permute to Train:训练深度神经网络的一个新维度。 CoRR公司 abs/2003.02570 ( 2020 )
2010 – 2019
2018 [j7] 王彤(Tong Wang) , 瑞吉·苏达 :
基于渐进样本投影的网格曲面泊松圆盘样本快速生成。 程序。 ACM计算。 图表。 互动。 技术。 1 ( 2 ) : 30:1-30:18 ( 2018 ) [公元46年] 王震(音) , 穆利亚·阿贡 , 井川良介 , 瑞吉·苏达 , Hiroyuki Takizawa公司 :
时间约束下机器学习模型的自动超参数调整。 IEEE大数据 2018 : 4967-4973 [公元45年] Osni Marques公司 , 瑞吉·苏达 , 雅库布·库扎克 , 藤井明弘 :
2018年iWAPT简介。 IPDPS研讨会 2018 : 1047 2017 [j6] 竹内由纪(Yuki Takeuchi) , 吉藏吉本 , 瑞吉·苏达 :
空间分数阶偏微分方程的二阶精度有限差分方法。 J.计算。 申请。 数学。 320 : 101-119 ( 2017 ) [公元44年] 王彤(Tong Wang) , 瑞吉·苏达 :
通过随机平铺实现快速最大泊松盘采样。 高性能图形 2017 : 16:1-16:10 [公元43年] 瑞吉·苏达 :
使用用户定义的源代码到源代码转换框架Xevolver生成嵌入的类DSL代码并优化贝叶斯估计例程。 坎达尔 2017 : 382-388 [公元42年] Osni Marques公司 , 瑞吉·苏达 :
iWAPT研讨会简介。 IPDPS研讨会 2017 : 1341 2016 [j5] 瑞吉·苏达 , Hiroyuki Takizawa公司 , 平泽昭一 :
Xevtgen:用于高性能科学代码的Fortran代码转换器生成器。 国际期刊网。 计算。 6 ( 2 ) : 263-289 ( 2016 ) [公元41年] 瑞吉·苏达 , Hiroyuki Takizawa公司 :
Xevdriver:在Fortran程序上支持基于XML的源代码到源代码转换的软件系统。 坎达尔 2016 : 522-528 [公元40年] 本田弘子 , 田田佳彦 , 瑞吉·苏达 :
Torus网络并行计算机上DAG结构优化搜索的高效并行算法。 ICA3PP公司 2016 : 483-502 2015 [公元39年] 瑞吉·苏达 , Hiroyuki Takizawa公司 , 平泽昭一 :
Xevtgen:用于高性能科学代码的Fortran代码转换器生成器。 坎达尔 2015 : 528-534 [公元38年] 熊谷由介(Yosuke Kumagai) , 藤井明弘 , 田中太郎 , Yusuke Hirota公司 , 富卡亚武士 , 今村俊彦(Toshiyuki Imamura) , 瑞吉·苏达 :
切比雪夫基共轭梯度法在K机上的性能分析。 PPAM(1) 2015 : 74-85 2014 [公元37年] 卡米尔·洛基 , 马丁·伯彻尔 , 瑞吉·苏达 :
加速器编程的未来:抽象、性能还是两者兼得? 囊 2014 : 886-895 2013 [公元36年] 瑞吉·苏达 , 罗成 , 片垣高弘 :
具有校正温度效应的功率和能耗在线自动调整的数学方法。 ICCS系统 2013 : 1302-1311 [公元35年] 卡米尔·洛基 , 马丁·伯彻尔 , 瑞吉·苏达 :
加速器编程的未来:抽象、性能还是两者兼得? ICPADS公司 2013 : 442-443 [公元34年] 卡米尔·洛基 , 瑞吉·苏达 :
高性能GPU加速TSP中的局部优化。 IPDPS研讨会 2013 : 1788-1796 [公元33年] 田晓晨 , 卡米尔·洛基 , 瑞吉·苏达 :
多核SIMD处理器上的寄存器级排序算法。 IA3@SC 2013 : 9:1-9:8 [公元32年] 程洛 , 瑞吉·苏达 :
一种有效的对称多GPU体系结构任务划分和调度方法。 信托公司/ISPA/IUCC 2013 : 1133-1142 [i4] 维维克·尼托尔 , 瑞吉·苏达 :
基于枚举的搜索算法,用于查找指定度和顶点数的最大可达周长的正则双部分图。 CoRR公司 abs/1302.5754 ( 2013 ) [i3] 维维克·尼托尔 , 瑞吉·苏达 :
三次正则双部图的围长分析。 CoRR公司 abs/1302.5755 ( 2013 ) 2012 【j4】 大其人 , 瑞吉·苏达 :
基于CUDA的SIMD计算GPU和多核处理单元能效全局优化模型。 计算。 科学。 资源开发。 27 ( 4 ) : 319-327 ( 2012 ) [公元31年] 卡米尔·洛基 , 瑞吉·苏达 :
在旅行推销员问题中使用GPU加速2-opt和3-opt本地搜索。 CCGRID公司 2012 : 705-706 [c30] 卡米尔·洛基 , 瑞吉·苏达 :
针对大型问题实例的多部分TSP求解器的高效GPU实现。 GECCO(同伴) 2012 : 1441-1442 [公元29年] 程洛 , 瑞吉·苏达 :
MSSM:一种基于任务划分的CUDA高效调度机制。 ICPADS公司 2012 : 548-555 [公元28年] 卡米尔·洛基 , 瑞吉·苏达 :
在旅行推销员问题中使用GPU加速2-opt和3-opt本地搜索。 高性能计算机系统 2012 : 489-495 [公元27年] 卡米尔·洛基 , 瑞吉·苏达 :
摘要:高性能GPU加速TSP求解器。 SC伴侣 2012 : 1411-1412 [公元26年] 卡米尔·洛基 , 瑞吉·苏达 :
海报:高性能GPU加速TSP求解器。 SC伴侣 2012 : 1413-1414 [公元25年] 卡米尔·洛基 , 瑞吉·苏达 :
简讯:GPU加速迭代本地搜索TSP解算器。 SPAA公司 2012 : 188-189 [公元24年] Ayumu Tomiyama公司 , 瑞吉·苏达 :
GPU编辑距离算法的参数自动优化。 VECPAR公司 2012 : 420-434 【r1】 大齐人 , 瑞吉·苏达 :
基于GPU和多核架构的能量感知SIMD算法设计。 能源意识和绿色计算手册 2012 : 427-442 [i2] 维维克·尼托尔 , 瑞吉·苏达 :
平衡Tanner单元及其特性。 CoRR公司 abs/1212.6882 ( 2012 ) [i1] 维维克·尼托尔 , 瑞吉·苏达 :
周长最大(m,r)BTU的分区参数。 CoRR公司 abs/1212.6883 ( 2012 ) 2011 【c23】 大其人 , 瑞吉·苏达 :
基于SIMD计算的CUDA处理元件功率效率的实验估计与分析。 ACIS-ICIS公司 2011 : 405-408 [公元22年] 卡米尔·洛基 , 瑞吉·苏达 :
并行蒙特卡罗树搜索可扩展性讨论。 澳大利亚人工智能会议 2011 : 452-461 [c21] 程洛 , 瑞吉·苏达 :
GPU的性能和能耗分析模型。 DASC公司 2011 : 658-665 [公元20年] 卡米尔·洛基 , 瑞吉·苏达 :
基于GPU的大规模并行蒙特卡罗树搜索。 IPDPS研讨会 2011 : 2034-2037 [第19条] 维维克·尼托尔 , 瑞吉·苏达 :
在超级计算机上并行化基于LDPC码的粗粒度图搜索问题。 帕雷莱克 2011 : 7-12 [第18条] 卡米尔·洛基 , 瑞吉·苏达 :
GPU上的并行蒙特卡罗树搜索。 SCAI公司 2011 : 80-89 [第17条] 中田武彦 , 瑞吉·苏达 :
APTC:从C到CUDA的自动并行转换器。 ICCS系统 2011 : 352-361 2010 [第16条] 大其人 , 瑞吉·苏达 :
基于CUDA的大规模SIMD计算中多核和GPU处理单元的功率效率研究。 绿色计算会议 2010 : 309-316 [第4页] 瑞吉·苏达 , 肯·内奥诺 , 寺西敬太 , 约翰·卡瓦佐斯 :
软件自动调整:概念和最新结果。 软件自动调整,从概念到最新结果 2010 : 3-15 [第3页] 尤塔·萨瓦 , 瑞吉·苏达 :
动态负载平衡BLAS中块大小参数的自动调整方法。 软件自动调整,从概念到最新结果 2010 : 33-48 [第2页] 塔米托·卡吉亚马 , 阿基拉·努卡达 , 瑞吉·苏达 , 长谷英彦 , 西田昭二 :
SILC矩阵计算框架中数值模拟的自动性能调整。 软件自动调整,从概念到最新结果 2010 : 175-192 [第1页] 瑞吉·苏达 :
在线自动调整的贝叶斯方法。 软件自动调整,从概念到最新结果 2010 : 275-293 [电子1] 肯·内奥诺 , 凯塔·泰拉尼西 , 约翰·卡瓦佐斯 , 瑞吉·苏达 :
软件自动调整,从概念到最新结果。 施普林格 2010 ,国际标准图书编号 978-1-4419-6934-7 [目录]
2000 – 2009
2009 [第15条] 瑞吉·苏达 , 青木Takayuki , 平泽昭一 , 阿基拉·努卡达 , Hiroki本田 , 松冈佐治 :
通用高性能计算的GPU方面。 ASP-DAC公司 2009 : 216-223 [第14条] 大其人 , 瑞吉·苏达 :
基于CUDA的多核和GPU平台上大矩阵乘法负载调度的节能性。 CSE(1) 2009 : 424-429 [第13条] 大其人 , 瑞吉·苏达 :
多核平台矩阵计算功耗建模与估计。 CSO(1) 2009 : 42-46 [第12条] 瑞吉·苏达 , 大其人 :
针对功耗优化的高性能CPU-GPU计算,对CUDA内核功耗进行精确测量和精确建模。 PDCAT公司 2009 : 432-438 [第11条] 大其人 , 瑞吉·苏达 :
基于CUDA的多核GPU平台上大矩阵乘法的功耗性能建模与优化。 PPAM(1) 2009 : 421-428 [c10] 卡米尔·洛基 , 瑞吉·苏达 :
GPU上的并行Minimax树搜索。 PPAM(1) 2009 : 449-456 2008 【c9】 瑞吉·苏达 :
改进渐近最优的可分割负荷调度。 集群 2008 : 262-267 【c8】 大其人 , 丹尼斯·吉安娜科普洛斯 , 瑞吉·苏达 :
一种优化的动态负载平衡方法,用于四面体有限元电磁学的并行三维网格细化。 集群 2008 : 430-436 2007 【c7】 阿基拉·努卡达 , 高桥大辅 , 瑞吉·苏达 , 西田昭二 :
SGI Altix 3700上的高性能FFT。 高性能混凝土 2007 : 396-407 【c6】 塔米托·卡吉亚马 , 阿基拉·努卡达 , 瑞吉·苏达 , 长谷英彦 , 西田昭二 :
SILC矩阵计算框架中的布料模拟:案例研究。 PPAM公司 2007 : 1086-1095 2006 【c5】 塔米托·卡吉亚马 , 阿基拉·努卡达 , 瑞吉·苏达 , 长谷英彦 , 西田昭二 :
分布式SILC:一个易于使用的基于MPI的并行矩阵计算库接口。 探测与辨认自动装置 2006 : 860-870 2005 【c4】 Hisashi Kotakemori先生 , 长谷英彦 , 塔米托·卡吉亚马 , 阿基拉·努卡达 , 瑞吉·苏达 , 西田昭二 :
SGI Altix3700上并行稀疏矩阵向量积的性能评估。 综合水管理计划 2005 : 153-163 【c3】 塔米托·卡吉亚马 , 阿基拉·努卡达 , 长谷英彦 , 瑞吉·苏达 , 西田昭二 :
SILC:矩阵计算库的灵活且与环境无关的接口。 PPAM公司 2005 : 928-935 2002 [j3] 瑞吉·苏达 , Masayasu Takami公司 :
一种快速球面谐波变换算法。 数学。 计算。 71 ( 238 ) : 703-715 ( 2002 )
1990 – 1999
1999 [注2] 瑞吉·苏达 , 西田昭二 , 小柳吉雄 :
Hessenberg双移位QR算法的一种高性能并行化方案。 并行计算。 25 ( 6 ) : 729-744 ( 1999 ) 1998 【c2】 瑞吉·苏达 , 小柳吉雄 :
大规模电路瞬态分析的嵌入LU分解方法。 ASP-DAC公司 1998 : 507-512 1995 【c1】 瑞吉·苏达 , 小柳吉雄 :
在分布式存储机器上用预处理Jacobi方法实现高度并行电路模拟器Sparta。 超级计算国际会议 1995 : 209-217 1994 [j1] 瑞吉·苏达 , 神川龙太郎 , Yasuo Wada公司 , 威利·希奥 , 细谷文美(Mutsumi Hosoya) , 后藤英一 :
QFP布线问题-介绍和分析注意事项。 IEEE传输。 计算。 辅助设计。 集成。 电路系统。 13 ( 1 ) : 48-56 ( 1994 )