×

兹马思-数学第一资源

一种在gpu上实现高性能图像分割的并行广义松弛方法。(英语) Zbl公司 1322.65071
摘要:现代计算生物学高通量筛选平台需要快速、可扩展的图像分割软件模块。实际上,精确分割是应用于基本软件管道的主要步骤之一,该软件管道旨在从大量图像中提取精确的测量值。图像分割通常是通过一个变分原理,其中的解决方案是一个适当的函数的最小值,例如在Ambrosio-Tortorelli模型的情况下。与上述模型相关的Euler-Lagrange方程组是一组耦合的椭圆型偏微分方程组,其有限差分离散可以用Jacobi或Gauss-Seidel等一阶交替极小化格式的广义松弛法有效地求解。在这项工作中,我们提出了一个基于并行稀疏基本线性代数子程序(PSBLAS)的并行图像分割软件模块,使用它的图形处理单元(GPU)扩展,允许我们以一种简单而透明的方式利用多核cpu和多核GPU的性能能力。我们讨论了在GPU和多核cpu上运行的分割模块在分析来自生物学实验的小鼠胚胎干细胞集落的二维灰度图像时的执行时间和速度。

理学硕士:
65K10型 数值优化与变分技术
65N22 偏微分方程边值问题离散方程的数值解法
6505年 并行数值计算
68T45型 机器视觉与场景理解
65-04年 与数值分析有关的问题的软件、源代码等
PDF格式 BibTeX公司 XML 引用
全文: 内政部
参考文献:
[1] 谢里夫,A。;坎格斯,J。;科埃略,L。P、 。;奎因,S。;墨菲,R。F、 高内容筛选与分析的自动图像分析,J。生物群系。屏幕,15726-734,(2010年)
[2] 奥伯特,G。;Kornprobst,P.,图像处理中的数学问题。偏微分方程与变分法(2006),美国纽约斯普林格-维拉格·Zbl公司 1110.35001
[3] Bar,L.,Mumford和Shah模型及其在图像分割和图像恢复中的应用(成像数学方法手册,第一卷,(2011)),1095-1157·Zbl公司 1259.94009
[4] Vitti,A.,Mumford-Shah图像分割的变分模型:理论、实现和使用概述,ISPRS J。摄影术。《遥感》,69,50-64,(2012年)
[5] 达姆布拉,P。;Tartaglione,G.,《用广义松弛法进行图像分割的ambrosio-tortorelli模型的求解》,Commun。非线性科学。数字。模拟,20819-831,(2015年)
[6] 菲利普斯。;Colajanni,M.,PSBLAS:稀疏矩阵上并行线性代数计算的库,ACM Trans。数学。软件,264527-550,(2000)·Zbl公司 1365.65128
[7] 菲利普斯。;Buttari,A.,Fortran 2003中稀疏矩阵计算的面向对象技术,ACM Trans。数学。软件,38,4,1-20,(2012)·Zbl公司 1365.65127
[8] 布塔里,A。;达姆布拉,P。;迪塞拉菲诺。;Filippone,S.,2LEV-D2P4:科学和工程应用的高性能预处理程序包,应用程序。代数工程。《计算机通讯》,18223-239,(2007年)·Zbl公司 1122.65046
[9] 达姆布拉,P。;迪塞拉菲诺。;Filippone,S.,MLD2P4:Fortran 95中的并行代数多级区域分解预处理程序包,ACM Trans。数学。软件,37,3,7-23,(2010)·Zbl公司 1364.65276
[10] 卡德利尼,V。;菲利普斯。;Rouson,D.,混合CPU/GPU平台上稀疏矩阵计算的设计模式,Sci。计划,22,1,1-19,(2014年)
[11] 安布罗西奥,L。;托托雷利,V。M、 用椭圆泛函通过\(\Gamma \)收敛逼近依赖跳跃的泛函,一般纯应用。数学,43999-1036,(1990)·Zbl公司 722.49020
[12] Braides,A.,(\Gamma\)—初学者的收敛(2002),牛津大学出版社,英国·Zbl公司 1198.49001
[13] 鲁格,J。;Stüben,K.,代数多重网格(McCormick,S。F、 ,多重网格方法,应用数学前沿,(1987),美国费城暹罗市,73-130
[14] Saad,Y.,稀疏线性系统的迭代方法,(2003),美国费城暹罗·Zbl公司 1002.65042
[15] 费用ó西托,R。R、 。;塔博达,G。五十、 。;拉莫斯,S。;托里ño、 J。;高性能云计算的gpu通用计算,Concurr。计算:实践。实验,25,12,1628-1642,(2013年)
[16] 贝尔,N。;Garland,M.,在面向吞吐量的处理器上实现稀疏矩阵向量乘法,(Proc。高性能计算、网络、存储和分析国际会议,SC'09,(2009),ACM纽约,纽约,美国),18:1-18:11
[17] 巴比里,D。;卡德利尼,V。;范法里洛,A。;Filippone,S.,GPGPU上稀疏矩阵的三种存储格式,技术代表DICII RR-15.6,(2015),Università di Roma Tor Vergata,art.torvergata.it(二月)
[18] F。á斯奎兹,G。奥尔特加,J.J.弗恩á恩德斯,E.M.加茨ón、 用gpu改进稀疏矩阵向量积的性能。第10届IEEE计算机与信息技术国际会议,CIT'10,2010,第1146-1151页。
[19] 巴比里,D。;卡德利尼,V。;范法里洛,A。;Filippone,S.,GPGPU上的稀疏矩阵向量乘法,ACM Trans。数学。软件(2015),提交出版·Zbl公司 1380.65079
[20] 格里姆斯,R。;金凯。;Young,D.,ITPACK 2.0用户指南,CNA-150,数值分析中心,(1979),德克萨斯大学
[21] NVIDIA公司,CUDA cuSPARSE图书馆,2014年。http://developer.nvidia.com/cusparse。
[22] C。格雷格,K。哈泽尔伍德,数据在哪里?为什么你不能在没有答案的情况下辩论CPU和GPU的性能,in:Proc。2011年IEEE国际研讨会。《系统和软件性能分析》,ISPASS,2011年,第134-144页。
[23] Parolution用户手册,技术代表,2015年,www.paralution.com网站
[24] 兰格,D。;Tvrd公司ìk、 P.,稀疏矩阵存储格式的评估标准,IEEE Trans。平行分布。系统(2015)
此参考列表基于出版商或数字数学图书馆提供的信息。它的项被试探性地匹配到zbMATH标识符,并且可能包含数据转换错误。它试图尽可能准确地反映原始论文中列出的参考文献,而不要求匹配的完整性或精确性。