{“状态”:“好”,“消息类型”:“工作”,“消息版本”:“1.0.0”,“消息”:{“索引”:{“日期部分”:[[2024,3,28],“日期时间”:“2024-03-28T21:15:43Z”,“时间戳”:1711660543807},“发布者位置”:“纽约,NY,USA”,“引用计数”:24,“发布者”:“ACM”,“许可证”:[{“开始”:{“日期部分”:[[2019,8,5]],“日期时间”:“2019-08-05T00:00Z”,“时间戳”:1564963200000},“content-version”:“vor”,“delay-in-days”:0,“URL”:“http://www.acm.org\/publications\/policys\/corpyright_policy#Background”}],“content-domain”:{“domain”:[“dl.acm.org”],“crossmark-restriction”:true},”short-container-title“:[],”published-print“:{”date-parts“:[2019,8,5]}”,“DOI”:“10.1145\/3337821.3337883“,”type“:”procesdings-article“,“created”:{“date-parts”:[[2019,7,25]],“date-time”:“2019-07-25T12:34:36Z”,“timestamp”:1564058076000},“update-policy”:“http://\/dx.doi.org\/10.1145\/crossmark-policy”,“source”:高”,“序列”:“第一”,“隶属关系”:[{“名称”:“清华大学”}]},{“给定”:“佳瑞”,“家庭”:“方”,“序列”:“附加”,“从属”:[{“名称”:“清华学院”}]{“给出”:“文莱”,“家族”:“赵”,“顺序”:“额外”,“附属”:[}“名称“:清华大学”{]}}]},{“given”:“Long”,“family”:“Wang”,“sequence”:“additional”,“affiliation”:[{“name”:“Baidu系统部”}]},{“fixed”:“Lin”,“家人”:“Gan”,“序列”:“附加”,“从属”:[[{名称”:“清华大学,无锡国家超级计算中心”}]{,“givent”:“Haohuan”,“家庭”:“Fu”,”sequence“:”additional“,“affaliation”:[{”name“:“清华大学,无锡国家超级计算中心”}]},{“given”:“Guangwen”,“family”:“Yang”,“sequence”:“additional”,“affiliation”:[{“name”:“无锡清华大学国家超级计算中心”}]],“member”:“320”,“published-on-line”:{“date-parts”:[[2019,8,5]]};“reference”:[}“key”:”e_1_3_2_1_1_1_1“,“doi-asserted-by”:”publisher“,”doi“:“10.1109\/PACT.2015.17”},{“key”:“e_1_3_2_1_2_1”,“doi-asserted-by”:“publisher”,”doi“:“10.1145\/1854273.1854317”}、{“密钥”:“e_1_3_2 _1_3_1”、“doi-sserted-by“:”publisher“,”doi:“10.1145 \/1379022.1375595”};{“key”:“e_1_3_1_4_1”;“volume-title”:“第十届手写识别前沿国际研讨会。Su visoft”,“作者”:“Chellapilla Kumar”,“年份”:“2006年”,“非结构化”:“Kumar Chellapilla、Sidd Puri和Patrice Simard。2006。文档处理的高性能卷积神经网络。第十届手写识别前沿国际研讨会。Suvisoft。Kumar Chellipilla,Sidd Puri和Patrise Simard,2006。用于文档处理的高性能卷积神经网络。在第十届笔迹识别前沿国际研讨会上。Suvisoft公司。},{“key”:“e_1_3_2_1_5_1”,“非结构化”:“Tianqi Chen Thierry Moreau等人2018。{TVM}:用于深度学习的自动化端到端优化编译器。在第13届{USENIX}操作系统设计与实现研讨会({OSDI}18)上。578--594. Tianqi Chen Thierry Moreau等人,2018年。{TVM}:用于深度学习的自动化端到端优化编译器。在第13届{USENIX}操作系统设计与实现研讨会({OSDI}18)上。578-594.“},{”key“:”e_1_3_2_1_6_1“,”unstructured“:”Sharan Chetlur Cliff Woolley Philippe Vandermersch等人,2014年。cudnn:用于深度学习的高效原语。arXiv预印本arXiv:1410.0759(2014)。Sharan Chetlur Cliff Woolley Philippe Vandermersch等人,2014年。cudnn:用于深度学习的高效原语。arXiv预印本arXiv:1410.0759(2014)。“},{”key“:”e_1_3_2_1_7_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1109\/IPDPS.2017.20”},“{”key“:“e_1_ 3_2_1 _8_1”,“doi-assert-by”:“publisher”,”doi“:”10.1109\/CVPR.2016.90},{“键”:“e_1_3_2_10_1”,“doi-asserted-by”:“出版商”,“doi”:“10.5555\/977395.977673”},}e_1_3_2_11_1“,“doi-asserted-by”:“publisher”,“doi”:“10.1109\/CVPR.2016.435”},{“key”:“e_1_ 3_2_12_1”,“doo-asserted-by”:”publisher“,”doi“:”10.1109\/CLUSTER.2018.00087“},”{“密钥”:“e_1_3_2_13_1”,”volume-title“基于GPU的卷积神经网络性能分析。2016年第45届国际并行处理大会(ICPP).67--76“,“作者”:“李X”,“非结构化”:“李X,G.Zhang,H.H.Huang,Z.Wang,W.Zheng。2016 . 基于GPU的卷积神经网络性能分析。2016年第45届国际并行处理大会(ICPP)。67--76 . X.Li、G.Zhang、H.H.Huang、Z.Wang和W.Zheng。2016.基于GPU的卷积神经网络性能分析。2016年第45届国际并行处理大会(ICPP)。67--76.“},{“key”:“e_1_3_2_1_14_1”,“volume-title”:“swTVM:探索自动化编译以进行Sunway架构的深度学习。arXiv预印本arXiv”,“author”:“刘长西”,“年份”:“1904”,“非结构化”:“Liu Changxi,Hailong Yang,Rujun Sun,Zhongzhi Luan,and Depei Qian.2019。swTVM:探索Sunway架构深度学习的自动编译。arXiv预打印arXiv。1904 .07404 ( 2019). 刘长喜、杨海龙、孙汝军、栾忠志和钱德培。2019.swTVM:探索自动编译以深入学习Sunway Architecture。arXiv预打印arXiv。1904.07404 ( 2019).“},{”key“:”e_1_3_2_15_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1109\/JPROC.2004.840306”},“key”:“e_1_ 3_2_16_1”,“doi-assert-by”:“publisher”,”doi“:”10.1145\/2499370.2462176“}”,{“},{”键“:”e_1_3_2_1_18_1“,”卷时间“:”发光:神经网络的图形降低编译器技术。arXiv预印本arXiv:1805.00907.“,“作者”:“Rotem Nadav”,“年份”:“2018”,“非结构化”:“Nadav Rotem,Jordan Fix,Saleem Abdullasool,Garret Catron,Summer Deng,Roman Dzhabarov,Nick Gibson,James Hegeman,Meghan Lele,Roman Levenstein,2018。发光:神经网络的图形降低编译器技术。arXiv预打印arXiv:1805.00907。Nadav Rotem、Jordan Fix、Saleem Abdullasool、Garret Catron、Summer Deng、Roman Dzhabarov、Nick Gibson、James Hegeman、Meghan Lele、Roman Levenstein等人,2018年。发光:神经网络的图形降低编译器技术。arXiv预印本arXiv:1805.00907。用于大规模图像识别的深度卷积网络。arXiv预印本arXiv:1409.1556(2014)。凯伦·西蒙扬和安德鲁·齐瑟曼。2014.用于大规模图像识别的超深卷积网络。arXiv预印本arXiv:1409.1556(2014)。“},{”key“:”e_1_3_2_1_20_1“,”volume-title“:”张量理解:框架-认知高性能机器学习抽象。arXiv预印本arXiv:1802.04730“,”author“:”Vasilache Nicolas“,”year“:”2018“,”unstructured“:”尼古拉·瓦西拉切(Nicolas Vasilache),Oleksandr Zinenko,2018年。张力理解:框架-认知高性能机器学习抽象。arXiv预印arXiv:1802.04730(2018)。Nicolas Vasilache、Oleksandr Zinenko等人,2018年。张力理解:框架-认知高性能机器学习抽象。arXiv预印本arXiv:1802.04730(2018)。“},{”key“:”e_1_3_2_1_21_1“,”doi-asserted-by“:”publisher“,”doi“:”10.1145\/2400682.2400713“}”,{“key”:“e_1_ 3_2_1_2 2_1”,”volume-title“:”超级计算,1998。SC98.IEEE \/ACM会议。IEEE,38-38“,“作者”:“Clinton Whaley R”,“年份”:“1998”,“非结构化”:“R Clinton Whaley and Jack J Dongarra。1998 . 自动调整线性代数软件。《超级计算》,1998年。SC98.IEEE \/ACM会议。IEEE,38--38。R Clinton Whaley和Jack J Dongarra。1998年。自动调整的线性代数软件。《超级计算》,1998年。SC98.IEEE\/ACM会议。IEEE,38--38.“},{”key“:”e_1_3_2_1_23_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1109\/IPDPS.2018.0086”},“key”:“e_1_ 3_2_1_2 4_1”,“doi-assert-by”:“publisher”,”doi“:”10.1109\/IPDPSW.2017.9“}],“event”:{“name”:“ICPP 2019:第48届国际并行处理大会”,“location”:“京都日本”,“缩写”:“ICPP 2019”,“赞助商”:[“筑波大学”]},“container-title”:[《第四十八届并行处理国际会议论文集》],“原始标题”:[],“链接”:[{“URL”:“https:\/\/dl.acm.org\/doi\/pdf\/10.1145\/3337821.3337883”,“内容类型”:“未指定”,“content-version”:“vor”,“intended-application”:“相似性检查“}”,“存放”:{“日期部分”:[[2023,1,17]],“日期时间”:“2023-01-17T19:14:24Z”,“时间戳”:1673982864000},“分数”:1,“资源”:{“主要”:}“URL”:“https:\/\/dl.acm.org\/doi\/10.1145\/33337821.3337883”},:{“date-parts“:[[2019,8,5]]},”references-count“:24,”alternative-id“:[”10.1145\/3337821.3337883“,”10.1145\/3337821“],”URL“:”http://\/dx.doi.org\/10.1145\/33379821.3337883“,”relationship“:{},“subject”:[],”published“:{”date-part“:[2019,8,5]}”,”assertion“:[{”value“:”2019-08-05“,”顺序“:2,”名称“:”发布“,”标签“:”已发布“,“组”:{“名称”:“publication_history“,”label“:”出版物历史“}}]}}