｛“状态”：“好”，“消息类型”：“工作”，“消息版本”：“1.0.0”，“消息”：｛“索引”：｛“日期部分”：[[2024,3,28]，“日期时间”：“2024-03-28T21:15:43Z”，“时间戳”：1711660543807｝，“发布者位置”：“纽约，NY，USA”，“引用计数”：24，“发布者”：“ACM”，“许可证”：[｛“开始”：｛“日期部分”：[[2019,8,5]]，“日期时间”：“2019-08-05T00:00Z”，“时间戳”：1564963200000}，“content-version”：“vor”，“delay-in-days”：0，“URL”：“http://www.acm.org\/publications\/policys\/corpyright_policy#Background”}]，“content-domain”：{“domain”:[“dl.acm.org”]，“crossmark-restriction”：true}，”short-container-title“：[]，”published-print“：{”date-parts“：[2019,8,5]}”，“DOI”：“10.1145\/3337821.3337883“，”type“：”procesdings-article“，“created”：{“date-parts”：[[2019,7,25]]，“date-time”：“2019-07-25T12:34:36Z”，“timestamp”：1564058076000}，“update-policy”：“http://\/dx.doi.org\/10.1145\/crossmark-policy”，“source”：高”，“序列”：“第一”，“隶属关系”：[{“名称”：“清华大学”}]}，{“给定”：“佳瑞”，“家庭”：“方”，“序列”：“附加”，“从属”：[{“名称”：“清华学院”}]{“给出”：“文莱”，“家族”：“赵”，“顺序”：“额外”，“附属”：[}“名称“：清华大学”{]}}]}，{“given”：“Long”，“family”：“Wang”，“sequence”：“additional”，“affiliation”：[{“name”：“Baidu系统部”}]}，{“fixed”：“Lin”，“家人”：“Gan”，“序列”：“附加”，“从属”：[[{名称”：“清华大学，无锡国家超级计算中心”}]{，“givent”：“Haohuan”，“家庭”：“Fu”，”sequence“：”additional“，“affaliation”:[{”name“：“清华大学，无锡国家超级计算中心”}]}，{“given”：“Guangwen”，“family”：“Yang”，“sequence”：“additional”，“affiliation”：[{“name”：“无锡清华大学国家超级计算中心”}]]，“member”：“320”，“published-on-line”：{“date-parts”：[[2019,8,5]]}；“reference”：[}“key”：”e_1_3_2_1_1_1_1“，“doi-asserted-by”：”publisher“，”doi“：“10.1109\/PACT.2015.17”}，{“key”：“e_1_3_2_1_2_1”，“doi-asserted-by”：“publisher”，”doi“：“10.1145\/1854273.1854317”}、{“密钥”：“e_1_3_2 _1_3_1”、“doi-sserted-by“：”publisher“，”doi:“10.1145 \/1379022.1375595”}；{“key”：“e_1_3_1_4_1”；“volume-title”：“第十届手写识别前沿国际研讨会。Su visoft”，“作者”：“Chellapilla Kumar”，“年份”：“2006年”，“非结构化”：“Kumar Chellapilla、Sidd Puri和Patrice Simard。2006。文档处理的高性能卷积神经网络。第十届手写识别前沿国际研讨会。Suvisoft。Kumar Chellipilla，Sidd Puri和Patrise Simard，2006。用于文档处理的高性能卷积神经网络。在第十届笔迹识别前沿国际研讨会上。Suvisoft公司。}，{“key”：“e_1_3_2_1_5_1”，“非结构化”：“Tianqi Chen Thierry Moreau等人2018。{TVM}：用于深度学习的自动化端到端优化编译器。在第13届{USENIX}操作系统设计与实现研讨会（{OSDI}18）上。578--594. Tianqi Chen Thierry Moreau等人，2018年。{TVM}：用于深度学习的自动化端到端优化编译器。在第13届{USENIX}操作系统设计与实现研讨会（{OSDI}18）上。578-594.“}，{”key“：”e_1_3_2_1_6_1“，”unstructured“：”Sharan Chetlur Cliff Woolley Philippe Vandermersch等人，2014年。cudnn：用于深度学习的高效原语。arXiv预印本arXiv:1410.0759（2014）。Sharan Chetlur Cliff Woolley Philippe Vandermersch等人，2014年。cudnn：用于深度学习的高效原语。arXiv预印本arXiv:1410.0759（2014）。“}，{”key“：”e_1_3_2_1_7_1“，”doi-asserted-by“：”publisher“，“doi”：“10.1109\/IPDPS.2017.20”}，“{”key“：“e_1_ 3_2_1 _8_1”，“doi-assert-by”：“publisher”，”doi“：”10.1109\/CVPR.2016.90}，{“键”：“e_1_3_2_10_1”，“doi-asserted-by”：“出版商”，“doi”：“10.5555\/977395.977673”}，}e_1_3_2_11_1“，“doi-asserted-by”：“publisher”，“doi”：“10.1109\/CVPR.2016.435”}，{“key”：“e_1_ 3_2_12_1”，“doo-asserted-by”：”publisher“，”doi“：”10.1109\/CLUSTER.2018.00087“}，”{“密钥”：“e_1_3_2_13_1”，”volume-title“基于GPU的卷积神经网络性能分析。2016年第45届国际并行处理大会（ICPP）.67--76“，“作者”：“李X”，“非结构化”：“李X，G.Zhang，H.H.Huang，Z.Wang，W.Zheng。2016 . 基于GPU的卷积神经网络性能分析。2016年第45届国际并行处理大会（ICPP）。67--76 . X.Li、G.Zhang、H.H.Huang、Z.Wang和W.Zheng。2016.基于GPU的卷积神经网络性能分析。2016年第45届国际并行处理大会（ICPP）。67--76.“}，{“key”：“e_1_3_2_1_14_1”，“volume-title”：“swTVM:探索自动化编译以进行Sunway架构的深度学习。arXiv预印本arXiv”，“author”：“刘长西”，“年份”：“1904”，“非结构化”：“Liu Changxi，Hailong Yang，Rujun Sun，Zhongzhi Luan，and Depei Qian.2019。swTVM：探索Sunway架构深度学习的自动编译。arXiv预打印arXiv。1904 .07404 ( 2019). 刘长喜、杨海龙、孙汝军、栾忠志和钱德培。2019.swTVM：探索自动编译以深入学习Sunway Architecture。arXiv预打印arXiv。1904.07404 ( 2019).“}，{”key“：”e_1_3_2_15_1“，”doi-asserted-by“：”publisher“，“doi”：“10.1109\/JPROC.2004.840306”}，“key”：“e_1_ 3_2_16_1”，“doi-assert-by”：“publisher”，”doi“：”10.1145\/2499370.2462176“}”，{“}，{”键“：”e_1_3_2_1_18_1“，”卷时间“：”发光：神经网络的图形降低编译器技术。arXiv预印本arXiv:1805.00907.“，“作者”：“Rotem Nadav”，“年份”：“2018”，“非结构化”：“Nadav Rotem，Jordan Fix，Saleem Abdullasool，Garret Catron，Summer Deng，Roman Dzhabarov，Nick Gibson，James Hegeman，Meghan Lele，Roman Levenstein，2018。发光：神经网络的图形降低编译器技术。arXiv预打印arXiv:1805.00907。Nadav Rotem、Jordan Fix、Saleem Abdullasool、Garret Catron、Summer Deng、Roman Dzhabarov、Nick Gibson、James Hegeman、Meghan Lele、Roman Levenstein等人，2018年。发光：神经网络的图形降低编译器技术。arXiv预印本arXiv:1805.00907。用于大规模图像识别的深度卷积网络。arXiv预印本arXiv:1409.1556（2014）。凯伦·西蒙扬和安德鲁·齐瑟曼。2014.用于大规模图像识别的超深卷积网络。arXiv预印本arXiv:1409.1556（2014）。“}，{”key“：”e_1_3_2_1_20_1“，”volume-title“：”张量理解：框架-认知高性能机器学习抽象。arXiv预印本arXiv:1802.04730“，”author“：”Vasilache Nicolas“，”year“：”2018“，”unstructured“：”尼古拉·瓦西拉切（Nicolas Vasilache），Oleksandr Zinenko，2018年。张力理解：框架-认知高性能机器学习抽象。arXiv预印arXiv:1802.04730（2018）。Nicolas Vasilache、Oleksandr Zinenko等人，2018年。张力理解：框架-认知高性能机器学习抽象。arXiv预印本arXiv:1802.04730（2018）。“}，{”key“：”e_1_3_2_1_21_1“，”doi-asserted-by“：”publisher“，”doi“：”10.1145\/2400682.2400713“}”，{“key”：“e_1_ 3_2_1_2 2_1”，”volume-title“：”超级计算，1998。SC98.IEEE \/ACM会议。IEEE，38-38“，“作者”：“Clinton Whaley R”，“年份”：“1998”，“非结构化”：“R Clinton Whaley and Jack J Dongarra。1998 . 自动调整线性代数软件。《超级计算》，1998年。SC98.IEEE \/ACM会议。IEEE，38--38。R Clinton Whaley和Jack J Dongarra。1998年。自动调整的线性代数软件。《超级计算》，1998年。SC98.IEEE\/ACM会议。IEEE，38--38.“}，{”key“：”e_1_3_2_1_23_1“，”doi-asserted-by“：”publisher“，“doi”：“10.1109\/IPDPS.2018.0086”}，“key”：“e_1_ 3_2_1_2 4_1”，“doi-assert-by”：“publisher”，”doi“：”10.1109\/IPDPSW.2017.9“}]，“event”：{“name”：“ICPP 2019:第48届国际并行处理大会”，“location”：“京都日本”，“缩写”：“ICPP 2019”，“赞助商”：[“筑波大学”]}，“container-title”：[《第四十八届并行处理国际会议论文集》]，“原始标题”：[]，“链接”：[{“URL”：“https:\/\/dl.acm.org\/doi\/pdf\/10.1145\/3337821.3337883”，“内容类型”：“未指定”，“content-version”：“vor”，“intended-application”：“相似性检查“}”，“存放”：{“日期部分”：[[2023,1,17]]，“日期时间”：“2023-01-17T19:14:24Z”，“时间戳”：1673982864000}，“分数”：1，“资源”：{“主要”：}“URL”：“https:\/\/dl.acm.org\/doi\/10.1145\/33337821.3337883”}，：{“date-parts“：[[2019,8,5]]}，”references-count“：24，”alternative-id“：[”10.1145\/3337821.3337883“，”10.1145\/3337821“]，”URL“：”http://\/dx.doi.org\/10.1145\/33379821.3337883“，”relationship“：{}，“subject”：[]，”published“：{”date-part“：[2019,8,5]}”，”assertion“：[{”value“：”2019-08-05“，”顺序“：2，”名称“：”发布“，”标签“：”已发布“，“组”：{“名称”：“publication_history“，”label“：”出版物历史“}}]}}