{“id”:“https://openalex.org/W3091804697“,”doi“:”https://doi.org/10.109/dac18072.2020.9218566“,”title“:“GPNPU:在GPU张量核中启用高效的基于硬件的直接卷积,并提供多精度支持”,“display_name”:“GPNPU:在GPU张量核心中启用高效基于硬件的直卷积,且提供多精度支持”,“publication_year”:2020,“publitation_date”:“2020-07-01”,“ids”:{“openalex”:“https://openalex.org/W3091804697“,”doi“:”https://doi.org/10.109/dac18072.2020.9218566“,”mag“:”3091804697“},”language“:”en“,”primary_location“:{”is_oa“:false,”landing_page_url“:”https://doi.org/10.1109/dac18072.2020.9218566“,”pdf_url“:null,”source“:null,”license“:null',”licence_id“:null,”version“:nuller,”is_accepted“:false,”is_published“:false},”type“:”article“,”type_crossref“:“procesdings-article”,”indexed_in“:[”crossref“],”open_access“:{”is_oa“:false,”oa_status“:”closed“,”oa_url”:null“,”any_repository_has_fulltext“:false}”,”authorships“:[{”author_position“:”first“,”作者“:{”id“:”https://openalex.org/A5067161373“,”display_name“:”卓然之歌“,”orcid“:”https://orcid.org/0000-0002-6494-4786},“机构”:[{“id”:https://openalex.org/I183067930“,”display_name“:”上海交通大学“,”ror“:”https://ror.org/0220qvk04“,”country_code“:”CN“,”type“:“教育”,”世系“:[”https://openalex.org/I183067930“]}],”国家“:[”CN“],”is_corresponding“:false,”raw_author_name“:”卓然宋“,”raw _ afiliation_strings“:[“上海交通大学”],”affiliations“:[{”raw_ afiliation _string“:”上海交通大学“,”institution_ids“:[https://openalex.org/I183067930“]}]},{”author_position“:”middle“,”author“:{”id“:”https://openalex.org/A5059200706“,”display_name“:”王建飞“,”兽人“:”https://orcid.org/0000-0001-6983-6955},“机构”:[{“id”:https://openalex.org/I183067930“,”display_name“:”上海交通大学“,”ror“:”https://ror.org/0220qvk04“,”country_code“:”CN“,”type“:“教育”,”世系“:[”https://openalex.org/I183067930“]}],”国家“:[”CN“],”is_corresponding“:false,”raw_author_name“:”王建飞“,”raw_affiliation_strings“:[“上海交通大学”],”隶属关系“:[{”raw_affiliation_string“:”上海交通大学“,”institution_ids“:”https://openalex.org/I183067930“]}]},{”author_position“:”middle“,”author“:{”id“:”https://openalex.org/A5023632642“,”display_name“:”Tianjian Li“,”orcid“:null},”institutions“:[{”id“:”https://openalex.org/I183067930“,”display_name“:”上海交通大学“,”ror“:”https://ror.org/0220qvk04“,”country_code“:”CN“,”type“:“教育”,”世系“:[”https://openalex.org/I183067930“]}],”国家“:[”CN“],”is_corresponding“:false,”raw_author_name“:”Tianjian Li“,”raw_affiliation_strings“:[“上海交通大学”],”affiliations“:[{”raw_affiliation_string“:”上海交通大学“,”institution_ids“https://openalex.org/I183067930“]}]},{”author_position“:”middle“,”author“:{”id“:”https://openalex.org/A5053801300“,”display_name“:”L\u00ec Ji\u0101ng“,”orcid“:”https://orcid.org/0000-0002-7353-8798},“机构”:[{“id”:https://openalex.org/I183067930“,”display_name“:”上海交通大学“,”ror“:”https://ror.org/0220qvk04“,”country_code“:”CN“,”type“:“教育”,”世系“:[”https://openalex.org/I183067930“]}],”国家“:[”CN“],”is_corresponding“:false,”raw_author_name“:”Li Jiang“,”rau_affiliation_strings“:[“上海交通大学”],”affiliations“:[{”raw_affiliation_string“:”上海交通大学“,”institution_ids“:https://openalex.org/I183067930“]}]},{”author_position“:”middle“,”author“:{”id“:”https://openalex.org/A5011544360“,”display_name“:”Ke Jin“,”orcid“:”https://orcid.org/0000-0001-7459-2577X},“机构”:[{“id”:https://openalex.org/I183067930“,”display_name“:”上海交通大学“,”ror“:”https://ror.org/0220qvk04“,”country_code“:”CN“,”type“:“教育”,”世系“:[”https://openalex.org/I183067930“]],”国家“:[”CN“],”is_corresponding“:false,”raw_author_name“:”荆柯“,”raw_affiation_strings“:[”上海交通大学“],”附属机构“:[{”raw_affiation_string“:”上海交通大学“,”institution_ids“:[”https://openalex.org/I183067930“]}]},{”author_position“:”middle“,”author“:{”id“:”https://openalex.org/A5056632010“,”display_name“:”梁晓尧“,”兽人“:”https://orcid.org/0000-0001-6551-9469},“机构”:[{“id”:https://openalex.org/I183067930“,”display_name“:”上海交通大学“,”ror“:”https://ror.org/0220qvk04“,”country_code“:”CN“,”type“:“教育”,”世系“:[”https://openalex.org/I183067930“]}],”国家“:[”CN“],”is_corresponding“:false,”raw_author_name“:”梁晓尧“,”raw_affiliation_strings“:[“上海交通大学”],”隶属关系“:[{”raw_affiliation_string“:”上海交通大学“,”institution_ids“:[https://openalex.org/I183067930“]}]},{”author_position“:”last“,”author“:{”id“:”https://openalex.org/A5045693138“,”display_name“:”Naifeng Jing“,”orcid“:”https://orcid.org/0000-0001-8417-5796},“机构”:[{“id”:https://openalex.org/I183067930“,”display_name“:”上海交通大学“,”ror“:”https://ror.org/0220qvk04“,”country_code“:”CN“,”type“:“教育”,”世系“:[”https://openalex.org/I183067930“]}],”国家“:[”CN“],”is_corresponding“:false,”raw_author_name“:”Naifeng Jing“,”raw_affiliation_strings“:[“上海交通大学”],”affiliations“:[{”raw_affiliation_string“:”上海交通大学“,”institution_ids“https://openalex.org/I183067930“]}]}],”countries_distinct_count“:1,”institutions_disting_count”:1,“corresponding_author_ids”:[],”correspounding_institution_ids“:[]、”apc_list“:null,”apc_payd“:null,”fwci“:0.542,”has_fulltext“:false,”cited_by_count:null,“first_page”:空,“last_page”:空},“is_retracted“:false,”is_paratext“:fase,”primary_topic“:{”id“:”https://openalex.org/T10036“,”display_name“:”计算机视觉和图像识别深度学习“,”score“:0.9994,”subfield“:{”id“:”https://openalex.org/subfields/1707“,”display_name“:”计算机视觉和模式识别“},”字段“:{”id“:”https://openalex.org/fields/17“,”display_name“:”Computer Science“},”domain“:{”id“:”https://openalex.org/domains/3“,”display_name“:”物理科学“}},”主题“:[{”id“:”https://openalex.org/T10036“,”display_name“:”计算机视觉和图像识别深度学习“,”score“:0.9994,”subfield“:{”id“:”https://openalex.org/subfields/1707“,”display_name“:”计算机视觉和模式识别“},”字段“:{”id“:”https://openalex.org/fields/17“,”display_name“:”Computer Science“},”domain“:{”id“:”https://openalex.org/domains/3“,”display_name“:”物理科学“}},{”id“:”https://openalex.org/T10054“,”display_name“:”并行计算与性能优化“,”score“:0.9981,”subfield“:{”id“:”https://openalex.org/subfields/1708“,”display_name“:”硬件和体系结构“},”字段“:{”id“:”https://openalex.org/fields/17“,”display_name“:”Computer Science“},”domain“:{”id“:”https://openalex.org/domains/3“,”display_name“:”物理科学“}},{”id“:”https://openalex.org/T11612“,”“display_name”:“机器学习中的优化方法”,“score”:0.9942,“subfield”:{“id”:“https://openalex.org/subfields/s702“,”display_name“:”Artificial Intelligence“},”field“:{”id“:”https://openalex.org/fields/17“,”display_name“:”Computer Science“},”domain“:{”id“:”https://openalex.org/domains/3“,”display_name“:”Physical Sciences“}}],”keywords“:[{”id“:”https://openalex.org/keywords/gpu-computing网站“,”display_name“:”GPU Computing“,”score“:0.627146},{”id“:”https://openalex.org/keywords/hig-performance-computing(https://openalex.org/关键字/高性能计算)“,”display_name“:”高性能计算“,”score“:0.540071},{”id“:”https://openalex.org/keywords/multicore-architectures网站“,”display_name“:”Multicore Architectures“,”score“:0.518428},{”id“:”https://openalex.org/keywords/convex优化“,”display_name“:”凸优化“,”score“:0.509119},{”id“:”https://openalex.org/keywords/performance-optimization网站“,”display_name“:”性能优化“,”score“:0.501187}],”concepts“:[{”id“:”https://openalex.org/C41008148,“wikidata”:https://www.wikidata.org/wiki/Q21198“,”display_name“:”计算机科学“,”level“:0,”score“:0.797772},{”id“:”https://openalex.org/C155281189,“wikidata”:https://www.wikidata.org/wiki/Q3518150“,”display_name“:”张量(内在定义)“,”level“:2,”score“:0.6427888},{”id“:”https://openalex.org/C173608175,“wikidata”:https://www.wikidata.org/wiki/Q232661“,”display_name“:”并行计算“,”level“:1,”score“:0.62789375},{”id“:”https://openalex.org/C45347329,“wikidata”:https://www.wikidata.org/wiki/Q5166604“,”display_name“:”卷积(计算机科学)“,”level“:3,”score“:0.5723773},{”id“:”https://openalex.org/C96324660,“wikidata”:https://www.wikidata.org/wiki/Q205446“,”display_name“:”Dataflow“,”level“:2,”score“:0.5534591},{”id“:”https://openalex.org/C17349429,“wikidata”:https://www.wikidata.org/wiki/Q1049914“,”display_name“:”矩阵乘法“,”level“:3,”score“:0.51853025},{”id“:”https://openalex.org/C117896860,“wikidata”:https://www.wikidata.org/wiki/Q11376“,”display_name“:”加速“,”等级“:2,”分数“:0.5104186},{”id“:”https://openalex.org/C50644808,“wikidata”:https://www.wikidata.org/wiki/Q192776“,”display_name“:”人工神经网络“,”level“:2,”score“:0.4821367},{”id“:”https://openalex.org/C78766204,“wikidata”:https://www.wikidata.org/wiki/Q555032“,”display_name“:”多核处理器“,”level“:2,”score“:0.475225},{”id“:”https://openalex.org/C81363708,“wikidata”:https://www.wikidata.org/wiki/Q17084460“,”display_name“:”卷积神经网络“,”level“:2,”score“:0.47130737},{”id“:”https://openalex.org/C3826847,“wikidata”:https://www.wikidata.org/wiki/Q188768“,”display_name“:”FLOPS“,”level“:2,”score“:0.46962264},{”id“:”https://openalex.org/C459310,“wikidata”:https://www.wikidata.org/wiki/Q117801“,”display_name“:”计算科学“,”level“:1,”score“:0.4604789},{”id“:”https://openalex.org/C2779851693,“wikidata”:https://www.wikidata.org/wiki/Q183484“,”display_name“:”图形处理单元“,”level“:2,”score“:0.42614436},{”id“:”https://openalex.org/C154945302,“wikidata”:https://www.wikidata.org/wiki/Q11660“,”display_name“:”人工智能“,”level“:1,”score“:0.27229545},{”id“:”https://openalex.org/C33923547,“wikidata”:https://www.wikidata.org/wiki/Q395“,”display_name“:”数学“,”等级“:0,”分数“:0.08768898},{”id“:”https://openalex.org/C121332964,“wikidata”:https://www.wikidata.org/wiki/Q413“,”display_name“:”物理“,”级别“:0,”分数“:0.0},{”id“:”https://openalex.org/C74650414,“wikidata”:https://www.wikidata.org/wiki/Q11397“,”display_name“:”经典力学“,”level“:1,”score“:0.0},{”id“:”https://openalex.org/C62520636,“wikidata”:https://www.wikidata.org/wiki/Q944“,”display_name“:”量子力学“,”level“:1,”score“:0.0},{”id“:”https://openalex.org/C202444582,“wikidata”:https://www.wikidata.org/wiki/Q837863“,”display_name“:”纯数学“,”level“:1,”score“:0.0},{”id“:”https://openalex.org/C84114770,“wikidata”:https://www.wikidata.org/wiki/Q46344“,”display_name“:”Quantum“,”level“:2,”score“:0.0}],”mesh“:[],”locations_count“:1,”location“:[{”is_oa“:false,”landing_page_url“:”https://doi.org/10.109/dac18072.2020.9218566“,”pdf_url“:null,”source“:null,”license“:null:”license_id“:nuld,”version“:null,”is_accepted“:false,”is_published“:false}],”best_oa_location“:nul,”sustainable_development_goals“:[{”score“:0.84,”id“:”https://metadata.un.org/sdg/7“,”display_name“:”负担得起的清洁能源“}],”grants“:[],”datasets“:【】,”versions“:【],”referenced_works_count“:18,”referrenced_works“:[”https://openalex.org/W1841592590","https://openalex.org/W1999085092","https://openalex.org/W2044535169","https://openalex.org/W2094756095","https://openalex.org/W2117696986","https://openalex.org/W2521727659","https://openalex.org/W2604319603","https://openalex.org/W2606722458","https://openalex.org/W2624789836","https://openalex.org/W2754249189","https://openalex.org/W2899176839","https://openalex.org/W2945580137","https://openalex.org/W2963367920","https://openalex.org/W2963989532","https://openalex.org/W3004171485","https://openalex.org/W4212788319","https://openalex.org/W4247470470","https://openalex.org/W4302296459“],”related_works“:[”https://openalex.org/W4251718783","https://openalex.org/W4236419692","https://openalex.org/W3167919718","https://openalex.org/W2998381397","https://openalex.org/W2380696053","https://openalex.org/W2293118914","https://openalex.org/W2171015181","https://openalex.org/W2119413962","https://openalex.org/W2060611139","https://openalex.org/W1970548269“],”ngrams_url“:”https://api.openalex.org/works/W3091804697/ngrams网站“,”“abstract_inverted_index”:{“To”:[0],“tailt”:[1],“for”:[2114132137164173],“DNN”:[3166179],“(Deep”:[4],“Neural”:[5],“Network)”:[6],“加速”:[7167],“GPU”:[8171],“has”:[9],“migrated”:[10],“To”:[11,78,86107148159170],“new”:[12],“architecture”:[13],“such”:[14],“作为”:[15,98],“NVIDIA”:[16],“Volta”:[17],“和”:[18,76,90112135157],“图灵“:[19],”那“:[20121153],”合并“:[21],”专用“:[22],”张量“:[23,32,70125162],”核心。“:[24],”虽然“:[25],”良好“:[26],”在“:[27],”GEMM“:[28],”(通用“:[29],”矩阵矩阵“:[30],”乘法“),“:[31],”核心“:[33,71126163],”仍然“:[34],”有“:[35],”低效“:[36],”面对“:[37],”卷积“:[38],”与“:[39,72,82139],”确定“:[40],”层“:[41],“结构。“:[42],“This”:[43],“paper”:[44],“proposes”:[45],“a”:[46103],“GPNPU”:[47122],“(General Purpose”:[48],“Neural-network”:[49],“Processing”:[50],“Unit”):[51],“architecture”:[52],“which”:[53],“offers”:[54],“another”:55],“option”:[56],“of”:[57],“direct”:[58,65],“卷积”:[59,66,84],“in”:[60177],“GPU。“:[61,99],”It“:[62],”针数“:[63],”the“:[64,69,95161174],”dataflow“:[67],”into“:[68],”little“:[73],”hardware“:%74],”support“:[75],”resorts“:[77],”regulated“:[%9],”layout“:+81],”stripe-mined“:[83],”execution“:[85],”reach“:[87],”higher“:[88115],”性能“:[89145],“功率”:[91],“效率”,:[92],“while”:[93168],“保留“:[94],“通用”:[96],“可编程性”:[97],“我们”:[100],“进一步”:[101],“应用”:[102],“统一”:[104],“核心”:[105],“设计”:[106],“支持”:[108],“可变”:[109],“操作数”:[110],“类型”:[111],“精度”:[113],“计算”:[116],“吞吐量”。“:[117],”The“:[118143],”evaluation“:[119],”shows“:[120],”can“:[123],”exceller“:[124],”on“:[127],”typeal“:[128],”DNNs“:[129],”by“:[130],”1.4X“:[131],”inference“:[133],”(FP16)“:[134],”1.2X“:%136],”training“:[138],”much“:[140],”reduced“:[141],”power。“:[142],”INT8“:[144],”even“:[146],”increases“:[147],”2.4X。“:[149],“我们的”:[150],“研究”:[151],“证明”:[152],“它”:[154],“是”:[155],“可能”:[156],“吸引人”:[158],“精炼”:[160],“更大”:[165],“一致”:[169],“架构”:[172],“可编程性”:[175],“必要”:[176],“未来”:[178],“进化。“:[180]},”cited_by_api_url“:”https://api.openalex.org/works?filter=cites:W3091804697“,”counts_by_year“:[{”年份“:2023,”cited_by_count“:5},{”年“:2021,”cited_by_count”:1}],”更新日期“:”2024-06-27T01:59:24.808415“,”创建日期“:“2020-10-15”}