马凌霄
人员信息
优化列表
![笔记](https://dblp.org/img/note-mark.dark.12x12.png)
2020年–今天
2024 [第17条] 陈月涛 , 李坤 , 王玉浩 , 白东林 , 王磊(Lei Wang) , 马凌霄 , 梁元 , 张云泉 , 曹婷(Ting Cao) , 毛洋 :
ConvStencil:将模板计算转换为张量核上的矩阵乘法。 PPoPP(PPoPP) 2024 : 333-347 [i7] 马树明(Shuming Ma) , 王宏宇 , 马凌霄 , 王磊(Lei Wang) , 王文辉 , 黄绍涵 , 李东 , 王瑞平 , 薛吉龙 , 福禄威 :
1位LLM时代:所有大型语言模型都是1.58位。 CoRR公司 abs/2402.17764 ( 2024 ) 2023 [j3] 聂晓楠 , 苗旭鹏 , 王子龙 , 杨子超 , 薛吉龙 , 马凌霄 , 曹刚(Gang Cao) , 崔斌(音) :
FlexMoE:通过动态设备放置扩展大型稀疏预训练模型训练。 程序。 ACM管理。 数据 1 ( 1 ) : 110:1-110:19 ( 2023 ) [第16条] 林斌(Bin Lin) , 郑宁新 , 王磊(Lei Wang) , 曹世杰 , 马凌霄 , 张全鲁 , 易珠 , 曹婷(Ting Cao) , 薛吉龙 , 杨玉清 , 范扬 :
深度学习中N:M稀疏权重的高效GPU内核。 MLSys公司 2023 [第15条] 陈章 , 马凌霄 , 薛吉龙 , 伊宁市 , 苗子明 , 范扬 , 冀东寨 , 芷阳 , 毛洋 :
鸡尾酒:深度学习中动态控制流的分析和优化。 OSDI公司 2023 : 681-699 [第14条] 石一宁 , 芷阳 , 薛吉龙 , 马凌霄 , 夏玉清 , 苗子明 , 郭玉霄 , 范扬 , 周立东 :
焊工:通过Tile-graph安排深度学习内存访问。 OSDI公司 2023 : 701-718 [第13条] 崔伟豪 , 韩振华 , 凌记欧阳 , 王宜川 , 郑宁新 , 马凌霄 , 杨玉清 , 范扬 , 薛吉龙 , 邱丽丽(Lili Qiu) , 周立东 , 全晨 , 海胜滩 , 郭敏义 :
用头脑风暴优化动态神经网络。 OSDI公司 2023 : 797-815 [第12条] 郑宁新 , 江慧强 , 张全鲁 , 韩振华 , 马凌霄 , 杨玉清 , 范扬 , 张成瑞东 , 邱丽丽(Lili Qiu) , 毛洋 , 周立东 :
PIT:通过置换不变量变换优化动态稀疏深度学习模型。 SOSP(标准操作程序) 2023 : 331-347 [i6] 郑宁新 , 江慧强 , 张全鲁 , 韩振华 , 杨玉清 , 马凌霄 , 范扬 , 邱丽丽(Lili Qiu) , 毛洋 , 周立东 :
SparDA:通过稀疏密集变换加速动态稀疏深度神经网络。 CoRR公司 abs/2301.10936 ( 2023 ) [i5] 聂晓楠 , 苗旭鹏 , 王子龙 , 杨子超 , 薛吉龙 , 马凌霄 , 曹刚(Gang Cao) , 崔斌(音) :
FlexMoE:通过动态设备放置进行大规模稀疏预训练模型训练。 CoRR公司 abs/2304.03946 ( 2023 ) [i4] 王宏宇 , 马树明(Shuming Ma) , 李东 , 黄绍涵 , 王怀杰 , 马凌霄 , 范扬 , 王瑞平 , 易武 , 福禄威 :
BitNet:为大型语言模型扩展1位转换器。 CoRR公司 abs/2310.11453 ( 2023 ) 2022 [注2] 苗旭鹏 , 马凌霄 , 芷阳 , 邵英霞 , 崔斌(音) , 乐乐余 , 蒋嘉伟(Jiawei Jiang) :
CuWide:为GPU上的稀疏宽模型实现高效的基于流的培训。 IEEE传输。 知识。 数据工程。 34 ( 9 ) : 4119-4132 ( 2022 ) [第11条] 郑宁新 , 林斌(Bin Lin) , 张全鲁 , 马凌霄 , 杨玉清 , 范扬 , 杨旺(Yang Wang) , 毛洋 , 周立东 :
SparTA:通过Tensor-with-Sparsity-Attribute深度学习模型稀疏性。 OSDI公司 2022 : 213-232 [第10条] 朱红玉 , 吴若凡 , 一家刁 , 山宾可 , 李浩宇 , 陈章 , 薛吉龙 , 马凌霄 , 夏玉清 , 魏翠 , 范扬 , 毛洋 , 周立东 , 阿萨夫·西登 , Gennady Pekhimenko先生 :
罗勒:用于深度学习的快速高效张量编译。 OSDI公司 2022 : 233-248 2021 【c9】 泰云·金 , 黄昌浩 , 京洙公园 , 林志琦 , 彭成 , 苗有山 , 马凌霄 , 熊永强 :
通过有地方意识的部分执行加快GNN培训。 APSys公司 2021 : 34-41 【c8】 苗旭鹏 , 马凌霄 , 芷阳 , 邵映霞 , 崔斌(音) , 乐乐余 , 蒋嘉伟(Jiawei Jiang) :
CuWide:GPU上稀疏模型的高效基于流的培训(扩展摘要)。 集成电路驱动单元 2021 : 2330-2331 【c7】 苗旭鹏 , 聂晓楠 , 邵英霞 , 芷阳 , 蒋嘉伟(Jiawei Jiang) , 马凌霄 , 崔斌(音) :
通过部分缩减实现异构感知的分布式机器学习训练。 SIGMOD会议 2021 : 2262-2270 [i3] 聂晓楠 , 曹世杰 , 苗旭鹏 , 马凌霄 , 薛吉龙 , 苗有山 , 杨子超 , 芷阳 , 崔斌(音) :
用于专家混合的密集到稀疏门。 CoRR公司 腹肌/2112.14397 ( 2021 ) 2020 [j1] 张志辉 , 镜文冷 , 马凌霄 , 游山苗族 , 李超(音) , 郭敏义 :
图形神经网络的架构含义。 IEEE计算。 阿基特。 莱特。 19 ( 1 ) : 59-62 ( 2020 ) 【c6】 朝天 , 马凌霄 , 芷阳 , 戴亚非 :
PCGCN:加速图卷积网络的分区中心处理。 IPDPS公司 2020 : 936-945 【c5】 马凌霄 , 谢志强 , 芷阳 , 薛继龙 , 苗有山 , 魏翠 , 胡文祥 , 范扬 , 张林涛 , 周立东 :
Rammer:使用rTasks实现整体深度学习编译器优化。 OSDI公司 2020 : 881-897 [i2] 张志辉 , 镜文冷 , 马凌霄 , 苗有山 , 李超(音) , 郭敏义 :
图形神经网络的架构含义。 CoRR公司 abs/2009.00804 ( 2020 )
2010 – 2019
2019 【c4】 曹世杰 , 马凌霄 , 文聪晓 , 陈章 , 刘云欣 , 张林涛 , 聂兰顺 , 芷阳 :
SeerNet:通过低位量化预测卷积神经网络特征图稀疏性。 CVPR公司 2019 : 11216-11225 【c3】 马凌霄 , 芷阳 , 游山苗族 , 薛吉龙 , 吴铭(音) , 周立东 , 戴亚非 :
NeuGraph:大型图上的并行深层神经网络计算。 USENIX年度技术会议 2019 : 443-458 2018 [i1] 马凌霄 , 芷阳 , 苗有山 , 薛吉龙 , 吴铭(音) , 周立东 , 戴亚非 :
面向高效的大尺度图形神经网络计算。 CoRR公司 abs/1810.08403 ( 2018 ) 2017 【c2】 马凌霄 , 芷阳 , 韩晨(Han Chen) , 薛吉龙 , 戴亚非 :
Garaph:利用平衡复制在单台机器上进行高效的GPU加速图形处理。 USENIX年度技术会议 2017 : 195-207
2000 – 2009
2005 【c1】 尹建伟 , 姚伟鹏 , 马凌霄 , 金乡洞 :
CoopStreaming:一种用于快速直播流媒体的新型对等系统。 WAIM公司 2005 : 882-887
合著者索引
![](https://dblp.org/img/cog.dark.24x24.png)