马凌霄
人员信息
优化列表
2020年–今天
2024 [第16条] 陈月涛 , 李坤 , 王玉浩 , 白东林 , 王磊(Lei Wang) , 马凌霄 , 梁元 , 张云泉 , 曹婷(Ting Cao) , 毛洋 :
ConvStencil:将模板计算转换为张量核上的矩阵乘法。 PPoPP(PPoPP) 2024 : 333-347 [i7] 马树明(Shuming Ma) , 王宏宇 , 马凌霄 , 王磊(Lei Wang) , 王文辉 , 黄绍汉 , 李东 , 王瑞平 , 薛吉龙 , 福禄威 :
1位LLM时代:所有大型语言模型都是1.58位。 CoRR公司 腹肌/2402.17764 ( 2024 ) 2023 [j3] 聂晓楠 , 苗旭鹏 , 王子龙 , 杨子超 , 薛吉龙 , 马凌霄 , 曹刚(Gang Cao) , 崔斌(音) :
FlexMoE:通过动态设备放置扩展大型稀疏预训练模型训练。 程序。 ACM管理。 数据 1 ( 1 ) : 110:1-110:19 ( 2023 ) [第15条] 陈章 , 马凌霄 , 薛吉龙 , 伊宁市 , 苗子明 , 范扬 , 冀东寨 , 芷阳 , 毛洋 :
Cocktaler:分析和优化深度学习中的动态控制流程。 OSDI公司 2023 : 681-699 [第14条] 伊宁市 , 芷阳 , 薛吉龙 , 马凌霄 , 夏玉清 , 苗子明 , 郭玉霄 , 范扬 , 周立东 :
焊工:通过Tile-graph安排深度学习内存访问。 OSDI公司 2023 : 701-718 [第13条] 崔伟豪 , 韩振华 , 凌记欧阳 , 王宜川 , 郑宁新 , 马凌霄 , 杨玉清 , 范扬 , 薛吉龙 , 邱丽丽(Lili Qiu) , 周立东 , 全晨 , 海胜滩 , 郭敏义 :
用头脑风暴优化动态神经网络。 OSDI公司 2023 : 797-815 [第12条] 郑宁新 , 江慧强 , 张全鲁 , 韩振华 , 马凌霄 , 杨玉清 , 范扬 , 张成瑞东 , 邱丽丽(Lili Qiu) , 毛洋 , 周立东 :
PIT:通过置换不变量变换优化动态稀疏深度学习模型。 SOSP(标准操作程序) 2023 : 331-347 [i6] 郑宁新 , 江慧强 , 张全鲁 , 韩振华 , 杨玉清 , 马凌霄 , 范扬 , 邱丽丽(Lili Qiu) , 毛洋 , 周立东 :
SparDA:通过稀疏密集变换加速动态稀疏深度神经网络。 CoRR公司 abs/2301.10936 ( 2023 ) [i5] 聂晓楠 , 苗旭鹏 , 王子龙 , 杨子超 , 薛吉龙 , 马凌霄 , 曹刚(Gang Cao) , 崔斌(音) :
FlexMoE:通过动态设备放置扩展大型稀疏预训练模型训练。 CoRR公司 abs/2304.03946 ( 2023 ) [i4] 王宏宇 , 马淑明 , 李东 , 黄绍汉 , 王怀杰 , 马凌霄 , 范扬 , 王瑞平 , 易武 , 福禄威 :
BitNet:用于大型语言模型的缩放1位转换器。 CoRR公司 abs/2310.11453 ( 2023 ) 2022 [注2] 苗旭鹏 , 马凌霄 , 芷阳 , 邵英霞 , 崔斌(音) , 乐乐余 , 蒋嘉伟(Jiawei Jiang) :
CuWide:为GPU上的稀疏宽模型实现高效的基于流的培训。 IEEE传输。 知识。 数据工程。 34 ( 9 ) : 4119-4132 ( 2022 ) [第11条] 郑宁新 , 林斌(Bin Lin) , 张全鲁 , 马凌霄 , 杨玉清 , 范扬 , 杨旺(Yang Wang) , 毛洋 , 周立东 :
SparTA:通过Tensor-with-Sparsity-Attribute深度学习模型稀疏性。 OSDI公司 2022 : 213-232 [第10条] 朱红玉 , 吴若凡 , 一家刁 , 山宾可 , 李浩宇 , 陈章 , 薛吉龙 , 马凌霄 , 夏玉清 , 崔伟 , 范扬 , 毛洋 , 周立东 , 阿萨夫·西登 , Gennady Pekhimenko先生 :
罗勒:用于深度学习的快速高效张量编译。 OSDI公司 2022 : 233-248 2021 【c9】 泰云·金 , 黄昌浩 , 京秀公园 , 林志琦 , 彭成 , 苗有山 , 马凌霄 , 熊永强 :
通过有地方意识的部分执行加快GNN培训。 APSys公司 2021 : 34-41 【c8】 苗旭鹏 , 马凌霄 , 芷阳 , 邵英霞 , 崔斌(音) , 乐乐余 , 蒋嘉伟(Jiawei Jiang) :
CuWide:GPU上稀疏模型的高效基于流的培训(扩展摘要)。 集成电路驱动单元 2021 : 2330-2331 【c7】 苗旭鹏 , 聂晓楠 , 邵英霞 , 芷阳 , 蒋嘉伟(Jiawei Jiang) , 马凌霄 , 崔斌 :
通过部分缩减实现异构感知的分布式机器学习训练。 SIGMOD会议 2021 : 2262-2270 [i3] 聂晓楠 , 曹世杰 , 苗旭鹏 , 马凌霄 , 薛吉龙 , 苗有山 , 杨子超 , 芷阳 , 崔斌(音) :
用于专家混合的密集到稀疏门。 CoRR公司 abs/2112.14397 ( 2021 ) 2020 [j1] 张志辉 , 镜文冷 , 马凌霄 , 苗有山 , 李超(音) , 郭敏义 :
图神经网络的体系结构含义。 IEEE计算。 阿奇特。 莱特。 19 ( 1 ) : 59-62 ( 2020 ) 【c6】 朝天 , 马凌霄 , 芷阳 , 戴亚非 :
PCGCN:加速图卷积网络的分区中心处理。 IPDPS公司 2020 : 936-945年 【c5】 马凌霄 , 谢志强 , 芷阳 , 薛吉龙 , 苗有山 , 崔伟 , 胡文祥 , 范扬 , 张林涛 , 周立东 :
Rammer:使用rTasks实现整体深度学习编译器优化。 OSDI公司 2020 : 881-897 [i2] 张志辉 , 镜文冷 , 马凌霄 , 苗有山 , 李超(音) , 郭敏义 :
图形神经网络的架构含义。 CoRR公司 abs/2009.00804 ( 2020 )
2010 – 2019
2019 【c4】 曹世杰 , 马凌霄 , 文聪晓 , 陈章 , 刘云欣 , 张林涛 , 聂兰顺 , 芷阳 :
SeerNet:通过低位量化预测卷积神经网络特征图稀疏性。 CVPR公司 2019 : 11216-11225 [c3] 马凌霄 , 芷阳 , 苗有山 , 薛吉龙 , 吴铭(音) , 周立东 , 戴亚非 :
NeuGraph:大型图上的并行深层神经网络计算。 USENIX年度技术会议 2019 : 443-458 2018 [i1] 马凌霄 , 芷阳 , 苗有山 , 薛吉龙 , 吴铭(音) , 周立东 , 戴亚非 :
面向高效的大尺度图形神经网络计算。 CoRR公司 abs/1810.08403 ( 2018 ) 2017 【c2】 马凌霄 , 芷阳 , 韩晨(Han Chen) , 薛吉龙 , 戴亚非 :
Garaph:利用平衡复制在单台机器上进行高效的GPU加速图形处理。 USENIX年度技术会议 2017 : 195-207
2000 – 2009
2005 【c1】 尹建伟 , 姚伟鹏 , 马凌霄 , 金乡洞 :
CoopStreaming:一种用于快速直播媒体流的新型点对点系统。 WAIM公司 2005 : 882-887