第四大MLSys 2021[虚拟]
亚历克斯·斯莫拉 , 亚历克斯·迪马基斯 , 离子石 :
机器学习与系统2021年会议录,MLSys 2021,虚拟,2021年4月5日至9日。 mlsys.org网站 2021 伊萨克·埃多·维凡科斯 , 萨耶赫·谢里菲 , 丹尼尔·利·马 , 阿梅尔·阿卜杜勒哈迪 , 恰兰·班农 , 米洛斯·尼科利奇 , 穆斯塔法·马哈茂德 , 阿尔贝托·德尔马斯·拉斯科茨 , Gennady Pekhimenko先生 , 安德烈亚斯·莫绍沃斯 :
Boveda:逐块构建芯片上的深度学习记忆层次结构。 小虎汤 , 韩世浩 , 张丽娜(Li Lyna Zhang) , 曹婷(Ting Cao) , 刘云欣 :
将神经网络设计与现实世界性能联系起来:神经网络的行为研究。 普拉蒂克·费加德 , 陈天奇(Tianqi Chen) , 菲利普·吉本斯 , 托德·C·莫瑞 :
Cortex:递归深度学习模型的编译器。 索拉巴·阿加瓦尔 , 王宏毅 , 李康旭 , Shivaram Venkataraman公司 , Dimitris S.Papailiopoulos公司 :
通过关键学习机制识别的自适应梯度通信。 萨米尔·库马尔 , 于爱玛·王 , 克利夫·杨 , 詹姆斯·布拉德伯里 , 纳文·库马尔 , 陈德豪 , 安迪·斯温 :
探索谷歌TPUS上ML训练的并发限制。 卢卡斯·李本温 , 岑克·贝加尔 , 布兰登·卡特 , 大卫·吉福德 , 丹妮拉·鲁斯 :
在修剪中迷失:修剪神经网络对测试准确性的影响。 山塔努·曼达尔 , 托德·安德森 , 哈维尔·图雷克 , 贾斯汀·戈奇利奇 , 周圣田 , 阿卜杜拉·穆扎希德 :
学习机器编程的健身功能。 沙布纳姆·达格哈吉 , 尼古拉斯·梅斯伯格 , 赵梦楠 , 安舒马利·施里瓦斯塔瓦 :
在现代CPU上加速SLIDE深度学习:矢量化、量化、内存优化等。 姚瑶丁 , 李根柱(Ligeng Zhu) , 贾志浩 , Gennady Pekhimenko先生 , 宋汉 :
IOS:CNN加速的Inter-Operatior Scheduler。 利雅得-巴格达迪 , 马西尼萨·梅鲁安尼 , 穆罕默德·希哈姆·莱赫塔斯 , 卡迈勒·阿布杜斯 , 塔哈·阿尔巴乌 , 卡里玛·贝纳奇巴 , 萨曼·阿马拉辛赫 :
基于深度学习的自动代码优化成本模型。 Omid Aramoon公司 , 陈品玉(Pin-Yu Chen) , 港区 :
别忘了在渐变上签名! 沈海晨(Haichen Shen) , 杰瑞德·罗什 , Zhi Chen先生 , 魏晨 , 吴勇 , 穆力 , 文·夏尔马 , 扎卡里·塔特洛克 , 王一达 :
敏捷:高效编译用于模型推理的动态神经网络。 哈姆扎·阿卜杜勒·阿齐兹 , 阿里·沙菲 , Jong Hoon Shin先生 , 阿尔达文·佩德拉姆 , 约瑟夫·哈松 :
重新思考混合精度DNN加速器的浮点开销。 布伦南·塞塔 , 丹尼斯·沙巴林 :
Swift for TensorFlow:一个便携式、灵活的深度学习平台。 杨一成 , Phitchaya Mangpo Phothilimthana公司 , 王毅苏(Yisu Remy Wang) , 马克斯·威尔西 , 苏迪普·罗伊 , 雅克·皮纳尔 :
张量图超优化的等式饱和。 杨伯文(Bowen Yang) , 张健 , 乔纳森·李 , 克里斯托弗·雷 , 克里斯托弗·阿贝格 , 克里斯托弗·德萨 :
PipeMare:异步管道并行DNN培训。 艾哈迈德·阿卜杜勒莫尼姆 , 艾哈迈德·埃尔扎纳蒂 , 穆罕默德·斯利姆·阿鲁尼 , 马可·卡尼尼 :
一种用于分布式训练系统的高效基于统计的梯度压缩技术。 贝诺伊·斯坦纳 , 克里斯·卡明斯 , 贺贺拉斯 , 休皮革 :
深度学习工作负载吞吐量优化的价值学习。 赛义德·马利基 , 穆苏瓦蒂夫人 , 托德·米特科维奇 , 奥利·萨里基维 , 徐天驹 , 瓦迪姆·埃克萨列夫斯基 , 贾利亚·埃卡纳亚克 , 埃马德·巴苏姆 :
使用自适应求和缩放分布式训练。 朱利奥·周 , 马丁·马斯 :
学习数据中心存储系统的分布式跟踪。 王宏毅 , 索拉布·阿加瓦尔 , Dimitris S.Papailiopoulos公司 :
河豚鱼:无需额外费用的高效沟通模型。 塞缪尔·考夫曼 , Phitchaya Mangpo Phothilimthana公司 , Yanqi Zhou公司 , 查里斯·门迪斯 , 苏迪普·罗伊 , 阿米特·萨本 , 迈克·伯罗斯 :
张量处理单元的学习性能模型。 邵怀石 , 周贤浩 , 宋树涛 , 王兴耀 , 朱子琳 , 薛煌 , 新疆 , 周飞虎 , 郭振宇 , 谢立强 , 瑞兰 , 咸滨欧阳 , 张燕(音译) , 洁前卫 , 精工 , 林伟良 , Ping Gao公司 , 彭蒙 , 徐晓敏 , 郭晨阳 , 柏杨 , 陈志波 , 吴永健 , 朱晓文 :
面向公共云集群上深度学习的可扩展分布式培训。 林云峰 , 桂林李 , 张兴 , 张卫南(Weinan Zhang) , 陈波(Bo Chen) , 唐瑞明 , 李振国 , 贾世峰 , Yong Yu(永余) :
ModularNAS:面向模块化和可重用的神经架构搜索。 池王 , 吴庆云 , 马库斯·魏默 , 二抗朱 :
FLAML:一个快速轻量级的AutoML库。 尹春星 , 舱底Acun , 卡罗尔·让·吴 , Xing Liu(刘星) :
TT-Rec:深度学习推荐模型的张量训练压缩。 岳照 , 西阳湖 , 程程 , 王聪(音) , 长林湾 , 王文(Wen Wang) , 杨佳宁 , 白浩平 , 郑丽 , 曹啸 , 王云龙 , 芝巧 , 孙继萌 , 莱曼·阿科格鲁 :
SUOD:加速大规模非监督异构异常检测。 Atli Kosson公司 , 维塔莉·奇利 , 阿比纳夫·维尼加拉 , 乔尔·赫斯特内斯 , 乌尔斯·科斯特 :
大规模流水线反向传播:无批训练大型模型。 俞培峰 , 刘嘉晨 , 莫沙拉夫·乔杜里 :
流体:资源软件超参数调整引擎。 科尔比·R·班伯里 , 楚滕州 , 伊戈尔·费多罗夫 , 拉蒙·马塔斯·纳瓦罗 , 乌尔米什·塔克尔 , 迪巴卡尔峡谷 , 维杰·贾纳帕·雷迪 , 马修·马蒂娜 , 保罗·N·沃特莫 :
MicroNets:用于在商品微控制器上部署TinyML应用程序的神经网络架构。 乌尔米什·塔克尔 , 保罗·N·沃特莫 , 刘志刚 , 马修·马蒂纳 , 杰西·博伊 :
掺杂:使用稀疏结构加法矩阵对LSTM模型进行极端压缩的技术。 马桂香 , 姚晓 , 西奥多·威尔克 , 内斯林·K·艾哈迈德 , 沙欣·纳扎里安 , 保罗·博格丹 :
多核系统中自动并行的分布式图论框架。 大卫·斯图兹 , 南迪尼·昌德拉穆蒂 , 马蒂亚斯·海因 , 伯恩特·席勒 :
高能DNN加速器的误码鲁棒性。 尚旺 , 杨培明 , 郑宇轩 , 辛莉(Xin Li) , Gennady Pekhimenko先生 :
水平融合训练阵列:用于训练新型深度学习模型的有效硬件利用挤压器。 埃亚尔·西登 , Evgenya Pergament公司 , 扎恩·阿斯加 , 阿萨夫·西登 , 萨钦·卡蒂 :
描述和控制边缘设备的模型不稳定性。 Kiwan Maeng先生 , 希瓦姆·巴鲁卡 , 伊莎贝尔·高 , 马克·杰弗里 , 维克拉姆萨拉夫 , 苏伯乐 , 卡罗琳·特里佩尔 , 杨纪艳 , 迈克·拉巴特 , 布兰登·露西亚 , 卡罗尔·让·吴 :
理解并改进部分恢复的深度学习建议的容错训练。 巴拉赞·巴拉吉 , 克里斯托弗·卡科维奇 , 巴拉克里什南·纳拉亚纳斯瓦米 :
FirePlace:放置Firecraker虚拟机和后视模拟。 王冠华 , 刘壮 , 谢国忠(Brandon Xieh) , 思源庄 , 约瑟夫·冈萨雷斯 , 特雷弗·达雷尔 , 离子斯托伊卡 :
sensAI:通过类并行性进行卷积网分解,用于实时数据的快速推理。 汤姆·班宁克 , 亚当·希利尔 , 卢卡斯·盖革 , 蒂姆·德布鲁因 , 利昂·奥弗维尔 , 杰默·内维尔 , 科恩·赫尔韦根 :
Larq计算引擎:设计、基准测试和部署最先进的二值化神经网络。 王冠华 , 王克汉 , 江克南(Kenan Jiang) , 李向军 , 离子斯托伊卡 :
小波:带时钟调度的高效DNN训练。 安德烈·伊万诺夫 , 尼科利·德莱登 , 塔尔·本努 , 李世刚 , 托尔斯滕·霍夫勒 :
数据移动是您所需要的:优化变压器的案例研究。 克里斯托夫·米勒 , 弗朗索瓦·塞雷 , 加甘迪普·辛格 , 马库斯·普舍尔 , 马丁·T·韦切夫 :
GPU上的缩放多面体神经网络验证。 泽维尔·布瑟利尔 , 皮埃尔·德劳奈 , 米尔科·布朗齐 , 阿西亚·特罗菲莫夫 , 布伦南·尼康波鲁克 , 司徒华 , 纳扎宁·穆罕默德·塞帕瓦德 , 爱德华·拉夫 , 卡尼卡·马丹 , 维克拉姆·沃莱蒂 , 萨米拉·埃布拉希米·卡胡 , 文森特·米查尔斯基 , 塔尔·阿贝尔 , 克里斯·帕尔 , 加勒·瓦罗佐 , 帕斯卡·文森特 :
机器学习基准中差异的解释。 纳塔莉·劳什梅尔 , 维卡斯·库马尔 , Rahul Huilgol公司 , 安德烈亚·奥尔贾蒂 , 萨塔达尔·巴塔查吉 , 尼哈尔·哈里什 , Vandana Kannan公司 , 阿莫尔·勒 , 阿尼鲁德·阿查里亚 , 杰瑞德·尼尔森 , 拉克希米·罗摩克里希南 , 伊斯汉·巴特 , Kohen Chia公司 , 内尔斯·多达 , 李志翰 , 顾嘉诚 , Miyong Choi先生 , 巴拉吉·纳加拉扬 , 杰弗里·格瓦尔盖塞 , 丹尼斯·达维登科 , 李思飞 , 陆晃 , 爱德华·金姆 , 泰勒山 , Krishnaram Kenthapadi公司 :
亚马逊SageMaker调试器:一个实时洞察机器学习模型训练的系统。 詹姆斯·格里森 , 莫西·加贝尔 , Gennady Pekhimenko先生 , 埃亚尔·德拉腊 , 斯利瓦桑·克里希南 , 维杰·贾纳帕·雷迪 :
RL-Scope:深度强化学习工作负荷的跨层分析。 罗伯特·戴维德 , 杰瑞德·杜克 , Advait耆那教 , 维杰·贾纳帕·雷迪 , 纳特·杰弗里斯 , 李健 , 尼克·克莱格 , 伊恩·纳皮尔 , 梅格纳·纳特拉杰 , 王铁珍 , 沃顿 , 洛矶罗兹 :
TensorFlow Lite Micro:TinyML系统的嵌入式机器学习。 康斯坦蒂诺斯·康斯坦蒂尼迪斯 , 阿迪蒂亚·拉莫尔西 :
ByzShield:一个高效且健壮的分布式训练系统。 纳丁·盖巴拉 , 曼亚·戈巴迪 , 保罗·科斯塔 :
共享机器学习集群的网络内聚合。 姜文琪(Wenqi Jiang) , 何振浩 , 张帅(Shuai Zhang) , 托马斯·B·普鲁(Thomas B.Preußer) , 曾凯(Kai Zeng) , 梁峰 , 张建松 , 刘彤萱 , 李勇 , 周敬仁 , 策张 , 古斯塔沃·阿隆索 :
MicroRec:硬件和数据结构解决方案的高效推荐推理。 Wakatsuki先生 , 塞基托希·卡奈 , 藤原康弘 :
加速用于视频分析的CNN推理,同时利用激活稀疏性保持准确性。 史蒂夫·戴 , Rangharajan Venkatesan先生 , 马克·伦 , 布莱恩·齐默 , 威廉·戴利 , 布鲁斯·凯拉尼 :
VS-Quant:用于精确低精度神经网络推断的全矢量量化。 Ettore M.G.Trainiti公司 , 塔纳蓬·诺拉塞特 , 大卫·德米特 , 道格·唐尼 , 西蒙·坎帕诺尼 :
代码:基于编译器的神经元感知集成训练。