{“状态”:“确定”,“消息类型”:“工作”,“信息版本”:“1.0.0”,“邮件”:{“索引”:{-“日期-部分”:[[2024,5,24]],“日期-时间”:“2024-05-24T00:17:08Z”,“时间戳”:1716509828681},“发布者位置”:“美国纽约州纽约市”,“引用-计数”:38,“发布商”:“ACM”,“内容-域”:[dl.ACM.org”],“交叉标记-严格离子“:true},”短容器时间“:[],“已发表的印刷品”:{“日期部分”:[[2024,4,22]]},“DOI”:“10.1145\/3642970.3655833”,“类型”:“议事录文章”,“已创建”:{“日期部分”:[[2024,4,19],“日期时间”:“2024-04-19T14:46:57Z”,“时间戳”:1713538017000},“更新策略”:“http:\/\/dx.DOI.org/10.1145\/crosmark policy”,“来源”:“Crossref”,“由计数引用”:0,“标题”:[“海绵”],“前缀”:“10.1145”,“作者”:[{“ORCID”:“http://\/ORCID.org\/0000-0002-3232-5657”,“authenticated-ORCID”:false,“给定”:“Kamran”,“family”:“Razavi”,“sequence”:“first”,“affiliation”:[}“name”:“Darmstadt科技大学”}]},{“ORCID”:“http://\-ORCID.org \/00000-0003-3799-5702”,“authenticated-ORCID“:false”,“give”:“Saeid”“,”family“:”Ghafouri“,”sequence“:“additional”,“affiliation”:[{“name”:“Queen Mary University of London”}]},{“ORCID”:“http://\/ORCID.org\/0000-0003-4713-5327”,“authenticated-ORCID”:false,“given”:”Max“,”family“:”M\u00fchlh\u00e4user“,”sequence“:”additional“,”affiliance“:[{name“:”Darmstadt Technical University for Darmstadd“}]},{”ORCID“:”http://\-ORCID.org 2-9342-0703“,“认证的虎鲸”:false,“给定的”:“Pooyan”,“家族”:“Jamshidi”,“序列”:“附加的”,“隶属关系”:[{“名称”:“南卡罗来纳大学”}]},{“orcid”:“http:\/\/orcid.org/0000-0001-718-6128”,“认证的虎鲸”:false,“给定的”:“Lin”,“家族”:“Wang”,“序列”:“附加的”,“隶属关系”:[{“名称”:“Paderborn大学”}]}],“成员”:“320”,“published-online”:{“date-parts”:[[2024,4,22]]},“reference”:[{“key”:“e_1_3_2_1_1_1”,“volume-title”:“USENIX网络系统设计与实现研讨会(NSDI).1063--1081”,“author”:“Ahmad Fawad”,“year”:“2020”,“unstructured”:“Fawad Ahmad,Hang Qiu,Ray Eells,Fan Bai,and Ramesh Govindan.2020”。CarMap:汽车快速3D特征地图更新。在USENIX网络系统设计与实现(NSDI)研讨会上。1063--1081.“},{”key“:”e_1_3_2_1_2_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1145\/1465482.1465560”},“key”:“e_1_ 3_2_1_3_1”,“unstructured”:“The Kubernetes Authors.2023。Kubernetes吊舱的就地资源调整。https:\/\/kubernetes.io\/blog\/2023\/05\/12\/in-place-pod-resize-alpha\/。(2023). 2024年1月30日访问。“},{”key“:”e_1_3_2_1_4_1“,”unstructured“:”The Kubernetes Authors.2024。Kubernetes水平吊舱自动缩放。https:\/\/kubernetes.io\/docs\/tasks\/run-application\/horizontal-pod-autoscale\/。(2024). 2024年1月30日访问。“},{”key“:”e_1_3_2_1_5_1“,”unstructured“:”The Kubernetes Authors.2024。Kubernetes垂直吊舱自动缩放。https:\/\/cloud.google.com/kubernetes-engine\/docs\/concepts\/verticalpodautoscaler\/。(2024). 2024年1月30日访问。“},{”key“:”e_1_3_2_1_6_1“,”unstructured“:”The Kubernetes Authors.2024。米尼库贝。https:\/\/minikube.sigs.k8s.io\/。(2024). 2024年1月30日访问。“},{“key”:“e_1_3_2_1_7_1”,“非结构化”:“普罗米修斯作者。2024。普罗米修斯监测和警报工具包。https:\/\/prometheus.io\/。(2024). 于2024年1月30日访问。“},{“key”:“e_1_3_2_1_8_1”,“volume-title”:“BigMEC:移动边缘计算的可扩展服务迁移。2022年IEEE\/ACM第七届边缘计算研讨会(SEC)。IEEE,136-148”,“author”:“Brandherm Florian”,“year”:“2022”,“unstructured”:“Florian Brandhern,Julien Gedeon,Osama Abboud,and Max M\u00fchlh\u00e4user.2022。BigMEC:移动边缘计算的可扩展服务迁移。2022年,IEEE \/ACM第七届边缘计算研讨会(SEC)。IEEE,136--148。“},{”key“:”e_1_3_2_1_9_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1109 \/HPCA51647.2021.00049”},“key”:“e_1_ 3_2_1_10_1”,“doi-assert-by”:“publisher”,”doi“:”10.1145 \/34111.3421285“}).613--627“,”作者“:”克兰肖·丹尼尔“,”“2017年”,“非结构化”:“丹尼尔·克兰肖、王欣、周吉利奥、迈克尔·富兰克林、约瑟夫·冈萨雷斯和伊恩·斯托伊卡。2017年,Clipper:一个{低延迟}在线预测服务系统。在USENIX网络系统设计与实现(NSDI)研讨会上。613--627.“},{”key“:”e_1_3_2_12_1“,”doi-asserted-by“:”publisher“,”doi“:”10.1145\/3419111.3421284“}”,{“key”:”e_ 1_3_2 _13_1“,“doi-assert-by”:“publisher”,“doi”:“10.1145\/358669.358692”},”{“key”:“e_1_ 3_2_14_1”,”doi-asserted-by“”:“publisher”,“doi”:”10.1109\/UC C56403.2022.00019“},{”键“:”e_1_3_2_1_15_1“,”卷时间“:”IPA:推理管道调整以实现高精度和成本效率。”,“作者”:“Ghafori Saeid”,“年份”:“2024”,“非结构化”:“Saeid Ghafori、Kamran Razavi、Mehran Salmani、Alireza Sanaee、Tania Lorido Botran、Lin Wang、Joseph Doyle和Pooyan Jamshidi。2024.IPA:推理管道调整以实现高精度和成本效率。(2024). arX输入:cs。DC\/2308.12871“},{”key“:”e_1_3_2_16_1“,”unstructured“:”grpc[n.d.].grpc.https:\/\/grpc.io.([n.d]).于2021年10月29日访问。“}”,{“key”:“e_1_ 3_2_17_1”,“doi-asserted-by”:“publisher”,”doi“:”10.1145\/3155974.3135993“}、{”key“:“e_ 3_2_2_18_1”、“volume-title”:“USENIX”操作系统设计与实现研讨会(OSDI).443-462“,”作者:“古吉拉特-阿潘”,“年份”:“2020年”,“非结构化”:“阿潘-古吉拉特邦、雷扎·卡里米、萨菲亚·阿尔扎亚特、魏浩、安托万·考夫曼、伊米尔·维格福森和乔纳森·梅斯。2020.像Clockwork一样服务DNN:自下而上的性能可预测性。在USENIX操作系统设计与实现(OSDI)研讨会上。443-462.“},{“键”:“e_1_3_2_1_19_1”,“卷标题”:“Prashanth Thinakaran,Bikash Sharma,Mahmut Taylan Kandemir,and Chita R Das.”,“作者”:“Gunasekaran Jashwant Raj”,“年份”:“2022”,“非结构化”:“Jashwant Raj Gunasekaran,Cyan Subhra Mishra,Prashanth Thinakaran,Bikash Sharma,Mahmut Taylan Kandemir,and Chita R Das.2022。鸡尾酒会:云服务模型的多维优化。在USENIX NSDI中。1041--1057.“},{“key”:“e_1_3_2_1_20_1”,“doi由”:“publisher”断言,“doi”:“10.1145\/3472883.4866993”},{“key”:“e_1_3_2_1_21_1”,“doi由”:“publisher”断言,“doi”:“10.1145\/34502638.3453521”},{“key”:“e_1_3_2_1_22_1”,“doi由”:“publisher”断言,“doi”:“10.1145\/2306362307658”},{“key”:“e_1_3_2_1_23_1“,”doi由“:”publisher“断言,”doi“:”10.1145\/3302424.3303958“},{“key”:“e_1_3_2_1_24_1”,“volume-title”:“2020年USENIX年度技术会议(USENIX-ATC'20)会议记录。USENIX-协会”,“作者”:“Keahey Kate”,“年份”:“2020年”,“非结构化”:“Kate Keahey,Jason Anderson,Zhou Zhen,Pierre Riteau,Paul Ruth,Dan Stanzione,Mert Cevik,Jacob Colleran,Haryadi S。Gunawi、Cody Hammock、Joe Mambretti、Alexander Barnes、Fran\u00e7ois Halbach、Alex Rocha和Joe Stubbs。2020年,变色龙试验台的经验教训。在2020年USENIX年度技术会议(USENIXATC’20)的会议记录中。USENIX协会。},{“key”:“e_1_3_2_1_25_1”,“volume-title”:“下一代虚拟个人助理(微软cortana、苹果siri、亚马逊alexa和谷歌主页)。2018年IEEE第八届年度计算与通信研讨会(CCWC)”,“作者”:“Kepuska Veton”,“非结构化”:“Veton Kepuska和Gamal Bohouta。2018。下一代虚拟个人助理(微软cortana、苹果siri、亚马逊alexa和谷歌主页)。2018年IEEE第八届年度计算与通信研讨会(CCWC)。IEEE,99-103.“},{”key“:”e_1_3_2_1_26_1“,”volume-title“:”第25届移动计算与网络国际年会。1-16.“,”author“:”Liu Luyang“,”unstructured“:”Luyang Li,Hongyu Li,and Marco Gruteser.2019。用于移动增强现实的边缘辅助实时目标检测。在第25届移动计算和网络国际年会上。1--16.“},{”key“:”e_1_3_2_1_27_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1109 \/RTSS55097.2022.00032”},“key”:“e_1_ 3_2_1_2 8_1”,“doi-assert-by”:“publisher”,”doi“:”10.1109 \/RTAS54340.2022.00020“}ENIX年度技术会议(ATC).397--411“,“作者”:”Romero Francisco”,“年份”:“2021年”,“非结构化”:“Francisco-Romero,Qian Li,Neeraja J Yadwadkar,and Christos Kozyrakis。2021.INFaaS:自动化无模型推理服务。在USENIX年度技术会议(ATC)上。397--411.“},{”key“:”e_1_3_2_1_30_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1145 \/3472883.3486972”},“key”:“e_1_ 3_2_1_1_31_1”,“doi-assert-by”:“publisher”,“doi:”10.1145 \/3578356.3592578“}”,{3341301.3359658“},{”key“:”e_1_3_2_1_33_1“,”unstructured“:”ultralytics.2024。YOLOv5.https:\/\/github.com/ultralytics\/YOLOv5。(2024). 2024年1月30日访问。“},{”key“:”e_1_3_2_1_34_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1109\/LCOMM.2016.2601087”},“key”:“e_1_a_2_1_35_1”,“volume-title”:“全球在线服务的服务器容量净空。IEEE分布式计算系统国际会议(ICDCS).645-659”,“author”:“Verbowski Chad”,“year”:“2018”,“非结构化”:“Chad Verbowski、Ed Thayer、Paolo Costa、Hugh Leather和Bj\u00f6rn Franke。2018.全球在线服务的服务器容量净空。在IEEE分布式计算系统国际会议(ICDCS)上。645--659.“},{“key”:“e_1_3_2_1_36_1”,“doi由”断言:“publisher”,“doi”:“10.1145\/3387514.3405882”},{“key”:“e_1_3_2_37_1”,“volume title”:“Mark:利用云服务提供经济高效、SLO感知的机器学习推理服务。2019年{USENIX}年度技术会议({USENIX}{ATC}19)。1049--1062.”,“作者”:“张成亮”,“年份”:“2019年”,“非结构化”:“张成亮、俞敏臣、王伟、冯燕。2019.Mark:利用云服务实现经济高效的SLO软件机器学习推理服务。2019年{USENIX}年度技术会议({USENIX}{ATC}19)。1049--1062.“},{“key”:“e_1_3_2_1_38_1”,“volume-title”:“模型切换:处理机器学习即服务系统中波动的工作负载。第十二届{USENIX}云计算热点研讨会(HotCloud 20)。“,”author“:”Zhang Jeff“,”year“:”2020“,”unstructured“:”Jeff Zhang、Sameh Elnikety、Shuayb Zarar、Atul Gupta和Siddharth Garg.2020。模型切换:处理机器学习即服务系统中波动的工作负载。在第12届{USENIX}云计算热点研讨会(HotCloud 20)上。“}],”event“:{”name“:”EuroSys'24:第十九届欧洲计算机系统会议“,”location“:”Athens Greece“,”缩写词“:”EuroSys'24“,”赞助商“:[”SIGOPS ACM操作系统特别兴趣小组“]},”container-title“:[“机器学习与系统第四次研讨会论文集”],”original-title”:[],”link“:[{”URL“:”https:\/\/dl.acm.org\/doi\/pdf\/10.1145\/3642970.3655833“,”content-type“:”unspecified“,”content-version“:”vor“,”intended-application“:”similarity-checking“}],”deposed“:{”date-parts“:[[2024,5,23]],”date-time“:“2024-05-23T14:31:08Z”,”timestamp“:1716474668000},”score“:1,”resource“:”{“primary”:{“URL”:“https:\/\/dl.acm.org\/doi\/10.1145\/3642970.3655833“}},”副标题“:[”使用In-Place垂直缩放为动态SLO提供推断服务“],”短标题“:[],”已发布“:{”日期部分“:[[2024,4,22]]},“references-count”:38,“alternative-id”:[“10.1145\/36429.70.3655933”,“10.1145\/3642970”],“URL”:“http://\/dx.doi.org \/10.1145\/3642970.3655833“,”关系“:{},”subject“:[],”published“:{“date-parts”:[[2024,4,22]]},”assertion“:[{“value”:“2024-04-22”,“order”:2,“name”:“published”,“label”:“published”,“group”:{”name“:”publication_history“,”label“:”publication history“}}]}