“在小语言模型服务中实现帕累托最优吞吐量。”
Pol G.Recasens公司 , 岳朱 , 陈旺 , 李恩景(Eun Kyung Lee) , 奥利维尔·塔迪厄 , 阿拉·优素福 , 乔迪·托雷斯 , 约塞普·路易斯·贝拉尔 以下为:
小型语言模型服务中的Pareto最优吞吐量。 EuroMLSys@EuroSys 2024 以下为: 144-152
由于引用数据不可用,以下列表可能不完整, 引用字符串可能未成功映射到dblp中列出的项,并且 我们没有针对这些列表中给出的所有项目的完整和精心策划的元数据。
![](https://dblp.uni-trier.de/img/cog.dark.24x24.png)