“ReLU反击:在大型语言模型中利用激活稀疏性。”
伊曼·米尔扎德 , 凯文·阿利扎德 , 萨钦·梅塔 , 卡洛·德尔·蒙多 , Oncel Tuzel公司 , Golnoosh萨美 , 穆罕默德·拉斯特加里 , Mehrdad Farajtabar公司 :
ReLU反击:在大型语言模型中利用激活稀疏性。 CoRR公司 abs/2310.04564 ( 2023 )
由于引用数据不可用,以下列表可能不完整, 引用字符串可能未成功映射到dblp中列出的项,并且 我们没有针对这些列表中给出的所有项目的完整和精心策划的元数据。
![](https://dblp.dagstuhl.de/img/cog.dark.24x24.png)