阿比纳夫·拉奥
人员信息
优化列表
2020年–今天
2024 【c2】 阿比纳夫·拉奥 , 阿塔瓦·奈克 , 萨钦·瓦希斯塔 , 索马克·阿迪蒂亚 , Monojit Choudhury公司 :
欺骗LLM使其不服从:正规化、分析和检测越狱。 LREC/冷却 2024 : 16802-16830 [i6] 阿比纳夫·拉奥 , 阿希拉·叶鲁科拉 , 维什瓦·沙阿 , 凯萨琳娜·雷内克 , 马尔滕·萨普 :
NORMAD:衡量大型语言模型的文化适应性的基准。 CoRR公司 腹肌/240412464 ( 2024 ) [i5] 阿比纳夫·拉奥 , Monojit Choudhury公司 , 索马克·阿迪蒂亚 :
越狱悖论:LLM的致命弱点。 CoRR公司 abs/2406.12702 ( 2024 ) 2023 【c1】 阿比纳夫·拉奥 , 阿迪蒂·坎德瓦尔 , 库马尔·坦马 , 乌特卡什·阿加瓦尔 , Monojit Choudhury公司 :
道德结盟的伦理推理:LLM中上下文伦理政策的案例和框架。 EMNLP(调查结果) 2023 : 13370-13388 [i4] 阿比纳夫·拉奥 , 萨钦·瓦希斯塔 , 阿塔瓦·奈克 , 索马克·阿迪蒂亚 , Monojit Choudhury公司 :
欺骗LLM使其不服从:理解、分析和防止越狱。 CoRR公司 abs/2305.14965 ( 2023 ) [i3] Sidharth Anand公司 , 巴沙·米特拉 , 苏米亚迪普·德伊 , 阿比纳夫·拉奥 , 鲁普萨·达尔 , 贾迪埃普·维迪亚 :
MALITE:约束设备的轻量级恶意软件检测和分类。 CoRR公司 abs/2309.03294 ( 2023 ) [i2] 阿比纳夫·拉奥 , 阿迪蒂·坎德瓦尔 , 库马尔·坦马 , 乌特卡什·阿加瓦尔 , Monojit Choudhury公司 :
道德结盟的伦理推理:LLM中上下文伦理政策的案例和框架。 CoRR公司 abs/2310.07251 ( 2023 ) 2022 [i1] 阿比纳夫·拉奥 , Thi-Nga Ho公司 , Eng Siong Chng先生 :
新加坡口语标点符号恢复:英语、马来语和普通话。 CoRR公司 abs/2212.05356 ( 2022 )