EMNLP 2023: 新加坡
王明轩 , 伊梅德·齐图尼 :
2023年自然语言处理实证方法会议记录:EMNLP 2023-行业跟踪,新加坡,2023年12月6日至10日。 计算语言学协会 2023 前沿问题。 曹廷峰 , 王成玉 , 刘冰燕 , 吴子亨 , 朱金辉 , 黄军(Jun Huang) :
BeautifulPrompt:面向文本到图像合成的自动提示工程。 1-11 毛晨辉 , 谢松林 , 新晋 , 张欣(Xin Zhang) :
用单元测试技术增强语言模型,实现高效的正则表达式生成。 12-19 Takuma Udagawa先生 , 阿什卡·特里维迪 , 米歇尔·梅勒 , 比什瓦兰詹·巴塔查吉 :
用于压缩变压器语言模型的任务认知提取方法的比较分析。 20-31 张彤(音译) , 刘俊红 , 陈晃 , 贾刘 , 梁洪茹 , Zujie Wen先生 , 雷文强 :
实现具有人格意识的有效自动债务催收。 32-45 尼迪·蒂瓦里 , 斯内哈·科拉 , 米洛斯·米卢诺维奇 , 陈思青(Si-qing Chen) , 马尔扬·斯拉夫科夫斯基 :
守门人可以节省COGS并提高文本预测的效率。 46-53 内森·布朗 , 阿什顿·威廉姆森 , 塔赫·安德森 , 洛根·劳伦斯 :
高效变压器知识提取:性能回顾。 54-65 《长征集》 , 张亚廷 , 亚当·贾托特 , 吴海鹏 :
CDD:法律情报研究的大规模数据集。 66-73 无标题 :
MUST&P-SRL:语音表征学习中文本和语音领域的多语言统一音节化。 74-82 马沙·贝尔伊 , 夏洛特·齐亚洛 , Chaitanya Dwivedi公司 , 普拉吉特·穆皮迪 , 清水康娜 :
语音会话系统全局索引的个性化密集检索。 83-92 王凤军 , 莫兰·贝拉德夫 , 奥夫里·克莱菲尔德 , 艾琳娜·弗雷曼 , 塔尔·沙查尔 , 埃兰·法曼 , 卡伦·拉斯特曼·阿萨拉夫 , 萨拉伊·米兹拉奇 , 本杰明·王 :
Text2Topic:多标签文本分类系统,用于在具有零镜头功能的用户生成内容中进行高效的主题检测。 93-103 Kee Kiat Koo先生 , 阿舒托什·乔希 , 尼沙安特·雷迪 , 卡里姆·布亚尔马内 , 伊斯梅尔·B·图塔 , 瓦茨拉夫·佩特里切克 , 昌河苑 :
深度度量学习到层次排序-在产品检索中的应用。 104-112 Youngja公园 , 魏秋友 :
网络威胁情报的预训练语言模型。 113-122 荣天 , 赵紫晶 , 刘伟杰 , 刘浩燕 , 毛伟全 , Zhe Zhao(赵哲) , Kan Zhou公司 :
SAMP:通过自适应混合精度进行文本处理的训练后量化模型推理工具包。 123-130 桑杰·阿格拉瓦尔 , 维维克·塞姆比姆 , Ankith M.S公司 :
KD-Boost:通过知识提取促进电子商务中的实时语义匹配。 131-141 张静芬 , 宣国 , 斯拉文·博达帕蒂 , 克里斯托弗·波茨 :
用于多语言拼写更正的多教师提取。 142-151 魏特陈 , Keiji Shinzato公司 , 直纪吉祥 , 炎帝夏 :
命名实体识别真的不能扩展到现实世界的产品属性提取吗? 152-159 赵一伦 , 张浩伟 , 圣云寺 , 林永南 , 香乳汤 , 阿曼·科汉 :
研究现实世界信息搜索场景中大型语言模型的表到文本生成能力。 160-175 同心湖 , 庄莉(音) , 新晋 , 曲丽珍 , 张欣(Xin Zhang) :
TMID:电子商务中商标侵权检测的综合现实世界数据集。 176-184 刘正元 , Siti Umairah马里兰州Salleh , Hong Choon噢 , 帕维特拉·克里希纳斯瓦米 , 南希·F·陈 :
联合对话主题分割与分类:临床口语对话的个案研究。 185-193 王俊杰 , 陈一成 , 张望舒 , 胡森(Sen Hu) , 滕旭(Teng Xu) , 京正 :
适配器蒸馏:利用知识蒸馏进行非破坏性任务合成。 194-201 王玉庆(Yuqing Wang) , Prashanth Vijayaraghavan公司 , 埃森·德甘 :
PROMINET:基于原型的多视图网络,用于可解释的电子邮件响应预测。 202-215 贾斯汀·邱 :
用于产品匹配的检索增强型双编码器培训。 216-222 何俊彦 , Zhi-Qi Cheng先生 , 李晨阳 , 孙京东 , 王梦香 , 林贤惠 , 晓阳康 , 曾科金 , 胡玉森 , Bin Luo(罗斌) , 耿一峰 , 谢玄松 :
艺术字设计师:使用大型语言模型进行用户驱动的艺术排版合成。 223-232 Nobuhiro Kaji先生 :
Lattice Path编辑距离:一种罗马化的编辑距离,用于从日语搜索查询日志中提取拼写错误校正对。 233-242 彭志高 , 张丽文 , 何忠军 , 华武 , 王海峰 :
跨语言一致性规则化学习多语言句子表征。 243-262 乔西安·范·多普 , 扎卡里·杨 , 尼古拉斯·格伦诺·戈布特 , 格雷戈伊尔·温特斯坦 :
揭示毒性检测中的身份偏见:以游戏为中心的数据集和反应性分析方法。 263-274 林玉成 , 司理人张提姆 , Yaning Chang公司 , 马建强 , 李东辉 , 丁鹏 , 臧丽 , 周志毅 , 王峰(音) :
橙色:通过Watch-time-ware异构图形对比学习进行文本-视频检索。 275-283 克里斯托弗·希迪 , 萨塔克·萨塔克 :
会话代理的计算效率流失减少。 284-293 杨芳凯 , Pu Zhao先生 , 王泽忠 , 卢旺(Lu Wang) , 薄乔 , 觉章 , 莫希特·加格 , 林庆伟 , 萨拉万·拉杰莫汉 , 张冬梅 :
增强大型语言模型在工业领域特定问题解答方面的性能。 294-312 李丹(Dan Li) , 朱子龙 , 詹妮克·范德鲁 , 阿格尼斯·马斯普·戈麦斯 , 维克兰·雅达夫 , 乔治奥·萨萨罗尼斯(Georgios Tsatsaronis) , 祖拜尔·阿夫扎尔 :
增强极端多标签文本分类:解决模型、数据和评估方面的挑战。 313-321 叶成灿 , 丁鹏 , 司理人张提姆 , 周志毅 , 王峰(音) :
视频搜索中基于查询软件多模式的排名相关性。 322-330 杰克·古德 , 吉米特·马朱达尔 , 克里斯托弗·杜普伊 , 王季萱 , Charity Peris公司 , 克莱门特·钟 , 理查德·泽梅尔 , 古普塔 :
连续联合学习的协调重放样本选择。 331-342 Tahmid Rahman Laskar马里兰州 , 薛永福 , 程晨 , Shashi Bhushan田纳西州 :
使用大型语言模型构建现实世界会议摘要系统:一个实用的观点。 343-352 斯珀提·安巴·洪比亚 , 陈涛(Tao Chen) , 张明扬(Mingyang Zhang) , 迈克尔·本德斯基 , 马克·纳沃克 , 马特·科伦 , 谢尔盖·李维 , 弗拉基米尔·奥菲瑟罗夫 , 坦维尔·阿明 :
推文推荐的创建者上下文。 353-363 Tyler Vuong公司 , 卡雷尔·蒙德尼奇 , 达努什·贝卡尔 , Veera Raghavendra Elluru女士 , 斯里坎思·罗南基 , 斯拉文·博达帕蒂 :
AdaBERT-CTC:利用BERT-CTC进行ASR中的纯文本域适配。 364-371 丹尼斯·科切迪科夫 , 尹凤林 , Sreevidya Khatravath公司 :
与数据库的对话:实用的自然语言查询。 372-379 巴克蒂普利亚·拉德哈拉普 , 凯文·罗宾逊 , 洛拉·阿罗约 , 普雷西·拉霍蒂 :
AART:AI支持的Red-Teaming,为新的LLM驱动应用程序生成多种数据。 380-395 德鲁夫·库马尔 , Vipul Raheja公司 , 爱丽丝·凯泽·沙兹林 , 罗宾·佩里 , 阿普瓦·乔希 , 贾斯汀·胡格斯·努格 , 塞缪尔·卢 , 纳维德·乔杜里 :
演讲者:基于语音的文本写作助手。 396-407 李宪之 , Samuel Chan(塞缪尔·陈) , 朱晓丹 , 裴玉龙 , 马志强 , 刘晓默 , 萨米娜·沙阿 :
ChatGPT和GPT-4是金融文本分析的通用解决方案吗? 几个典型任务的研究。 408-422 孙仲恺 , 赵正阳 , 四星路 , 马成元 , 刘晓虎 , 邢凡 , 魏慎 , 郭晨雷 :
CL-QR:多语言会话人工智能代理的跨语言增强查询重构。 423-431 孙仲恺 , 周映雪 , 杰浩 , 邢凡 , 盐滨路 , 马成元 , 魏慎 , 郭晨雷 :
通过用户-引用反馈学习改进对话型人工智能代理的上下文查询重写。 432-439 Bhavuk Singhal公司 , 信杜贾·戈帕兰 , 阿默里斯·克里希纳 , 马洛兰·切特勒 :
泰米尔语数字和时间表达的神经ITN缩放:一种凝集性低源语言的发现。 440-450 加布里埃尔·科恩 , 里希卡·阿加瓦尔 , Deepanshu Gupta公司 , Siddharth Patwardhan先生 :
EELBERT:通过动态嵌入的微小模型。 451-459 哈斯莫特·阿里 , AKM Shahariar Azad拉比 , Majedul Islam马里兰州 , A.k.m马哈茂德 , 纳兹穆尔·哈桑 , 福阿德·拉赫曼 :
金标准孟加拉语OCR数据集:深入研究数据预处理和注释过程。 460-470 振廷奇 , 谭晓宇 , 史少杰 , Chao Qu公司 , 徐英辉 , 袁琦 :
枕头:通过快速匹配增强高效的指令微调。 471-482 利拉赫·伊登 , 尤夫·坎特 , 马坦·奥巴赫 , 尤夫·卡茨 , 诺姆·斯隆 , 罗伊·巴尔·海姆 :
欢迎来到真实世界:高效、增量和可扩展的关键点分析。 483-491 哈迪尔·萨达尼 , 康斯坦丁·奥拉桑 :
自动将判决与英国最高法院听证会联系起来。 492-500 王志平 , 彭林 , 海南张 , 陈洪深 , 李天豪 , 卓业鼎 , 徐素龙 , 《精河湖》 :
电子商务自动营销主题与商品构建系统。 501-508 井上雄培 , Minh-Tien Nguyen女士 , Hiroki Mizokuchi先生 , Tuan Anh D.Nguyen先生 , Huu Hiep Nguyen先生 , 敦乐 :
走向更安全的操作:防止未来故障的高压气体事故专家数据集。 509-521 原州瑶 , 赵章 , 杨凯嘉 , 梁华生 , 强艳(Qiang Yan) , 徐永军 :
一种辅助任务增强的多任务学习方法,用于有限人工注释的服务帐户检索。 522-531 思玉安 , 叶柳 , 彭浩源 , 地音 :
VKIE:关键信息提取在视频文本中的应用。 532-540 瓦伦·内森 , 阿尤什·库马尔 , 吉森德拉·维帕 :
调查不流利对总结的作用和影响。 541-551 Sandeep Sricharan Mukku公司 , 马南·索尼 , 切坦·阿加瓦尔 , Jitenkumar拉纳 , Promod Yenigalla公司 , 拉什米·帕坦热 , 希亚姆·莫汉 :
InsightNet:基于客户反馈的结构化洞察力挖掘。 552-566 卡兰·辛拉 , 金妍君 , 斯里尼瓦斯·班加罗尔 :
虚拟代理的E2E口语实体提取。 567-574 安塞尔?布鲁姆 , 纳赛尔·扎尔穆特 , 恒基 , 西安丽 :
产品属性提取的生成模型。 575-585 Rashad Al Hasan Rony医生 , 克里斯蒂安·苏伊斯 , 辛卡娜·拉马坎特学院 , 维州苏地 , 朱莉娅·施奈德 , 马克西米利安·沃格尔 , 罗马提契尔 , 肯·弗里德尔 , Soumya R.Sahoo公司 :
汽车专家:利用大型语言模型进行车内对话问答。 586-604 安德烈亚·祖加里尼 , 安德鲁·扎迈 , 马可·欧南德斯 , 莱昂纳多·里古蒂尼 :
BUSTER:一个“商业交易实体识别”数据集。 605-611 列奥尼达斯·基 , 莱昂纳多·里古蒂尼 , 马可·欧南德斯 , 安德烈亚·祖加里尼 :
用于序列压缩的多字令牌化。 612-621 刘尚清 , 王胜坤 , 张宗耀 , 林文琪 , 钟伟雄 , 谢义珍 , 程玉平 , 西安洪洛 , 张建伟 :
JarviX:一个用于表格数据分析和优化的LLM无代码平台。 622-630 赛·穆拉利达尔·贾扬蒂 , 德旺·库尔什塔(Devang Kulshreshtha) , 萨基特·丁利瓦尔 , 斯里坎思·罗南基 , 斯拉文·博达帕蒂 :
检索和复制:将ASR个性化扩展到大型目录。 631-639 Leon Liyang Zhang先生 , 陆家瑞 , 乔尔·鲁本·安东尼·莫尼兹 , 阿迪蒂亚·库尔卡尼 , 迪维亚·皮拉维佩鲁马尔 , Tien Dung Tran公司 , 尼克·佐 , 洪宇 :
STEER:语音助理的语义转向扩展识别。 640-649 谭晓宇 , 史少杰 , 西合秋 , Chao Qu公司 , 振廷奇 , 徐英辉 , 袁琦 :
自我批评:将大型语言模型与他们对帮助、诚实和无害的理解结合起来。 650-662 贝斯尼克·费塔胡 , 陈志宇 , 奥列格·罗克伦科 , 谢文·马尔马西 :
指令PTS:指令-调整LLM以进行产品标题摘要。 663-674 王磊(Lei Wang) , 张松恒 , 王云(Yun Wang) , 林依鹏 , 王勇(音) :
LLM4Vis:使用ChatGPT的可解释可视化建议。 675-692 克里蒂·阿加瓦尔 , 阿迪蒂·坎德瓦尔 , 库马尔·坦马 , 奥瓦伊斯·汗·穆罕默德 , 刘强(音) , Monojit Choudhury公司 , Hardik Hansrajbhai Chauhan先生 , Subhojit Som公司 , 维什拉夫·乔杜里 , Saurabh Tiwary公司 :
都柏林:通过语言图像网络理解可视化文档。 693-706 于丽君 , 金苗 , 孙晓宇 , 陈嘉怡 , 亚历山大·豪普特曼 , 戴汉军 , 魏伟 :
DocumentNet:在文档预培训中弥合数据差距。 707-722 Jihyuk Kim先生 , 金民秀 , Joonsuk公园 , Seung won Hwang(黄承元) :
用于鲁棒零炮检索的相关辅助生成。 723-731 雅利安耆那教 , Jitenkumar拉纳 , 切坦·阿加瓦尔 :
产品信息太多:别担心,让我们寻找证据! 732-738 Yu Xinli , 郑晨 , 盐滨路 :
利用LLM获取时间数据——可解释金融时间序列预测研究。 739-753 Minh Thuan Nguyen女士 , Khanh-Tung Tran公司 , Nhu-Van Nguyen公司 , 宣孙武 :
ViGPTQA-越南问答的最先进LLM:系统概述、核心模型培训和评估。 754-764 Jinkyung Jo公司 , Dayeon Ki公司 , 小提琴家尹昭泳 , Minjoon Seo先生 :
韩国天气数据综合搜索系统。 765-774 李明明 , 袁春元 , 王惠木(Huimu Wang) , 王鹏(音译) , 卓敬伟 , 王斌斌(Binbin Wang) , 林刘(Lin Liu) , 徐素龙 :
深度语义检索的自适应超参数学习。 775-782 霍杰·韩 , 金宇进(Yu Jin Kim) , Byoungjip Kim先生 , 李永元 , Kyungjae Lee(李京杰) , Kyungmin Lee(李京民) , Moontae Lee公司 , 京勋拜 , Seung-won黄 :
关于高效样本代码生成。 783-791 周俊成 , Jungo Kasai公司 , 陶瑜 :
批量提示:使用大型语言模型API进行高效推断。 792-810 郑晨 , 姜紫嫣 , 范扬 , 尤纳·乔 , 邢凡 , 黄晓江 , 卢彦斌 , Aram Galstyan公司 :
Graph Meets LLM:一种新的协作过滤方法,用于增强会话理解。 811-819 大卫·Q·孙 , 阿特姆·阿卜扎利耶夫 , 哈达斯·科特克 , 克里斯托弗·克莱恩 , 子弟秀 , 杰森·威廉姆斯 :
DELPHI:用于评估LLM在处理有争议问题方面的表现的数据。 820-827 赛富尔·哈克 , 阿舒托什·夏尔马 , 普什巴克·巴塔查里亚 :
天使:非营利行业的企业搜索系统。 828-835
![](https://dblp.dagstuhl.de/img/cog.dark.24x24.png)