作者：科洛萨，多萝西娅：搜索

研究论文

开放式访问

创作：利用特定模型指纹对合成图像的检测和属性

MAD’24：第三届ACM多媒体人工智能反信息国际研讨会会议记录2024年6月，第65-72页https://doi.org/10.1145/3643491.3660280

随着越来越容易访问大型预处理文本到图像模型，可以观察到大量合成图像，这些图像通常在视觉上与自然图像无法区分。由于自然主义，合成图像可能被误认为是自然的。。。

研究论文

语音清晰度的微观和盲预测：理论与实践

IEEE/ACM音频、语音和语言处理汇刊（TASLP），第30卷第2141–2155页https://doi.org/10.109/TASLP.2022.3184888

能够在不需要听力测试的情况下估计语音可懂度，将为广泛的语音处理应用带来巨大的好处。因此，已经做出了许多尝试来引入一个客观的、理想的无参考文献。。。

研究论文

Imperio:自动语音识别系统的鲁棒空中对抗示例

ACSAC’20：第36届计算机安全应用年会论文集2020年12月，第843-855页https://doi.org/10.1145/3427228.34272776

自动语音识别（ASR）系统可以通过有针对性的对抗性示例被愚弄，这些示例诱导ASR生成任意转录，以响应更改的音频信号。然而，最先进的对抗性示例通常必须。。。

研究论文

基于动态流权重的非线性动态系统的音像说话人跟踪

IEEE/ACM音频、语音和语言处理汇刊（TASLP），第28卷第1065-1078页https://doi.org/10.109/TASLP.2020.2980974

数据融合在许多需要有效处理多模态感官观测的技术应用中发挥着重要作用。一个突出的例子是视听信号处理，它在自动语音。。。

研究论文

基于空间分离的联合声事件检测与定位

IEEE/ACM音频、语音和语言处理汇刊（TASLP），第28卷第487-502页https://doi.org/10.109/TASLP.2019.2958408

声音的识别和定位都是计算听觉场景分析的组成部分。虽然每一个问题都可以单独解决，但形成连贯的听觉对象和实现全面的空间场景理解的目标。。。

摘要

CORA，基于协作演讲的按需十字路口助理原型

AutomotiveUI’19：第11届汽车用户界面和交互式车辆应用国际会议论文集：附属论文集2019年9月，第483-488页https://doi.org/10.1145/3349263.3349599

我们展示了第一个基于语音的高级驾驶员辅助原型。它基于我们之前提出的用于驾驶员与其车辆之间交互的按需通信概念。使用此概念，驾驶员可以灵活地。。。

研究论文

个性化在基于演讲的左转助手环境中的优势

2017年AutomotiveUI：第九届汽车用户界面和交互式车辆应用国际会议记录2017年9月，第193-201页https://doi.org/10.1145/312986.3123004

我们之前已经在基于城市语音的左转辅助的背景下引入了一种新的按需辅助（AOD）概念，该概念通过提供合适的进入时间间隔建议来支持驾驶员进行监控和决策。。。

研究论文

基于听觉感知和语言理解的改进音频验证码

ACM隐私与安全交易（TOPS），第19卷，第4期条款编号：10,第1-31页https://doi.org/10.1145/2856820

一种所谓的完全自动化的公共图灵测试，将计算机和人类区分开来（CAPTCHA），代表了一种在互联网上广泛使用的挑战-响应测试，用于区分人类用户和欺诈计算机程序，通常被称为。。。

研究论文

SkypeLine公司：VoIP的稳健隐藏数据传输

亚洲CCS’16：第11届ACM亚洲计算机和通信安全会议记录2016年5月，第877–888页https://doi.org/10.1145/2897845.2897913

互联网审查制度在世界许多地区被用来禁止自由访问在线信息。不同的技术，如IP地址或URL阻止、DNS劫持或深度数据包检查，用于阻止对特定内容的访问。。。

文章

基于HMM的耦合视听语音识别中动态流权重的学习

IEEE/ACM音频、语音和语言处理汇刊（TASLP），第23卷，第5期第863-876页https://doi.org/10.1109/TASLP.2015.2409785

随着多媒体数据在通信技术中的日益广泛使用，将视觉信息用于自动语音识别（ASR）的想法最近得到了发展。结合声学信息，视觉数据。。。

笔记

利用人机差异构建安全的音频验证码

CHI'15：第33届ACM计算机系统人为因素年会会议记录2015年4月，第2335–2338页https://doi.org/10.1145/2702123.2702127

为了防止滥用互联网服务，CAPTCHA用于将人类与基于音频的方案有利于支持视障人士的程序区分开来。以前的研究表明，大多数音频验证码，尽管对人类来说很难解决，但。。。

研究论文

使用自动语音识别攻击声学CAPTCHA：可用性和安全性之间的权衡

ACSAC’14：第30届年度计算机安全应用会议记录2014年12月，第276-285页https://doi.org/10.1145/2664243.2664262

防止互联网服务自动滥用的一种常见方法是利用挑衅响应测试来区分人类用户和机器。这些测试称为验证码(告诉计算机和人类的全自动公共图灵测试。。。

文章

多通道去噪和降噪的变分贝叶斯推断

IEEE/ACM音频、语音和语言处理事务（TASLP），第22卷，第8期第1320–1335页https://doi.org/10.1109/TASLP.2014.2329732

室内混响和背景噪音严重降低了免提语音通信系统的质量。在这项工作中，我们使用变分贝叶斯（VB）推理解决了语音去噪和降噪的组合问题。。。

应用的筛选器

人

姓名

机构

作者

出版物

期刊/杂志名称

会议记录/书名

所有出版物

内容类型

补充材料类型

媒体格式

出版商

会议

赞助商

会议活动

诉讼系列

出版日期

创作：利用特定模型指纹对合成图像的检测和属性

语音清晰度的微观和盲预测：理论与实践

Imperio:自动语音识别系统的鲁棒空中对抗示例

基于动态流权重的非线性动态系统的音像说话人跟踪

基于空间分离的联合声事件检测与定位

即将召开的会议

CORA，基于协作演讲的按需十字路口助理原型

个性化在基于演讲的左转助手环境中的优势

基于听觉感知和语言理解的改进音频验证码

SkypeLine公司：VoIP的稳健隐藏数据传输

基于HMM的耦合视听语音识别中动态流权重的学习

利用人机差异构建安全的音频验证码

使用自动语音识别攻击声学CAPTCHA：可用性和安全性之间的权衡

多通道去噪和降噪的变分贝叶斯推断

应用的筛选器

人

姓名

机构

作者

出版物

期刊/杂志名称

会议记录/书名

所有出版物

内容类型

补充材料类型

媒体格式

出版商

会议

赞助商

会议活动

诉讼系列

出版日期

保存到活页夹

即将召开的会议