保存此搜索
研究论文 2024年6月 创作:利用特定模型指纹对合成图像的检测和属性 随着越来越容易访问大型预处理文本到图像模型,可以观察到大量合成图像,这些图像通常在视觉上与自然图像无法区分。 由于自然主义,合成图像可能被误认为是自然的。。。 研究论文 2022年6月 语音清晰度的微观和盲预测:理论与实践 能够在不需要听力测试的情况下估计语音可懂度,将为广泛的语音处理应用带来巨大的好处。 因此,已经做出了许多尝试来引入一个客观的、理想的无参考文献。。。 研究论文 2020年12月 Imperio:自动语音识别系统的鲁棒空中对抗示例 自动语音识别(ASR)系统可以通过有针对性的对抗性示例被愚弄,这些示例诱导ASR生成任意转录,以响应更改的音频信号。 然而,最先进的对抗性示例通常必须。。。 研究论文 2020年4月 基于动态流权重的非线性动态系统的音像说话人跟踪 数据融合在许多需要有效处理多模态感官观测的技术应用中发挥着重要作用。 一个突出的例子是视听信号处理,它在自动语音。。。 研究论文 2019年12月 基于空间分离的联合声事件检测与定位 声音的识别和定位都是计算听觉场景分析的组成部分。 虽然每一个问题都可以单独解决,但形成连贯的听觉对象和实现全面的空间场景理解的目标。。。 -
摘要 2019年9月 CORA,基于协作演讲的按需十字路口助理原型 AutomotiveUI’19:第11届汽车用户界面和交互式车辆应用国际会议论文集:附属论文集 2019年9月, 第483-488页 https://doi.org/10.1145/3349263.3349599 我们展示了第一个基于语音的高级驾驶员辅助原型。 它基于我们之前提出的用于驾驶员与其车辆之间交互的按需通信概念。 使用此概念,驾驶员可以灵活地。。。 研究论文 2017年9月 个性化在基于演讲的左转助手环境中的优势 我们之前已经在基于城市语音的左转辅助的背景下引入了一种新的按需辅助(AOD)概念,该概念通过提供合适的进入时间间隔建议来支持驾驶员进行监控和决策。。。 研究论文 2016年11月 基于听觉感知和语言理解的改进音频验证码 一种所谓的完全自动化的公共图灵测试,将计算机和人类区分开来(CAPTCHA),代表了一种在互联网上广泛使用的挑战-响应测试,用于区分人类用户和欺诈计算机程序,通常被称为。。。 研究论文 2016年5月 SkypeLine公司 :VoIP的稳健隐藏数据传输 互联网审查制度在世界许多地区被用来禁止自由访问在线信息。 不同的技术,如IP地址或URL阻止、DNS劫持或深度数据包检查,用于阻止对特定内容的访问。。。 文章 2015年5月 基于HMM的耦合视听语音识别中动态流权重的学习 随着多媒体数据在通信技术中的日益广泛使用,将视觉信息用于自动语音识别(ASR)的想法最近得到了发展。 结合声学信息,视觉数据。。。 笔记 2015年4月 利用人机差异构建安全的音频验证码 为了防止滥用互联网服务,CAPTCHA用于将人类与基于音频的方案有利于支持视障人士的程序区分开来。 以前的研究表明,大多数音频验证码,尽管对人类来说很难解决,但。。。 研究论文 2014年12月 使用自动语音识别攻击声学CAPTCHA :可用性和安全性之间的权衡 防止互联网服务自动滥用的一种常见方法是利用挑衅响应测试来区分人类用户和机器。 这些测试称为验证码( 告诉计算机和人类的全自动公共图灵测试。。。 文章 2014年8月 多通道去噪和降噪的变分贝叶斯推断 室内混响和背景噪音严重降低了免提语音通信系统的质量。 在这项工作中,我们使用变分贝叶斯(VB)推理解决了语音去噪和降噪的组合问题。。。