跳到主要内容
10.1145/1178782.1178785acm会议文章/章节视图摘要出版物页面毫米会议记录会议集合
第条

同步使用商品硬件获取的多模式数据流

出版:2006年10月27日 出版历史
  • 获取引文提醒
  • 摘要

    我们开发了工具和技术,允许使用非实时操作系统对多个自由运行的商品摄像机、麦克风和计算机节点进行视频帧级同步。这些技术依赖于物理视听同步脉冲、统计程序来关联和内插多个时间戳流,以及用于在我们的多模式语料库中生成平滑和漂移修正的时间戳流的软件工具。在本文中,我们将介绍这些技术和工具。我们的项目是开源的,我们正在为未来的工作寻找合作开发人员。

    工具书类

    [1]
    国家标准技术研究所。网址:http://www.nist.gov/
    [2]
    智能空间项目。http://www.nist.gov/smartspace/
    [3]
    自动会议识别项目。http://www.nist.gov/speech/test床位/mr项目/
    [4]
    M.Michel、V.Stanford和O.Galibert(2005年)。控制数据的网络传输:NIST智能数据流的应用。2003年CCCT会议记录。扩展版于2005年发表在《系统学、控制论和信息学杂志》(第2卷第6期)上。
    [5]
    V.Stanford、J.Garofolo、O.Galibert、M.Michel和Christophe Laprun(2003年)。NIST智能空间和会议室项目:信号、采集、注释和度量。ICASSP 2003会议记录。
    [6]
    R.Xu、G.Mei、Z.Ren、C.Kwan、J.Aube、C.Rochet和V.Stanford(2006年)。面向用户敏感接口:用于说话人识别的自动指令语音采集和使用相控阵的语音识别。施普林格计算机科学AI子系列讲座笔记,2006年杨才博士。
    [7]
    J.Garofolo、C.Laprun、M.Michel、V.Stanford和Elham Tabassi(2004年)。NIST会议室试点语料库。国际语言资源与评估会议(LREC’04)的语音语料库和注释/处理工具。
    [8]
    J.Garofolo、M.Michel、V.Stanford、E.Tabassi、J.Fiscus、C.Laprun、N.Pratz和J.Lard(2004)。NIST会议飞行员语料库语音(ISBN 1-58563-302-x)。http://www.ldc.upenn.edu/Catalog/CatalogEntry.jsp?catalogId=LDC2004S09
    [9]
    J.Garofolo、M.Michel、V.Stanford、E.Tabassi、J.Fiscus、C.Laprun、N.Pratz、J.Lard和S.Strassel(2004年)。NIST会议试点语料库抄本和元数据(ISBN 1-58563-303-8)。http://www.ldc.upenn.edu/Catalog/CatalogEntry.jsp?catalogId=LDC2004T13
    [10]
    网络时间协议。网址:http://www.ntp.org/
    [11]
    B.Widrow和E.Walach(1996年。自适应逆控制。新泽西州恩格尔伍德克利夫斯:普伦蒂斯·霍尔。
    [12]
    Rich Transcription 2002会议认可评估,文档。http://www.nist.gov/speech/tests/rt/rt2002/
    [13]
    富转录2002 STT和元数据提取结果,演示,RT-02研讨会。http://www.nist.gov/speech/tests/rt/rt2002/presentations/index.htm
    [14]
    Rich Transcription 2004春季会议认可评估,文档。http://www.nist.gov/speech/tests/rt/rt2004/spring/
    [15]
    Systems Plus公司。http://www.sysplus.com/

    引用人

    查看全部
    • (2018)用于人类行为识别的多模式数据采集系统多媒体工具和应用程序10.1007/s11042-018-5696-z77:18(23825-23850)在线发布日期:2018年9月1日
    • (2010)使用视听功能同步多摄像机视频IEEE多媒体期刊10.1109/TMM.2009.203628512:1(79-92)在线发布日期:2010年1月1日
    • (2006)NIST会议室语料库2第1阶段第三届多模交互机器学习国际会议论文集10.1007/11965152_2(13-23)在线发布日期:2006年5月1日

    建议

    评论

    信息和贡献者

    问询处

    发布于

    封面图片ACM会议
    VSSN'06:第四届ACM视频监控和传感器网络国际研讨会会议记录
    2006年10月
    230页
    国际标准图书编号:1595934960
    内政部:10.1145/1178782
    如果复制品不是为了盈利或商业利益而制作或分发的,并且复制品的第一页载有本通知和完整引文,则允许免费制作本作品的全部或部分数字或硬拷贝以供个人或课堂使用。必须尊重ACM以外的其他人对本作品组成部分的版权。允许用信用证进行摘要。要以其他方式复制或重新发布,在服务器上发布或重新发布到列表,需要事先获得特定许可和/或付费。从请求权限[电子邮件保护]

    赞助商

    出版商

    计算机协会

    美国纽约州纽约市

    出版历史

    出版:2006年10月27日

    权限

    请求对此文章的权限。

    检查更新

    作者标记

    1. 音频/视频同步
    2. 商品硬件
    3. 数据流
    4. 时间戳

    限定符

    • 第条

    会议

    2006年3月
    MM06:2006年第14届ACM国际多媒体会议
    2006年10月27日
    加利福尼亚州,圣巴巴拉,美国

    即将召开的会议

    24年月日
    24岁MM:第32届ACM国际多媒体会议
    2024年10月28日至11月1日
    墨尔本,维多利亚州,澳大利亚

    贡献者

    其他指标

    文献计量学和引文

    文献计量学

    文章指标

    • 下载次数(过去12个月)4
    • 下载次数(最近6周)0

    其他指标

    引文

    引用人

    查看全部
    • (2018)用于人类动作识别的多模式数据采集系统多媒体工具和应用程序10.1007/s11042-018-5696-z77:18(23825-23850)在线发布日期:2018年9月1日
    • (2010)使用视听功能同步多摄像机视频IEEE多媒体期刊10.1109/TMM.2009.203628512:1(79-92)在线发布日期:2010年1月1日
    • (2006)NIST会议室主体2第1阶段第三届多模交互机器学习国际会议论文集10.1007/11965152_2(13-23)在线发布日期:2006年5月1日

    视图选项

    获取访问权限

    登录选项

    完全访问权限

    查看选项

    PDF格式

    以PDF文件查看或下载。

    PDF格式

    电子阅读器

    使用联机查看电子阅读器.

    电子阅读器

    媒体

    数字

    其他

    桌子

    分享

    分享

    共享此出版物链接

    在社交媒体上分享