跳到主要内容
10.1145/3394171.3413685高级会议文章/章节视图摘要出版物页面毫米会议记录会议集合
研究论文

基于注意力的双分支指尖检测网络及虚拟密钥系统

出版:2020年10月12日出版历史

摘要

手势和指尖正成为越来越重要的人机交互媒介。因此,手势识别和指尖检测算法得到了广泛的研究。然而,问题主要在于如何在速度和准确性之间实现双赢,以及如何处理复杂的交互环境。为了解决这些问题,本文提出了一种基于注意力的双分支网络,可以有效地完成指尖检测和手势识别任务。为了处理复杂的交互环境,我们将通道性注意和空间性注意结合到指尖检测模型中。大量实验表明,我们的新模型是有效的。在实验中,我们提出的模型在640×480视频帧中实现了2.8像素左右的平均指尖检测误差,八个手势的平均识别准确率达到99%。此外,平均转发时间约为8ms。由于重量轻,该模型还可以在CPU上实现高效性能。此外,基于我们提出的模型,我们设计了一个虚拟密钥系统,可以让用户在虚拟环境中自然地完成“点击”操作。我们提出的系统可以在不进行任何预处理(例如,图像分割或轮廓提取)的情况下,在单个普通RGB相机上运行良好,这可以显著降低交互系统的复杂性。

跳过补充材料部分

补充材料

3394171.3413685.mp4英里

英里4

43.6 MB

参考文献

  1. 肖楚(Xiao Chu)、魏阳(Wei Yang)、万里欧阳(Wanli Ouyang)、程马(Cheng Ma)、艾伦·L·尤耶(Alan L Yuille)和王晓刚(Xiaogang Wang)。2017.人体姿势估计的多控制关注。IEEE计算机视觉和模式识别会议论文集。1831--1840.谷歌学者谷歌学者交叉引用交叉引用
  2. 黄一超、刘晓瑞、张欣、金连文。2016年,基于指向手势的自我中心交互系统:数据集、方法和应用。IEEE计算机视觉和模式识别研讨会会议记录。16--23.谷歌学者谷歌学者交叉引用交叉引用
  3. 谢尔盖·洛夫和克里斯蒂安·塞格迪。2015.批量规范化:通过减少内部协变量转移加快深层网络培训。机器学习国际会议论文集。448--456.谷歌学者谷歌学者数字图书馆数字图书馆
  4. Ji Hui,Chen Jianxin,Qingyu Lin和Ang Li,2018。采用摄像头的基于局部指尖运动和指尖聚类的虚拟键盘。2018年国际计算与模式识别会议论文集。61--67.谷歌学者谷歌学者数字图书馆数字图书馆
  5. 刘晓瑞、黄一超、张欣、金连文。2015.指尖在眼中:一个级联的CNN管道,用于在以自我为中心的视频中实时检测指尖。计算机科学(2015)。谷歌学者谷歌学者
  6. Sohom Mukherjee、Sk Arif Ahmed、Debi Prosad Dogra、Samarjit Kar和Partha Pratim Roy。2019.指尖检测和跟踪,用于识别视频中的气笔。《专家系统与应用》,第136卷(2019年),第217-229页。谷歌学者谷歌学者数字图书馆数字图书馆
  7. 卡祖亚·穆劳(Kazuya Murao)。2015年。使用触摸打字技巧的可佩戴文本输入界面。在《增强人类国际会议论文集》中。谷歌学者谷歌学者数字图书馆数字图书馆
  8. 维诺德·奈尔和杰弗里·欣顿。2010年。整流线性单元改善了受限的boltzmann机器。机器学习国际会议论文集。谷歌学者谷歌学者
  9. Jongchan Park、Sanghyun Woo、Joon Young Lee和In-So Kweon。2018年。BAM:瓶颈关注模块。英国机器视觉会议(BMVC)论文集。谷歌学者谷歌学者
  10. 托马斯·普菲斯特(Tomas Pfister)、詹姆斯·查尔斯(James Charles)和安德鲁·齐瑟曼(Andrew Zisserman)。2015.视频中人体姿势估计的流动卷积。IEEE计算机视觉国际会议论文集。1913--1921.谷歌学者谷歌学者数字图书馆数字图书馆
  11. 霍强。2018年。基于深度图像中突起显著性的指尖检测。在IEEE国际图像处理会议上。谷歌学者谷歌学者
  12. 约瑟夫·雷德蒙和阿里·法哈迪。2018.Yolov3:渐进式改进。arXiv预印arXiv:1804.02767(2018)。谷歌学者谷歌学者
  13. 任少清、何开明、罗斯·吉希克和孙健。2015.更快的R-CNN:利用区域提案网络实现实时目标检测。神经信息处理系统进展论文集。91--99.谷歌学者谷歌学者
  14. Shin Jungpil和Kim Cheol Min。2016.使用Kinect传感器的指尖检测的字符输入系统。《自适应和收敛系统研究国际会议论文集》。74--79.谷歌学者谷歌学者数字图书馆数字图书馆
  15. 吴文斌、李晨阳、卓成、张欣和金连文。2017.YOLSE:从单个RGB图像中进行自我中心指尖检测。IEEE计算机视觉研讨会国际会议论文集。623--630.谷歌学者谷歌学者交叉引用交叉引用

索引术语

  1. 基于注意力的双分支指尖检测网络及虚拟密钥系统

        建议

        评论

        登录选项

        检查您是否可以通过登录凭据或您的机构访问本文。

        登录

        完全访问权限

        • 发布于

          封面图片ACM会议
          20年月:第28届ACM国际多媒体会议记录
          2020年10月
          4889页
          国际标准图书编号:9781450379885
          内政部:10.1145/3394171

          版权所有©2020 ACM

          如果复制品不是为了盈利或商业利益而制作或分发的,并且复制品的第一页载有本通知和完整引文,则允许免费制作本作品的全部或部分数字或硬拷贝以供个人或课堂使用。必须尊重ACM以外的其他人对本作品组成部分的版权。允许用信用证进行摘要。要以其他方式复制或重新发布,在服务器上发布或重新发布到列表,需要事先获得特定许可和/或付费。从请求权限[电子邮件保护]

          出版商

          计算机协会

          美国纽约州纽约市

          出版历史

          • 出版:2020年10月12日

          权限

          请求有关此文章的权限。

          请求权限

          检查更新

          限定符

          • 研究论文

          接受率

          总体验收率995属于4,171提交文件,24%

          即将召开的会议

          毫米24
          24岁MM:第32届ACM国际多媒体会议
          2024年10月28日至11月1日
          墨尔本,维多利亚州,澳大利亚

        PDF格式

        以PDF文件的形式查看或下载。

        PDF格式

        电子阅读器

        使用eReader联机查看。

        电子阅读器