ICMI 2022:印度班加罗尔
拉杰·图穆卢里 , 赛比 , 戈帕尔·平加里 , 迪内什·巴布·贾亚戈皮 , 阿比纳夫·达尔 , 里查·辛格 , 丽莎·安东尼 , 阿尔伯特·阿里·萨拉赫 :
国际多式联运会议,2022年11月7日至11日,印度班加罗尔,ICMI 2022。 ACM公司 2022 ,十亿 978-1-4503-9390-4
主题演讲
莫伦西 :
什么是多式联运? 1 德布·罗伊 :
真正的交谈,真正的倾听,真正的改变。 2 丹尼尔·加蒂卡·佩雷斯 :
关注人:以人为中心的计算的五个问题。 三 贾斯汀·卡塞尔 :
身体在未来工作场所的未来。 4
第1部分: 最佳论文提名
中野由纪子 , 埃里·赫洛泽 , 坂田达也 , 冈田Shogo Okada , Jean-Claude马丁 :
利用言语和面部信息检测动机面试中的变化话题。 5-14 大卫·奥布雷姆斯基 , 海伦娜·巴贝特·赫林 , 保拉·弗里德里希 , 比吉特·卢格林 :
使用德语合成语音和自然语音对带有非母语口音的智能虚拟代理感知的探索性研究。 15-24 米米·博卡内格拉 , 梅林·莱姆克 , 罗洛夫·安妮·杰尔·德·弗里斯 , 盖克·D·S·卢登 :
共荣还是梦幻? 探索个人用餐体验。 25-35 薛明成 , 于柳 , 徐开平 , 张海阳 , 余成阳 :
用于参考图像分割的结构化多模态融合网络。 36-47 里特维克·阿格拉瓦尔 , Shreyank Jyoti公司 , 罗希特·吉尔马吉 , 萨拉斯·西瓦普拉萨德 , 维涅特·甘地 :
音频对深度视听显著性预测模型有帮助吗? 48-56
第2部分: 多模态机器学习
李周 , 阎罗 :
音乐条件下舞蹈一代的时空学习。 57-62 阿波斯托洛斯·卡拉齐斯 , Vishnunarayan Girishan Prabhu公司 , 赛杜尔·拉赫曼 , 迈克·P·维蒂 , 劳拉·M·斯坦利 :
情感至关重要:使用两层多模式方法实现人性化的人机交互。 63-72 李继成 , 安贾娜·巴特 , 罗哈耶赫·巴马基 :
基于时空图变换的姿态不确定性运动同步估计。 73-82 阿比纳夫·乔希 , 纳曼·古普塔 , 济南沙 , 比诺德·巴塔拉伊 , 阿舒托什·莫迪 , 达内尔·斯托亚诺夫 :
噪声环境中学习多模表示的广义专家产品。 83-93 玛丽亚·茨法斯曼 , 克里斯蒂安·费内奇 , 森塔·塔尔维迪安 , 安德拉斯·洛林茨 , 天主教M.琼克 , 凯瑟琳·厄特尔 :
建立长期会议支持的对话记忆:通过眼神模糊预测多方对话中值得纪念的时刻。 94-104
第3部分: 健康与幸福
高蒂尔·罗伯特·让·费桑达兹 , 阿利克斯·戈盖 , 克里斯托弗·朱弗雷斯 , 劳伦斯·奈吉 :
保持联系:将触摸交互与视觉障碍患者的拇指对手指微微手势相结合。 105-116 杰森·雷特 , 埃萨努尔·哈克·尼尔贾尔 , 西奥多拉·查斯帕里 :
评估即时振动触觉反馈对沟通焦虑的影响。 117-127 弗朗西斯卡·佩萨尼亚 , 海森·卡亚 , 阿尔基姆·阿尔米拉·阿克达格·萨拉赫 , 阿尔伯特·阿里·萨拉赫 :
使用呼吸特征进行抑郁症严重程度的多模式评估。 128-138 弗洛里斯·范·斯泰恩 , Gizem Sogancioglu公司 , 海森·卡亚 :
通过症状预测建立基于文本的可解释抑郁症严重程度模型。 139-147 阿比南丹耆那教 , 费利克斯·舍勒 , 艾米莉·张 , 帕蒂·梅斯 :
弗里森:利用身体交互性产生审美寒意。 148-158
第4部分: 对话和小组
香脂滩 , 伊丽莎白·珍妮·卡特 , 普里图·帕雷克 , 亚伦·斯坦菲尔德 :
服务场景中多机器人人机交互的群组形成。 159-169 斯蒂芬妮·谭 , David M.J.税务 , 海利·洪 :
时空语境下的会话群检测。 170-180 文汝晨 , 布兰登·巴顿 , 塞巴斯蒂安·福雷 , 汤姆·威廉姆斯 :
请直言不讳:表面上礼貌的警语在机器人导向和人类导向的沟通中都会阻碍礼貌。 181-190 库马尔·舒巴姆 , 阿尼尔班·穆克吉 , 迪内什·巴布·贾亚戈皮 :
回顾具体会话代理中的现实行为和外观生成:传统方法和现代方法的比较。 191-197 蒂芙尼·D.Do , Mamtaj Akter公司 , 祖宾·达塔·乔达里(Zubin Datta Choudhary) , 罗杰·阿泽夫多 , 瑞安·P·麦克马汉 :
具体教学代理的合成语音重音对学习结果的影响。 198-206
第5部分: 行为分析与凝视
玛丽亚·埃琳娜·莱楚加·雷东多 , 拉多斯瓦夫·尼维亚多姆斯基 , 弗朗西斯科·雷亚 , 亚历山德拉·西奥蒂 :
从视觉非言语线索中识别舒适度。 207-216 萨奇特·哈里 , 阿杰 , 萨扬·萨卡尔 , 苏加塔·森 , 苏尔雅·戈什 :
AffectPro:结合智能手机打字交互和情绪自我报告模式构建情感档案。 217-223 斯蒂芬·赫特 , 西德尼·德梅洛 :
评估基于Gaze-based用户建模的无标定网络摄像头眼睛跟踪。 224-235 伯恩德·杜季克 , 海利·洪 :
探索使用面部行为分析检测视频观看过程中的自发回忆。 236-246 刘一禾 , 紫杞园 , 毛慧生 , 梁志云 , 杨万秋 , 袁哲秋 , 铁城 , 李晓腾 , 华旭 , 高凯 :
让声音和视觉线索变得重要:CH-SIMS v2.0数据集和AV-Mixup一致模块。 247-258
第6部分: 接口和交互
肖恩·亚历山大·麦克唐纳 , 弗兰克·E·波利克 , 斯蒂芬·安东尼·布鲁斯特 :
热线索对情感共鸣振动的情感反应的影响。 259-269 沈薇薇(Vivian Shen) , 克里斯·哈里森 :
双屏幕设备上具有协调图形的拉动手势。 270-277 拉明·海德西 , 钱丹·库马尔 , 迈克·劳尔 , 斯特芬·斯塔布 :
所有鸟类都必须飞翔:多模式免提游戏体验,可进行凝视和非语言语音同步。 278-287 阿里·内沙蒂 , 亚伦·萨洛 , 谢里夫·A·M·法利尔 , 李子明 , 海宁梁 , 塞琳·拉图利佩 , 珀朗·艾朗尼 :
EdgeSelect:具有最小屏幕遮挡的智能手表数据交互。 288-298 蒂凡尼·C·K·郭 , 彼得·基弗 , 马丁·劳巴尔 :
两步凝视制导。 299-309
海报
浙江 , 王欣(Xin Wang) , 能高 , 张一飞 , 刘玉涵(音) , 涂晨阳 :
零镜头学习中多模式语义嵌入的多级融合。 310-318 尹·李 , 陈浩宇(Haoyu Chen) , 赵国英 , 马库斯·斯佩克特 :
WEDAR:通过新的电子阅读数据集,通过注意力调节器行为识别进行基于网络摄像头的注意力分析。 319-328 荒川里库 , 马扬克·戈尔 , 克里斯·哈里森 , 卡兰·阿胡加 :
RGBDGaze:使用RGB和深度数据在智能手机上进行凝视跟踪。 329-336 艾卡·艾根 , 博阳柳 , 阮元勋(Thuan Nguyen) , 扎卡里·哈加 , Shuchin Aeron公司 , 马蒂亚斯·舍伊茨 :
在交互式多模式驾驶任务中,通过眼睛注视和脑电图进行认知工作量评估。 337-348 顺卡塔达 , 冈田Shogo Okada , 小马塔尼 :
基于变换器的生理特征学习用于自我报告情绪的多模态分析。 349-358 魏文清 , 李思霞 , 冈田Shogo Okada :
调查对话与交流层面印象之间的关系。 359-367 张静轩 , 根顺湾 , 贾潘 :
唇部兴趣是否足以进行唇读? 368-372 扎赫拉·瓦塞基 , 蓬南扇 , 詹姆斯·克拉克 , 马丁·列文 :
一种具有噪声监控的视频文本检索框架。 373-383 李朱铉 , 柔顺百胜 , 马文·李 , 李继云 :
基于面部特征分类的基于认知的头发和化妆品推荐系统。 384-394 桑德拉特拉·拉森德拉索亚 , 亚历山大·鲍切特 , 朱利安·索尼尔 , 塞巴斯蒂安·亚当 :
多方互动对话中的实时多模态情感识别。 395-403 什里娅·夏尔马 , 穆克什·K·莫哈尼亚 :
印度史诗实体识别与分类的比较分析。 404-413 古尔山·夏尔马 , 潘卡杰·潘迪 , 拉马纳桑·苏布拉曼尼亚语 , 克里希纳·普拉萨德·米亚普拉姆 , 阿比纳夫·达尔 :
歌曲的神经编码受其欣赏程度的调节。 414-419 弗朗西斯科·托尼尼 , Cigdem Beyan公司 , 伊丽莎·里奇 :
多模态跨域凝视目标检测。 420-431 卡桑德拉·谢尔 , 克里斯·哈里森 :
DynaTags:低成本基准标记机制。 432-443 马克·弗雷尔 , 克里斯汀·福塞特 , 乔金·林布拉德 , 纳塔萨·斯拉多耶 , 吉涅夫拉·卡斯特拉诺 :
引导游戏中婴儿参与度的端到端学习和分析:预测和解释。 444-454 孟玉中 , 维拉·范·佐伊斯特 , 阿伊莎·梅·比拉尔 , 福蒂奥斯·帕帕佐普洛斯 , 吉涅夫拉·卡斯特拉诺 :
一项纵向研究中基于智能手机的调查数据对产前抑郁的单峰预测与多峰预测。 455-467 Zhaobo Zheng先生 , 库马尔·阿卡什 , Teruhisa Misu公司 , 维迪亚·克里希纳莫西 , 苗苗洞 , 李妍瑾 , 黄高健 :
通过SAE L2车辆中的隐式输入识别自适应驾驶风格偏好。 468-475 丹·博胡斯 , 肖恩·安德里斯特 , 阿什利·费尼埃洛 , 尼克锯 , 霍尔维茨 :
持续学习野外物体:一种交互式方法。 476-486 亚历山大·K·维尔 , 杰弗里·吉拉德 , 劳伦·拜尔斯玛(Lauren M.Bylsma) , 杰弗里·科恩 , 杰伊·福尼尔 , 霍莉·斯沃茨 , 莫伦西 :
对治疗师与客户关系的因果理解:语言形式和社会诱骗的研究。 487-494 阿里·萨勒曼 , 卡洛斯·巴斯索 :
使用联合学习实现视频面部表情识别的隐私保护个性化。 495-503 衡阳 , 陶罗 , 张亚坤 , 宋明武 , 谢亮 , 叶燕 , 二味饮 :
使用时间收缩网络和NetVLAD改进单词级唇读。 504-508 巴拉特·鲍迪亚 , 克里斯·克里德 , 伊恩·威廉姆斯 , 玉米果Pascual :
用于代码导航的包容性多模式语音交互。 509-519 重阳白 , 马克西姆·博龙金 , 维尼·雷古纳 , V.S.Subrahmanian公司 :
POLLY:一个多模式跨文化上下文敏感框架,用于预测视频中的政治谎言。 520-530 皮尼塔斯犹太法典 , Konstantinos Makantasis公司 , 安东尼奥斯·利亚皮斯 , 乔治·亚纳卡基斯(Georgios N.Yannakakis) :
情感建模的监督对比学习。 531-539 玛哈·埃尔加夫 , 萨巴·佐贾吉 , 加布里埃尔·斯坎茨 , 克里斯托弗·彼得斯 :
CreativeBot:一款激发儿童创造力的创意讲故事机器人。 540-548 拉多斯瓦夫·尼维亚多姆斯基 , 加布里埃尔·德·露西亚 , 加布里埃尔·格拉齐 , 毛里齐奥·曼奇尼 :
走向表彰活动的认可。 549-557 纳丁·瓦格纳 , 亚历克斯·阿克曼 , 吉安·卢卡·萨维诺 , 巴斯蒂安·德内卡斯 , 贾斯敏·尼斯 , 约翰内斯·舍宁 :
被动触觉和听觉反馈对虚拟现实环境中存在和正念的影响。 558-569 马丁·肖拉特 , 道格拉斯·坎宁安 :
人类声音的年龄回归。 570-578 达丽亚·乔安娜·海默林 , 马西耶·斯特罗因斯基 , 卡米尔·夸西亚克 , Krzysztof Trusiak公司 , 马西耶·西姆科夫斯基(Maciej Szymkowski) , Weronika Celniak公司 , 威廉·弗里尔 , 奥雷斯蒂斯·乔治奥 , Mykola Maksymenko公司 :
通过生物信号传输实现在线通信的无接触触摸。 579-590 马尔科·波塔 , 安东尼诺·卡米尼 , 皮尔卡洛·唐迪 :
凝视尺度:面向公共场所基于凝视的一般交互。 591-596 刘洋 , 凯瑟琳·阿查德 , 凯瑟琳·佩拉查德 :
人类互动中断的多模式分类。 597-604 尹玉凤 , 徐家书 , 天心组 , 穆罕默德·索莱马尼 :
X-Norm:为双模融合交换归一化参数。 605-614 罗伯特·莫尔德 , 尼古拉斯·杜兰 , 西德尼·德梅洛 :
用多级向量自回归评估多方协作交互中的多模态动力学。 615-625 尼哈·塔利戈普拉 , 桑德琳·托内 , 斯坎达·穆拉利达尔 , 马修·马奇迈·道斯 :
走向无障碍手语评估和学习。 626-631 Vetha Vikashini Chithrra Raghuram公司 , 哈南·萨拉姆 , Jauwairia Nasir公司 , 芭芭拉·布鲁诺 , 奥亚·切利克图坦 :
机器人协作学习中的个性化生产投入识别。 632-641 什拉文·纳亚克 , 克里斯蒂安·舒勒 , 德布乔伊·萨哈 , 蒂莫·鲍曼 :
深入探讨视听翻译的神经同步性评估。 642-647
蓝天纸业
李宏 , 卡洛斯·贝梅霍·费尔南德斯 , 艾哈迈德·尤瑟夫·阿希拉尔 , 特里斯坦·布劳德 , 西蒙·霍西奥 , 埃斯梅·亨利克·安妮·德·哈斯 , 潘慧 :
超越多模互动的蓝天:基于旋转的元宇宙中星际虚拟空间的百年愿景。 648-652 霍尔维茨 :
《地平线上:互动和合成的深水假货》(On the Horizon:Interactive and Compositional Deepfakes)。 653-661 王安琪(Anqi Wang) , 泽高 , 李恒利 , 特里斯坦·布劳德 , 潘慧 :
Metaverse中的去中心化,而非去人性化:通过多模交互为NFT带来效用。 662-667
博士联盟论文
弗朗西斯卡·佩萨尼亚 :
口述历史档案中的非言语信号。 668-672 迈亚·斯蒂伯 :
通过使用自然人类响应的通用机器人错误管理实现有效的人机协作。 673-678 Tiffany Matej Hrkalovic公司 :
设计混合智能技术以促进社会科学提供的协作。 679-684 尼古拉·科尔贝里尼 :
走向人机合作:多模式群体效能评估。 685-689 阿姆尔戈马 :
面向可靠可信汽车接口的自适应用户中心多模式交互。 690-695 古尔山·夏尔马 :
媒体感知和活动识别的生理传感。 696-700 哈利尔·安德森 :
培养对话能力的实时反馈。 701-704 奥里安·布丁 :
基于跨学科语料库的多模态会话反馈研究方法。 705-710 Soujanya Narayana公司 :
情绪-情绪交互:计算视角。 711-716 阿比纳夫·乔希 :
用于真实世界应用程序的多模式表示学习。 717-723 亚京峰 :
呼叫中心对话中说话人情绪波动的多模态表征与评估。 724-729
演示和展示文件
滨中正树 :
示波器面板:通过自然运动控制VR音乐会。 730-732 丹尼斯·伊万科 , 阿列克谢·M·卡舍夫尼克 , 德米特里·鲁明 , 安德烈·基滕科 , 亚历山大·阿克西诺夫 , 伊戈尔·拉什科夫 , 阿列克谢·卡尔波夫 :
MIDriveSafely:多模式交互,确保驾驶安全。 733-735
重大挑战
Youngwoo Yoon公司 , 彼得·沃尔弗特 , 塔拉斯·库切伦科 , 卡拉·维加斯 , 特奥多尔·尼科洛夫 , 米哈伊尔·察科夫 , 古斯塔夫·伊杰·亨特 :
2022年GENEA挑战:对数据驱动的协同言语手势生成进行大规模评估。 736-747 哈立德·萨利赫 :
用于3D协同语言手势生成的混合Seq2Seq架构。 748-752 Naoshi Kaneko先生 , Yuna Mitsubayashi先生 , 耿牧 :
手势转换:使用RNN转换器的自回归手势生成。 753-757 四川杨 , 吴志勇 , 李明磊 , 赵梦晨 , 林久信 , 陈立阳 , 《卫红宝》 :
2022年GENEA挑战赛的复赛入场券。 758-763 池州 , 腾越边 , 康晨 :
GestureMaster:基于图形的语音驱动手势生成。 764-770 乔纳森·温德尔 , 大卫-格林伍德 , 唐兰 :
UEA数字人类加入GENEA挑战2022。 771-777 赛义德·古尔巴尼 , 伊尔瓦·费尔斯特 , 马克·安德雷·卡本诺 :
从演讲中生成基于范例的风格化手势:2022年GENEA挑战赛的参赛作品。 778-783 Che-Jui Chang公司 , 张森(Sen Zhang) , 穆巴西尔·卡帕迪亚 :
IVI实验室参加2022年GENEA挑战赛-一种基于Tacotron2的具有局部约束注意机制的协同语音手势生成方法。 784-789 书鸿路 , 安德鲁·冯 :
DeepMotion进入GENEA挑战2022。 790-796
研讨会摘要
西奥多罗斯·科斯图拉斯 , 米查尔·穆辛斯基 , 田雷敏(Leimin Tian) , 埃德加·罗曼·朗格尔 , 西奥多拉·查斯帕里 , 帕诺斯·阿梅利迪斯 :
多模态情感和审美体验。 797-798 彼得·沃尔弗特 , 塔拉斯·库切伦科 , 卡拉·维加斯 , 泽林·尤马克 , Youngwoo Yoon公司 , 古斯塔夫·伊杰·亨特 :
GENEA 2022年研讨会:关于生成和评估实施剂的非言语行为的第三次研讨会。 799-800 库尔蒂斯 , 乔治·阿瓦德 , 沙赫扎德·拉吉普特 , 伊恩·索博罗夫 :
第二届深度视频理解国际研讨会。 801-802 伯恩德·杜季克 , 丹尼斯·库斯特 , 大卫·斯腾格 , 费利克斯·普茨 :
第四次研讨会,从野外多模态数据建模社会-情感和认知过程(MSECP-Wild)。 803-804 田中弘子 , 中村佐治 , Kazuhiro Shidara先生 , Jean-Claude马丁 , 凯瑟琳·佩拉查德 :
第三次健康社会情感多模式互动研讨会(SAMIH)。 805-806 阿尼卡·范德克利斯 , 海森·卡亚 , 玛丽亚姆·纳贾菲安 , 萨伊德·萨法维 :
ICMI第三期社会科学和人工智能理解儿童行为研讨会。 807-809