2023年ICME研讨会: 澳大利亚布里斯班
-
2023年7月10日至14日,澳大利亚布里斯班,IEEE多媒体和展览研讨会国际会议,2023年ICMEW研讨会。 电气与电子工程师协会 2023 ,国际标准图书编号 979-8-3503-1315-4 安德烈·贾努斯 , 多米尼克·斯莱扎克 :
KnowledgePit.ai预测战术游戏中的碎片:ICME 2023大挑战报告。 1-5 肖海涛 , 杨晋中 , 刘玉玲 , 刘俊荣 , 丹杜 , 卢志刚 :
一种基于快速梯度增强的战术游戏碎片预测方法。 6-10 常林 :
使用机器学习技术和直觉知识预测战术游戏中的碎片。 11-15 卡洛斯·韦尔塔斯 , 齐钊(音译) :
机器学习算法的无关性和相关性的重要性。 16-21 斯拉沃米尔·皮奥伦斯基 , 托马斯·戈雷基 :
用Lightgbm算法预测战术游戏中玩家的表现。 22-27 戴米特·鲁塔 , 刘铭(音) , 凌岑 , 狄王 :
战术游戏中预测碎片的特征工程。 28-33 玉树倪 , 蔡嘉智 , 陈志成 , Xien-Kai-Kuo先生 , 陈伯瑜 , Po-Chi Hu公司 , 特德·郭台铭 , Jenq-Neng黄 , 郭峻因 :
2023年亚洲国家交通场景低功耗深度学习对象检测和语义分割多任务模型压缩竞赛综述。 34-39 徐志忠 , 姜云中 , 黄伟豪 :
边缘设备上的快速并发语义分割和对象检测。 40-45 陈洪明 :
多任务YOLO:自动驾驶的多功能感知网络。 46-51 Chi-Chih Chang公司 , 魏成林 , 王佩硕 , 盛福玉 , 陆宇辰 , 关成林 , 吳凱強 :
Q-YOLOP:量化——你只需要一次就可以获得全景驾驶感知。 52-56 杨明轩 , 西域·韩 , 仙药平 , 李子鹏 , 京晓 :
更清晰的图像:通过两阶段处理改进真实降雨条件下的目标检测。 57-62 刘明浩 , 谢家璇 , 胡玉章 , 杨文翰(Wenhan Yang) , 刘嘉英 :
雨天图像分割的综合增强域自适应算法。 63-68 赵士雷 , 黄文新 , 杨明轩 , 刘文轩 :
真实雨景分析:图像去训练和分割的双模块基准。 69-74 郭晓宇 , 向伟 , 齐苏 , 赵慧琴 , 张顺丽 :
提示您需要什么:使用基于锚的提示增强雨天场景中的分割。 75-80 赵毅 , 黄婷姬 , 韩佳业 , 德川湛 :
改进的动态时空注意网络用于交通事故的早期预测。 81-86 吴明宣 , 池生昌 , 苗志铭 , 李嘉彦 :
使用YOLOv7对象检测和对象关系预测汽车事故。 87-89 阿比达·卡奴姆 , 李朝阳 , 杨楚星 :
基于深度学习的自动车辆决策,以预测事故。 90-92 Thanh-Son Nguyen先生 , Minh-Triet Tran公司 :
从计算机视觉到用于作弊检测的自然语言处理的多模型。 93-98 明子刀 , Koji Zettsu公司 :
利用知识图进行欺诈检测:超越数据集评估。 99-104 吴广阳 , 吴伟杰 , 刘晓红 , 徐克乐 , 天骄丸 , 王文一(Wenyi Wang) :
使用即时工程的LLM廉价检测。 105-109 文化楼 , 帅湾 , 雷伟 , 杨福正 :
用于LiDAR点云无损几何压缩的基于法线的全局运动估计。 110-115 周林杰 , 魏高 , 葛丽 , 慧媛 , 赵铁松 , 广汇悦 :
退化光场超分辨的去纠缠特征提取。 116-121 司泽谦 , 袁张(音) , 陶林 :
FBRA360:一种用于360°视频流的基于模糊的比特率自适应方案。 122-127 邹文杰 , 周家帅 , 陈敬武 , 杨福正 :
基于结构信息的MPEG V-DMC纹理坐标预测。 128-133 约书亚·马拉瓦尔 , 尼古拉斯·拉明 , 陆章 :
K3BO:基于关键点的边界框优化,用于从多视图图像重建辐射场。 134-139 李子豪 , 潘高 , 慧媛 , 冉伟 , 马诺兰扬·保罗 :
利用变压器中的电感偏差进行点云分类和分割。 140-145 法拉纳克·托希迪 , 马诺兰扬·保罗 :
使用基于密度的可变大小六面体的基于视频的点云压缩。 146-151 曾欣耀 , 赵旭东 , 林瑶高 , 徐一玲 , 关云峰 :
DMVC:深层网格顶点压缩。 152-157 马尔塔·米洛瓦诺维奇 , 恩佐·塔塔利奥内 , 马可·卡纳佐 , 费利克斯·亨利 :
了解如何为基于多视图神经图像的合成修剪像素。 158-163 Seongmoon Jeong先生 , 姜恩全 , 郑焕科 :
使用特征调制的基于速率可控和目标相关的JPEG图像压缩。 164-169 张洪磊 , 南乐 , 弗朗西斯科·克里克里 , 朱卡·I·阿霍宁 , Hamed Rezazadegan Tavakoli公司 :
稳定基于神经网络的机器图像和视频编解码器的卷积运算。 170-175 Sangwoon Kwak先生 , Joungil Yun公司 , 玄刚昭 , 蒙丘尔·金 :
用于下游任务的功能引导机器中心图像编码。 176-181 阿德南·费萨尔·侯赛因 , 段志浩 , 黄云宁(Yuning Huang) , 朱凤清 :
边缘云系统的灵活可变速率图像特征压缩。 182-187 黄云宁(Yuning Huang) , 段志浩 , 朱凤清 :
NARV:一种用于联合图像压缩和去噪的高效噪声自适应ResNet VAE。 188-193 安德森·德安德拉德 , 阿隆·哈雷尔 , 雅尔达·福鲁坦 , 伊凡·巴伊奇 :
人类和机器可伸缩编码中的条件和残差方法。 194-199 阿隆·哈雷尔 , 亚尔达·福鲁坦 , 伊凡·巴基奇 :
$\text{VVC}+\mathrm{M}$:人类和机器的即插即用可伸缩图像编码。 200-205 魏江 , Choi先生 , 法比安·拉卡佩 , 西蒙·费尔特曼 , 法提赫·卡米斯利 :
基于人脸恢复的视频会议可伸缩质量编码。 206-211 维奈·考希克 , 斯瓦蒂·布格拉 , 阿密特·古普塔 , 布雷杰什·拉尔 :
用于人体运动分析的无标记计算机视觉:综述。 212-217 田晓燕 , 叶进 , 赵章 , 刘鹏(音) , 香龙汤 :
STGA-Net:基于骨架的时间动作分割的时空图形注意网络。 218-223 吴文翰(Wenhan Wu) , 伊雷·华 , 策政 , 吴世谦 , 陈晨 , 阿东路 :
骨架:用于自我监督骨架动作识别的时空掩蔽自动编码器。 224-229 《小雨记》 , 贾斯汀·杨 , 冀上围 , 伊冯·黄(Yvonne Huang) , 张世波 , 钱林 , 简·P·阿勒巴赫 , 朱凤清 :
用于VR面部表情跟踪的分类器引导域自适应。 230-235 贾斯汀·杨 , 《小雨记》 , 冀上围 , 伊冯·黄(Yvonne Huang) , 张世波 , 钱林 , 简·P·阿勒巴赫 , 朱凤清 :
基于局部线性嵌入的VR面部表情跟踪。 236-241 沈叶芝 , 徐伟晨 , 钱林 , 简·P·阿勒巴赫 , 朱凤清 :
基于背景融合的实时端到端人像和In-Hand对象分割。 242-247 Choongseop Lee(李宗宪) , 蒂莫西·沃因斯基 , 伊凡·巴伊奇 :
用于游泳池定位的分解关键点检测器。 248-253 杰斯珀·克杰尔·加德·莫滕森 , Vinicius Soares马蒂森 , 雅各布·冈萨雷斯(Jacobo González de Frutos) , Kata Bujdosó , 杰斯珀·瑟格·克里斯滕森 , 安德烈亚斯·莫格尔莫斯 :
高尔夫球场的语义分割,用于球场评分帮助。 254-259 伊华初 , 陈洪才 , 黄赤石 :
通过握力和动作信息揭示棒球挥杆的特点。 260-265 陈胜凯 , 刘姿钰 , 刘延迪 , 黄赤石 :
高尔夫挥杆中的物理现象分析。 266-271 安居·何塞·汤姆 , 苏迪什·N·乔治 :
从低分辨率监控视频中同时检测超分辨率和运动目标。 272-277 杨文杰 , 谢振宇 , 杨章 :
多摄像机视频中亲密接触者的实时识别和快速检索系统。 278-283 岳宗旭 , 葛丽 , 魏高 :
人-物交互检测的跨级别引导注意。 284-289 伊马德·戈哈尔 , 约翰·西 , 阿布德拉希姆·哈利米 , 翁肯耀 :
风力涡轮机叶片图像中的自动缺陷检测:模型基准和重新标注。 290-295 伦田牟 , 孙一涵 , 田云汉 , 孙逸琪 , 刘余杭 , 张泽喜 , 何瑞晨 , 李觉慧 , 李觉英 , 李紫金 , 冯高 , 叶敏石 , 拉梅什·贾恩 :
MemoMusic 3.0:在音乐推荐中考虑背景,在音乐生成中结合音乐理论。 296-301 恩吉·贝 , Jaekyung Kim先生 , 桑勋·李 :
基于点云的自由视点艺术风格转换。 302-307 刘喜蓓 , 西宁柴 , 张恒生 , 谢荣 , 小谷 , 李松 , 李安操 :
具有细节和结构增强级联学习的旧照片恢复。 308-313 尹良秋 , 李志宇 , 王静(音译) :
基于人体测量数据和多阶段模型的个体HRTF预测。 314-319 新晋 , 吴洲 , 王金玉(Jinyu Wang) , 朵旭 , 易庆荣 , 孙嘉林 :
同音音乐表演审美质量评价的有序复杂性模型。 320-325 张东辉 , 胡自清 , 李晓兵 , 云铁 , 林琦 :
基于混合学习模块的多曲目音乐生成网络。 326-331 王洪亮 , 钱思源 , 张佳文 , 丛进 , 王静(音译) :
Paint ChatGPT:旧上海日历卡生成平台。 332-337 黄嘉阳 , 陈一然 , 叶西园 :
梦幻穿越:人工智能技术在虚拟人物梦境可视化中的应用。 338-342 红泥叶 , 如新优 , 开元楼 , 伊犁文 , 辛毅(Xin Yi) , 新通 :
PetGen:虚拟宠物的设计和生成。 343-346 宋俊荣 , 大卫·基·曼·叶 :
探索人工智能艺术与电影的交集:巨人的案例研究。 347-352 向旭 , 魏忠 , 邹毅 , 龙叶 , 秦章 :
基于时间序列预测的差分旋律生成。 353-358 新晋 , 李宇晨 , 吴洲 , 周星辉 , 杨洪涛 :
照片的美学视觉问题解答。 359-364 李兴达 , 王兆东 , 郑永和 , 林甘 :
基于语法分析和可视化的和声学习。 365-369 冰伟(Bing Wei) , 王友迪 :
基于Mask R-CNN算法的中国古代古琴谱的高级数字化。 370-375 王梦瑶 :
虚拟现实中的人工智能叙事。 376-380 冷志英 , 吴顺成 , 弗雷德里克·W·B·李 , 费德里科·汤巴里 , 梁晓慧 :
PointHGN:点云学习的点异构图形神经网络。 381-386 陈宇通 , 赵俊红 , 张伟强 :
表情演讲驱动面部动画,情绪可控。 387-392 罗紫香 , 齐楚 , 刘乾坤 , 刘斌(Bin Liu) , 能海余 :
点云的简单屏蔽自动编码器范例。 393-398 刘一诺 , 阿德里安·鲍曼 , 郝旭 , 段晶慧 :
一种基于网格重构的三维形状剖分算法。 399-404 赵欣(音译) , 李晓兵 , 云铁 , 胡自清 , 林奇 :
基于多层次融合特征的视频背景音乐推荐。 405-410 张佳彦 , 张杰(音译) , 吴洪浩 , 赵宗伟 , 金玉虎 , 李明勇 :
PCaSM:具有并行内容和样式模块的文本引导合成图像检索。 411-416 Kun Zhang(张坤) , 范亮 , 孙伟(音译) :
具有非线性项的CCLM的参数调整。 417-421 李志宇 , 王静(音译) , 张汉琪(Hanqi Zhang) , 萨基布·哈桑 , 李景欣 :
六自由度VR应用中双耳音频的非参考主观评价方法。 422-427 兰草人 , 赵丽丽(Lili Zhao) , 卓群·孙 , 张志鹏 , 陈建文 :
动态点云帧插值的时空一致性精化网络。 428-433 黄新辉 , 李春怡 , Abdelhak Bentaleb公司 , 罗杰·齐默尔曼 , 翟广涛 :
XGC-VQA:针对用户、专业和职业生成内容的统一视频质量评估模型。 434-439 张自成 , 李春怡 , 孙伟(音译) , 刘晓红 , 熊国敏 , 翟广涛 :
AIGC图像的感知质量评估探索。 440-445 Souheib Riache公司 , 穆罕默德·查克·拉拉比 , 穆罕默德·德里奇 :
基于三维共现统计的点云盲质量评估。 452-457 刘泽鹏 , 杨志成 , 朱明业 , 安迪·王 , 魏一冰 , 梅翰(Mei Han) , 于军(Jun Yu) , 朱新来 :
SAGE-NDVI:一种利用卫星到地面NDVI知识进行遥感图像去噪的立体分类评价指标。 462-465 恩茂雕 , 埃里克·W·特拉梅尔 , 杰丁 , 张涛(Tao Zhang) :
关键词识别的半监督联合学习。 466-469 雷社 , 张成红 , 辛曼 , 罗雪薇(Xuewei Luo) , 杰少 :
用于现代降水预报的自我关注因果LSTM模型。 470-473 闵磊 , Kun He公司 , 姜春林 , 杰绍 :
SBSR:一种用于高效突发超分辨率的简单残差网络。 474-477 范扬 , 艾琳·程 :
空旷地牛监测用航空传感器数据引导目标检测。 478-481 拉维·卡凯亚 , 拉基什·萨蒂什 , Debdoot表 , 拉马纳森·塞图拉曼 :
利用学习到的图像压缩表示的丰富性进行语义分割。 482-485 张颖(音) , 尹一芳 , 罗杰·齐默尔曼 , 于志文 :
一种结构感知的众源稀疏到密集GPS轨迹图像生成方法。 486-489 李宋玲 , 杨世宣 :
基于改进Retinex算法的高效微光视频增强。 494-497 董景轩 , 李万英 , 黄正旭 , 李旭 :
一种利用新型流水线部署轻量级模型以实现高效推理的方法。 498-501 林家玉 , 张子民 , 陈浩元 , 仁伟太子 :
用于Mura检测的监督学习和图像内画集成。 502-505 赵飞(音译) , 张成翠 , 谢赫·阿布贾尔 :
使用深度学习评估藻华严重程度的多模式方法。 506-509 魏旭 , 刘一鹏 , 林玉凡 , 雷武(Lei Wu) , 张娟(Juan Zhang) :
SmartScore:从OMR到自动翻页。 510-511 李敬琼 , Jeonghaeng Lee公司 , Hyucksang Lee公司 , 张明玉 , Seongmin Lee(李成民) , 桑勋·李 :
FaceClone:使用多视图图像的交互式面部形状和运动克隆系统。 512-513 玲珑(Ling Lo) , 易耀 , 周小华 , 陈柔安 , 黄玉萱 , Chien-Chih Chiu先生 , Wan-Hsin Xueh(万信学) , Shih-Chieh Huang先生 , 洪汉帅 , 文焕成 :
DiffAds:个性化视觉广告生成的交互平台。 514-515