{“状态”:“确定”,“消息类型”:“工作”,“信息版本”:“1.0.0”,“邮件”:{“索引”:{-“日期-部件”:[[2024,5,30]],“日期-时间”:“2024-05-30T11:07:18Z”,“时间戳”:1717067238094},“引用-计数”:61,“发布者”:“计算机协会(ACM)”,“问题”:“4”,“内容-域”:{:“域”:[“dl.ACM.org”],“交叉标记限制”:true},“short-container-title”:[“ACM Trans.Graph.”],“published-print”:{“date-parts”:[[2023,8]]},“abstract”:“我们提出了一种通过学习人机交互记录来生成虚拟活动片段的方法,其中包括3D环境中多角色、多对象交互场景的顺序关键帧。生成包括两个阶段。首先,我们使用带有时序模块的序列深度图生成模型迭代生成关键帧描述,关键帧描述使用图形表示抽象交互,同时通过活动保持时空关系。其次,我们设计了一个优化框架,在生成的关键帧描述的指导下,在虚拟3D环境中实例化活动片段。我们的方法优化了由图节点编码的字符和对象实例的姿势,以满足由图边编码的关系和约束。实例化过程包括一个粗略的二维优化,然后是一个精细的三维优化,以有效地探索用于放置和设置实例的复杂解决方案空间。通过实验和感知研究,我们应用我们的方法在不同的设置下生成可信的活动片段<\/jats:p>“,”DOI“:”10.1145\/3592096“,”type“:”journal-article“,”created“:{”date-parts“:[2023,7,26]],”date-time“:”2023-07-26T15:47:45Z“,”timestamp“:1690386465000},”page“:“标题”:[“通过学习人类场景交互生成活动片段“],”前缀“:”10.1145“,”卷“:”42“,”作者“:[{”ORCID“:”http://\/ORCID.org\/0000-0002-0074-3889“,”authenticated-ORCID“:false,”给定“:”长阳“,”家庭“:”李“,”sequence“:”first“,”affiliation“:[}”名称“:”美利坚合众国费尔法克斯乔治梅森大学“}]},{”ORCID“http://\/orcid.org\/00000-0002-2656-5654“,”authenticated-orcid“:false,”given“:”Lap-Fai“,”family“:”Yu“,”sequence“:”additional“,”affiliation“:[{”name“:”George Mason University,Fairfax,United States of America“}]}],”member“:”320“,”published-online“:“:”publisher“,”doi“:”10.1145\/337923.3404791“},{“key”:“e_1_2_2_1”,“doi断言者”:“publisher”,“doi”:“10.1145\/28978242925893”},{“key”:“e_1_2_3_1”,“volume title”:“TEACH:3D人类的时间动作合成。arXiv预印本arXiv:2209.04066”,“author”:“Athanasiou Nikos”,“year”:“2022”,“nonstructured”:“Nikos Athanasiou、Mathis Petrovich、Michael J Black和G\u00fcl Varol。2022.教学:3D人类的时间动作合成。arXiv预打印arXiv:2209.04066(2022)。“},{”key“:”e_1_2_4_1“,”first-page“:”1“,”article-title“:”并发对象操作任务的合成“,”volume“:“31”,”author“:”Bai Yunfei“,”year“:”2012“,”unstructured“:”Yunfee Bai,Kristin Siu,and C Karen Liu。2012。并发对象操作任务的合成。ACM Transactions on Graphics 31,6(2012),1-9.“,”journal-title“:”ACM Translations on Graphics},{“key”:“e_1_2_5_1”,“doi-asserted-by”:“publisher”,”doi“:”10.1109\/CVPR.2015.7298698“},”{“密钥”:“e_1_2_2_6_1”“,”doi-assert-by“:”publisher“,”doi:“10.1007\/978-3-030-58452-8_23”},“key“:”e_2_2_7_1“,“”卷时间“:”设计交互式系统会议”,“作者”:“奇丹巴拉姆-苏布拉曼尼亚人”,“年份”:“2021年”,“非结构化”:“希丹巴拉姆人、黄汉克、何凤鸣、荀谦、安娜·维拉努埃娃、托马斯·雷迪克、沃尔夫冈·斯图林格和卡西克·拉马尼。2021.Processar:一种增强的基于现实的工具,用于创建现场程序2d\/3d ar指令。在2021年交互系统设计大会上。234--249.“},{”key“:”e_1_2_2_8_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1145 \/2366145.2366154”},“key”:“e_2_9_1”,“doi-assert-by”:“publisher”,”doi“:”10.1145 \/2816795.2818057“}”,{“卷”:“36”,“作者”:“傅强”,“年份”:“2017年”,“非结构化”:“傅强,陈晓武,王晓天,温思嘉,周斌,傅洪波。2017.通过活动关联对象关系图自适应合成室内场景。ACM图形事务处理(TOG)36,6(2017),1--13.“,”journal-title“:”ACM图形业务处理(TOC)“},{”key“:”e_1_2_2_11_1“,”unstructured“:”Ghost Town Games.2016。烹饪过度。https:\/\/store.streamppowered.com\/app/448510\/过度预订\/。“},{”key“:”e_1_2_12_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1109\/ICCV48922.2021.00143”},“key”:“e_2_2_13_1”,“volume-title”:“机器学习国际会议。PMLR,1263-1272”,“author”:“Gilmer Justin”,“year”:“2017”,“unstructured”:“Justin Gilmer,Samuel S Schoenholz,Patrick F Riley,Oriol Vinyals,and George e Dahl.2017。量子化学的神经信息传递。在机器学习国际会议上。PMLR,1263--1272.“},{”key“:”e_1_2_14_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1145\/3394171.3413635”},“key”:“e_2_2_15_1”,“doi-assert-by”:“publisher”,”doi“:”10.1109\/TPAMI.2022.3214832“}”,{Mohamed Hassan Duygu Ceylan Ruben Villegas Jun Saito Jimei Yang Yi Zhou和Michael J Black。2021a年。随机场景感知运动预测。在ICCV中。11374--11384.“,”DOI“:”10.1109\/ICCV48922.2021.01118“},{”key“:”e_1_2_17_1“,”DOI-asserted-by“:”crossref“,“unstructured”:“Mohamed Hassan Partha Ghosh Joachim Tesch Dimitrios Tzionas和Michael J Black.2021b.通过学习人类场景交互填充3D场景。在CVPR.14708--14718.中。”,“DOI”:“10.1109\/CVPR46437.2021.01447”},}”key:“”e_1_2_18_1“,”doi-asserted-by“:”crossref“,“unstructured”:“W Keith Hastings。1970.使用马尔可夫链的蒙特卡罗抽样方法及其应用。(1970).“,”DOI“:”10.2307\/2334940“},{”key“:”e_1_2_19_1“,”DOI-asserted-by“:”publisher“,“:”10.1145\/3491102.3517696“},{”key“:”e_1_2_22_1“,”DOI-asserted-by“:”publisher“,“DOI”:“10.1109\/CVPR42600.2020.01025“},{“key”:“e_1_2_23_1”,“doi-asserted-by”:“publisher”,”doi“:”10.1007\/978-3-030-58574-7_46“}”,{”key“:”e_2_2_24_1“,”volume-title“:”机器学习国际会议。PMLR,2323--2332“,”author“:”Jin Wengong“,“year”:“2018”,“unstructured”:”Wengong-Jin,Regina Barzilay,and Tommi Jaakkola.2018。用于分子图生成的连接树变分自动编码器。在机器学习国际会议上。PMLR,2323--2332.“},{“key”:“e_1_2_2_25_1”,“volume-title”:“ASAP:自动生成故事板和虚拟人预览。2021年IEEE混合和增强现实辅助国际研讨会(ISMAR-Adjunct)。IEEE,316-320”,“作者”:“Kim Hanseab”,“年份”:“2021”,“非结构化”:“Hanseob Kim,Ghazanfar Ali,And Jae-In Hwang.2021。尽快:自动生成故事板并使用虚拟人预览。2021年IEEE混合增强现实辅助技术国际研讨会(ISMAR-辅助)。IEEE,316-320.“},{”key“:”e_1_2_2_26_1“,”first page“:“1”,”article-title“:”Shape2pose:“以人为中心的形状分析”,“volume”:“33”,“author”:“Kim Vladimir G”,“year”:“2014”,“unstructured”:“Vladimir G Kim,Siddhartha Chaudhuri,Leonidas Guibas,and Thomas Funkhouser.2014。Shape2pose:以人为中心的形状分析。ACM Transactions on Graphics 33,4(2014),1--12.“,“journal-title”:“ACM Translations on Graphis”},{“key”:“e_1_2_27_1”,“volume-title“:“模拟退火优化。Science 220,4598”,“author”:“Kirkpatrick Scott”,“year”:“1983”,“unstructured”:“Scott Kirkpatick,C Daniel Gelatt,and Mario P Vecchi.1983。通过模拟退火进行优化。《科学》220,4598(1983),671--680。“},{”key“:”e_1_2_28_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1145\/1179352.141972”},“key”:“e_1_i_29_1”,“volume-title”:“深度兼容控制。ACM SIGGRAPH 2022会议记录。第23条”,“作者”:“Lee Seunghwan”,“年份”:“2022”,“非结构化”:“Seunghwan Lee、Phil Sik Chang和Jehee Lee。2022.深度合规控制。ACM SIGGRAPH 2022会议记录。第23条,共9页。“},{”key“:”e_1_2_2_30_1“,”volume-title“:”ava-dynamics本地化人类行为视频数据集。arXiv预印本arXiv:2005.00214“,”author“:”Li Ang“,”year“:”2020“,”unstructured“:”Ang Li、Meghana Thotakuri、David A Ross、Jo\u00e3o Carreira、Alexander Vostrikov和Andrew Zisserman。2020。ava-dynamics本地化了人类动作视频数据集。arXiv预打印arXiv:2005.00214(2020)。“},{“键”:“e_1_2_31_1”,“首页”:“1”,“文章标题”:“以场景语义为指导的交互式增强现实讲故事”,“卷”:“41”,“作者”:“李长阳”,“年份”:“2022”,“非结构化”:“李长阳、李婉晚、黄海坤和俞立辉。2022。场景语义指导下的交互式增强现实故事讲述。ACM Transactions on Graphics(TOG)41,4(2022),1--15.“,”journal-title“:”ACM Translations on Graphics:“”},{“key”:“e_1_2_32_1”,“volume-title”:“Learning deep generative models of Graphics。arXiv预印本arXiv:1803.03324”,“author”:“Li Yugia”,“year”:“2018”,“unstructured”:“”Yugia Li、Oriol Vinyals、Chris Dyer、Razvan Pascanu和Peter Battaglia。2018年。学习图形的深层生成模型。arXiv预印arXiv:1803.03324(2018)。“},{”key“:”e_1_2_33_1“,”volume title“:”MOMA-LRG:用于多对象多参与者活动分析的语言精炼图。在第三十六届神经信息处理系统数据集和基准跟踪会议上。“,”作者“:”罗泽伦“,”年份“:”2022“,”非结构化“:”罗泽伦、扎恩·杜兰特、李林登、谢万泽、刘若岑、金爱米丽、黄卓毅、李伦宇、吴佳军、胡安·卡洛斯·尼布尔斯等,2022年。MOMA-LRG:多对象多因素活动分析的语言定义图。在第三十六届神经信息处理系统会议上,数据集和基准跟踪。“},{”key“:”e_1_2_34_1“,”first page“:“17939”“,”article-title“:”MOMA:多对象多部门活动解析“,”volume“:‘34’,”author“:”罗泽伦“,”year“:”2021“,”unstructured“:”罗泽伦“、谢万泽“、西德哈斯·卡普尔“、梁益云、迈克尔·库珀“、胡安·卡洛斯·尼布尔斯、埃桑·阿德利和李飞飞。2021。MOMA:多对象多因素活动分析。《神经信息处理系统进展》34(2021),17939-17955.“,”journal-title“:“神经信息处理体系进展”},{“key”:“e_1_2_35_1”,“doi-asserted-by”:“publisher”,”doi“:”10.1145\/2980179.2980223“},”{“密钥”:“e_1_2_2_36_1”、“volume-title”:“使用室内设计准则进行交互式家具布局。ACM图形事务(TOG)30,4“,“作者”:“Merrell Paul”,“年份”:“2011”,“非结构化”:“Paul Merrell,Eric Schkufza,Zeyang Li,Maneesh Agrawala,and Vladlen Koltun。2011年,使用室内设计指南进行交互式家具布局。ACM图形事务(TOG)30,4(2011),1-10.“},{”key“:”e_1_2_37_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1063\/1.1699114”},“key”:“e_1_i_2_38_1”,“unstructured”:“Nawmal.2019”。纳马尔。https:\/\/www.nawmal.com/“},{“key”:“e_1_2_39_1”,“doi-asserted-by”:“publisher”,”doi“:”10.1109\/ICCV48922.2021.01080“}”,{”key“:”e_1_i_2_40_1“,”doi-assert-by“:”publisher“,145\/2661229.2661230“},{“key”:“e_1_2_42_1”,“doi-asserted-by”:“publisher”,”DOI“:”10.1145\/2897824.2925867“},{”key“:”e_1_2_43_1“,”DOI-asserted-by“:”publisher“,“DOI”:“10.1109\/CVPR42600.2020.00269“}”,{“key”:“e_1_i_2_44_1”,“DOI-assert-by”:“publisher”,”DOI“:”10.1007\/978-3-0130-01418-6_41“}“:”10.1145\/3355089.3356505“},{”键“:”e_1_2_46_1“,”首页“:”1“,”article-title“:“WallPlan:通过学习生成墙图合成平面布置图”,“卷”:“41”,“作者”:“孙家辉”,“年份”:“2022”,“非结构化”:“孙家辉,吴文明,刘立刚,闵文杰,张高峰,郑丽萍。2022.墙平面图:通过学习生成墙图来合成平面图。ACM Transactions on Graphics(TOG)41,4(2022),1--14.“,”journal-title“:”ACM Translations on Graphis(TOG瓦什瓦尼·阿什瓦尼”,“年份”:“2017年”,“非结构化”:“阿什瓦尼、诺亚姆·沙泽尔、尼基·帕马尔、雅各布·乌兹科雷特、利昂·琼斯、艾丹·戈麦斯、\u0141ukasz Kaiser和伊利亚·波洛什金。2017年。你所需要的就是关注。神经信息处理系统进展30(2017)。“},{”key“:”e_1_2_49_1“,”volume-title“:”Computer Graphics Forum“,”author“:”Wang He“,“unstructured”:“He Wang,S\u00f6ren Pirk,Ersin Yumer,Vladimir G Kim,Ozan Sener,Srinath Sridhar,and Leonidas J Guibas.2019b.从视频中学习多步人-对象交互的生成模型。计算机图形论坛,第38卷。威利在线图书馆,367--378。“},{”key“:”e_1_2_2_50_1“,”doi-asserted-by“:”crossref“,“unstructured”:“贾顺王华哲徐静伟徐思飞刘小龙。2021a.合成三维场景中的长期三维人体运动和交互。在CVPR.9401-9411.”中,“doi”:“10.1109\/CVPR46437.2021.00928”},“key”:“e_2_51_1”,“doi-assert-by”:“”crossref”,“非结构化”:“晶博王思杰闫波戴和林大华。2021b。用于人体运动合成的场景感知生成网络。在CVPR中。12206--12215.“,”DOI“:”10.1109\/CVPR46437.2021.01203“},{“key”:“e_1_2_52_1”,“DOI-asserted-by”:“crossref”,”first page“:”1“,”DOI“:“10.1145\/3306346.3322941”,“article-title”:“Planit:使用关系图和空间优先网络规划和实例化室内场景”,“volume”:”38“,”author“:”Wang Kai“,”“year”:“2019”,“unstructured”:“”王凯(Kai Wang)、林玉安(Yu-An Lin)、本·魏斯曼(Ben Weissmann)、马诺丽斯·萨瓦(Manolis Savva)、张安琪(Angel X Chang)和丹尼尔·里奇(Daniel Ritchie)。2019a年。规划:使用关系图和空间优先网络规划和实例化室内场景。ACM Transactions on Graphics(TOG)38,4(2019),1-15.“,”journal-title“:”ACM Translations on Graphis(TOGKai Wang、Manolis Savva、Angel X Chang和Daniel Ritchie。2018.室内场景合成的深度卷积先验。ACM Transactions on Graphics(TOG)37,4(2018),1--14.“,”journal-title“:”ACM Translations on Graphics:“”},{“key”:“e_1_2_54_1”,“volume-title”:“Humanise:三维场景中的语言调节人体运动生成。arXiv预印本arXiv:2210.09729”,“author”:“Wang Zan”,“year”:“2022”,“unstructured”:“”Zan Wang、Yixin Chen、Tengyu Liu、Yixin Zhu、Wei Liang和Siyuan Huang。2022.人性化:三维场景中的语言调节人体运动生成。arXiv预打印arXiv:2210.09729(2022)。“},{”key“:”e_1_2_55_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1145\/3550469.3555426”},“key”:“e_1_i_2_56_1”,“volume-title”:“机器学习国际会议。PMLR,5708-5717”,“author”:“You Jishoun”,”year“2018”,“unstructured”:“Jishou You,Rex Ying,Xiang Ren,William Hamilton,and Jure Leskovec.2018。Graphrnn:生成具有深度自回归模型的真实图形。在机器学习国际会议上。PMLR,5708-5717.“},{“key”:“e_1_2_57_1”,“doi由”断言:“publisher”,“doi”:“10.1145\/20103241964981”},{“key”:“e_1_2_58_1”,“卷标题”:“计算机图形学论坛”,“作者”:“张佳琦”,“非结构化”:“张佳琦、向旭、沈志猛、黄泽环、杨照、曹燕培、万鹏飞和王苗。2021。写动画:高级基于文本的动画编辑,具有角色-场景交互。计算机图形论坛,第40卷。威利在线图书馆,217--228.“},{”key“:”e_1_2_59_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1109\/3DV50981.2020.00074”},“key”:“e_1_i_2_60_1”,“doi-assert-by”:“publisher”,”doi“:”10.1109\/CVPR42600.2020.00623“}”,{,“doi”:“10.1145\/3381866”,“文章标题”:“通过混合表示进行场景合成的深度生成建模”,“卷”:“39”,“作者”:“张再伟”,“年份”:“2020年”,“非结构化”:“张再伟、杨振培、马崇阳、罗林杰、亚历山大·胡特、艾蒂安·沃加和黄启兴。2020年b。通过混合表示进行场景合成的深度生成建模。ACM Transactions on Graphics(TOG)39,2(2020),1--21.“,”journal-title“:”ACM Translations on Graphis(TOG相似性检查“}”,“存放”:{“日期部分”:[[2024,3,3]],“日期时间”:“2024-03-03T04:04:16Z”,“时间戳”:1709438656000},“分数”:1,“资源”:{“主要”:}“URL”:“https:\/\/dl.acm.org\/doi\/10.1145\/3592096”},”副标题“:[],”短标题“:[],”发布“:{”日期部分“:[2023,7,26]]},“references-count”:61,“journal-issue”:{“issue”:“4”,“published-print“:{“date-parts”:[[2023,8]]}},“alternative-id”:[“10.1145\/3592096”],“URL”:“http://\/dx.doi.org\/10.1145\/359296”,“relation”:{},”ISSN“:[“0730-0301”,“1557-7368”],”ISSN-type“:[{“value”:“0730-0501”,”type“:”print“},{“value”:“1557-7768”,“type”:”电子“}”,“主题”:[],“发布”:{“日期部分”:[[2023,7,26]]},“断言”:[{“值”:“2023-07-26“,”order“:2,”name“:”published“,”label“:”published“,”group“:{“name”:”publication_history“,”标签“:”publication history“}}]}}