刘浩庚
人员信息
优化列表
2020年–今天
2024 【c2】 刘浩庚 , Quanzeng You公司 , 王一奇 , 韩晓天 , 博汉寨 , 刘永飞 , 陈文涛 , 易仁健 , 陶云哲 , 袁建波 , 冉何 , 杨红霞 :
InfMM:通过开放源代码的可视化语言模型促进多模态理解。 ACL(调查结果) 2024 : 485-492 【c1】 刘廷凯 , 陶云哲 , 刘浩庚 , 奇航风扇 , 丁舟 , 黄怀波 , 冉何 , 杨红霞 :
DeVAn:视频语言模型的密集视频注释。 ACL(1) 2024 : 14305-14321 [i6] 刘浩庚 , Quanzeng You公司 , 韩晓天 , 王一奇 , 博汉寨 , 刘永飞 , 陶云哲 , 黄怀波 , 冉何 , 杨红霞 :
InfMM-HD:高分辨率多模态理解的飞跃。 CoRR公司 腹肌/2403.01487 ( 2024 ) [i5] 刘浩庚 , Quanzeng You公司 , 韩晓天 , 刘永飞 , 黄怀波 , 冉河 , 杨红霞 :
视觉锚定是多模态大型语言模型的强大信息聚合器。 CoRR公司 abs/2405.17815 ( 2024 ) 2023 [i4] 刘浩庚 , 王涛(音译) , 傅瑞波 , 姜堰易 , 郑琪文 , 陶建华 :
UnifySpeech:一个用于零快照文本到语音和语音转换的统一框架。 CoRR公司 abs/2301.03801 ( 2023 ) [i3] 刘浩庚 , 王涛(音译) , 曹洁(音译) , 冉何 , 陶建华 :
使用线性扩散提高快速高质量语音合成。 CoRR公司 abs/2306.05708 ( 2023 ) [i2] 刘浩庚 , 启航帆 , 刘廷凯 , 杨林杰 , 陶云哲 , 黄怀波 , 冉何 , 杨红霞 :
视频演讲者:通过融合和解耦增强交叉模式生成。 CoRR公司 abs/2310.04991 ( 2023 ) [i1] 刘廷凯 , 陶云哲 , 刘浩庚 , 奇航风扇 , 丁舟 , 黄怀波 , 冉何 , 杨红霞 :
Video-CSR:针对视觉语言模型的复杂视频摘要创建。 CoRR公司 abs/2310.05060 ( 2023 )