张开鹏
人员信息
优化列表
2020年–今天
2024 [j7] 张浩 , 马永强 , 张开鹏 , 南宁郑 , 沈启来(Shenqi Lai) :
FMGNet:用于实时视觉任务的高效特征多路组网络。 模式识别。 156 : 110698 ( 2024 ) [j6] 张浩 , 于杰敦 , 裴一轩 , 沈启来(Shenqi Lai) , 刘成旭 , 张开鹏 , 钱学明 :
HF-HRNet:一个简单的硬件友好型高分辨率网络。 IEEE传输。 电路系统。 视频技术。 34 ( 8 ) : 7699-7711 ( 2024 ) [j5] 张开鹏 , 佐藤洋一 :
基于动态判别原型的语义图像分割。 IEEE传输。 Multim公司。 26 : 737-749 ( 2024 ) [c27] 林玉琪(Yuqi Lin) , 陈明浩 , 张开鹏 , 李恒嘉 , 李明明 , 郑阳 , 吕东琴 , 林斌(Binbin Lin) , 刘海峰 , 邓才 :
TagCLIP:一个本地到全球的框架,用于在不经过培训的情况下增强CLIP的开放本地多标签分类。 AAAI公司 2024 : 3513-3521 [公元26年] 彭文硕 , 张开鹏 , 岳阳 , 张浩 , 于乔 :
图像分类中视觉语言基础模型的数据自适应回溯。 AAAI公司 2024 : 4506-4514 [公元25年] 孟凡清 , 邵文琪 , 泉丰路 , 彭高 , 张开鹏 , 于乔 , 罗萍(Ping Luo) :
ChartAssistant:一个通用的图表多模态语言模型,通过表到表的预训练和多任务指令调整。 ACL(调查结果) 2024 : 7775-7803 [公元24年] 岳阳 , 张开鹏 , 葛玉英 , 邵文琪 , 薛泽岳 , 于乔 , 罗萍(Ping Luo) :
对齐、调整和插入:音频引导图像生成、编辑和样式化。 ICASSP公司 2024 : 3475-3479 【c23】 郭子耀 , 王凯(Kai Wang) , 乔治·卡泽纳维特 , 李慧(音) , 张开鹏 , 杨友 :
通过难对齐轨迹匹配实现无损数据集提取。 ICLR公司 2024 [公元22年] 邵文琪 , 陈梦照 , 张兆阳 , 彭旭 , 赵丽瑞 , 李志谦 , 张开鹏 , 彭高 , 于乔 , 罗萍(Ping Luo) :
OmniQuant:大型语言模型的全方位校准量化。 ICLR公司 2024 【c21】 彭旭 , 邵文琪 , 陈梦照 , 石涛汤 , 张开鹏 , 彭高 , 丰威安 , 于乔 , 罗萍(Ping Luo) :
BESA:使用分块参数高效稀疏分配修剪大型语言模型。 ICLR公司 2024 [公元20年] 刘东阳 , 张仁瑞 , 龙天球 , 黄思源(Siyuan Huang) , 林伟峰 , 赵世田 , 耿世杰 , 林子怡 , 彭进 , 张开鹏 , 邵文琪 , 赵旭 , 何从惠 , 何俊君 , 郝绍 , 潘璐 , 于乔 , 李洪生 , 彭高 :
SPHINX-X:一类多模态大型语言模型的缩放数据和参数。 ICML公司 2024 [第19条] 岳阳 , 林玉琪(Yuqi Lin) , 刘洪(音) , 邵文琪 , 陈润建 , 海龙上 , Yu Wang(王宇) , 于乔 , 张开鹏 , 罗萍(Ping Luo) :
位置:朝向文本到图像模型的隐式提示。 ICML公司 2024 [第18条] 开宁营 , 孟凡清 , 金旺(Jin Wang) , 李志谦 , 韩林(Han Lin) , 岳阳 , 张浩 , 张文波 , 林玉琪(Yuqi Lin) , 刘硕 , 嘉义雷 , 泉丰路 , 陈润建 , 彭旭 , 张仁瑞 , 张浩哲 , 彭高 , 王亚丽 , 于乔 , 罗萍(Ping Luo) , 张开鹏 , 邵文琪 :
MMT-Bench:针对多任务AGI评估大型视觉语言模型的综合多模式基准。 ICML公司 2024 [c17] 彭文硕 , 张开鹏 , 赛谦张 :
T3M:基于语音的文本引导三维人体运动合成。 NAACL-HLT(调查结果) 2024 : 1168-1177 [i41] 孟凡清 , 邵文琪 , 泉丰路 , 彭高 , 张开鹏 , 于乔 , 罗萍(Ping Luo) :
ChartAssisstant:一个通用的图表多模态语言模型,通过表到表的预训练和多任务指令调整。 CoRR公司 abs/2401.02384 ( 2024 ) [i40] 张天乐 , 张雨晨 , 王坤(Kun Wang) , 王凯(Kai Wang) , 杨北宁 , 张开鹏 , 邵文琪 , 刘平 , 周天一(Joey Tianyi Zhou) , 杨友 :
两个权衡是不折不扣的:通过制作有理梯度匹配来压缩图形。 CoRR公司 abs/2402.04924 ( 2024 ) [i39] 彭高 , 张仁瑞 , 刘桓 , 龙天球 , 黄思源(Siyuan Huang) , 林伟峰 , 赵世田 , 耿世杰 , 林子怡 , 彭进 , 张开鹏 , 邵文琪 , 赵旭 , 何从惠 , 何俊君 , 郝绍 , 潘璐 , 李洪生 , 于乔 :
SPHINX-X:一类多模态大型语言模型的缩放数据和参数。 CoRR公司 abs/2402.05935 ( 2024 ) [i38] 陈俊廷 , 姚牧 , 余乔军 , 天明伟 , Silang Wu公司 , 柘城苑 , 梁志轩 , 朝阳 , 张开鹏 , 邵文琪 , 于乔 , 徐华哲 , 明玉鼎 , 罗萍(Ping Luo) :
RoboScript:Real和Simulation中自由形式操纵任务的代码生成。 CoRR公司 腹肌/2402.14623 ( 2024 ) [i37] 彭旭 , 邵文琪 , 陈梦照 , 石涛汤 , 张开鹏 , 彭高 , 丰威安 , 于乔 , 罗萍(Ping Luo) :
BESA:使用分块参数高效稀疏分配修剪大型语言模型。 CoRR公司 abs/2402.16880 ( 2024 ) [公元36年] 岳阳 , 林玉琪 , 刘洪(音) , 邵文琪 , 陈润建 , 海龙上 , Yu Wang(王宇) , 于乔 , 张开鹏 , 罗萍(Ping Luo) :
面向文本到图像模型的隐式提示。 CoRR公司 abs/2403.02118 ( 2024 ) [i35] 张浩 , 邵文琪 , 刘洪(音) , 马永强 , 罗萍(Ping Luo) , 于乔 , 张开鹏 :
AVIBench:评估大型视觉语言模型对对抗性视觉指令的鲁棒性。 CoRR公司 abs/2403.09346 ( 2024 ) [i34] 刘硕 , 开宁营 , 张浩 , 岳阳 , 林玉琪(Yuqi Lin) , 张天乐 , 李传浩 , 于乔 , 罗萍(Ping Luo) , 邵文琪 , 张开鹏 :
ConvBench:一个针对大型视觉语言模型的具有层次能力的多回合会话评估基准。 CoRR公司 abs/2403.20194 ( 2024 ) [i33] 赵丽瑞 , 岳阳 , 张开鹏 , 邵文琪 , 张玉欣(Yuxin Zhang) , 于乔 , 罗萍(Ping Luo) , 荣融记 :
DiffAgent:使用大型语言模型快速准确地选择文本到图像API。 CoRR公司 abs/2404.01342 ( 2024 ) [i32] 王佳浩 , 邵文琪 , 陈梦照 , 吴成岳 , 刘勇(音) , 张开鹏 , 张松阳 , 陈凯(Kai Chen) , 罗萍(Ping Luo) :
将LLaMA解码器改编为视觉变压器。 CoRR公司 abs/2404.06773 ( 2024 ) [i31] 开宁营 , 孟凡清 , 金旺(Jin Wang) , 李志谦 , 韩林(Han Lin) , 岳阳 , 张浩 , 张文波 , 林玉琪(Yuqi Lin) , 刘硕 , 嘉义雷 , 泉丰路 , 陈润建 , 彭旭 , 张仁瑞 , 张浩哲 , 彭高 , 王亚丽 , 于乔 , 罗萍(Ping Luo) , 张开鹏 , 邵文琪 :
MMT-Bench:针对多任务AGI评估大型视觉语言模型的综合多模式基准。 CoRR公司 abs/2404.16006 ( 2024 ) [i30] 李传浩 , 甄莉 , 陈晨静 , 刘硕 , 邵文琪 , 吴宇伟 , 罗萍(Ping Luo) , 于乔 , 张开鹏 :
UDKAG:利用最新知识增强大型视觉语言模型。 CoRR公司 abs/2405.14554 ( 2024 ) [i29] 王伟云 , 张水波 , 任一鸣 , 段玉晨 , 李天童 , 刘硕 , 胡梦康 , 哲晨 , 张开鹏 , 陆乐伟 , 西周朱 , 罗萍(Ping Luo) , 于乔 , 戴纪峰 , 邵文琪 , 王文海 :
多式联运干草堆中的针。 CoRR公司 腹肌/2406.07230 ( 2024 ) [第28条] 泉丰路 , 邵文琪 , 刘子涛 , 孟凡清 , 李伯轩 , 陈伯通 , 黄思源(Siyuan Huang) , 张开鹏 , 于乔 , 罗萍(Ping Luo) :
GUI Odyssey:移动设备上跨应用GUI导航的综合数据集。 CoRR公司 abs/2406.08451 ( 2024 ) [i27] 张天乐 , 朗天马 , 颜玉晨 , 张雨晨 , 王凯(Kai Wang) , 岳阳 , 郭子耀 , 邵文琪 , 杨友 , 于乔 , 罗萍(Ping Luo) , 张开鹏 :
重新思考文本到视频模型的人类评估协议:增强可靠性、再现性和实用性。 CoRR公司 abs/2406.08845 ( 2024 ) [i26] 孟凡清 , 邵文琪 , 罗立新 , 王亚红 , 陈一然 , 泉丰路 , 岳阳 , 杨天朔 , 张开鹏 , 于乔 , 罗萍(Ping Luo) :
PhyBench:用于评估文本到图像模型的物理常识基准。 CoRR公司 abs/2406.11802 ( 2024 ) [i25] 乐卓 , 杜若易 , 韩晓 , 李阳光 , 刘东阳 , 黄荣杰 , 刘文泽 , 赵丽瑞 , 王福云 , 马占玉 , 徐罗 , 王泽汉 , 张开鹏 , 朱向阳 , 司刘 , 项羽月 , 刘定宁 , 欧阳万里 , 刘子蔚 , 于乔 , 李洪生 , 彭高 :
Lumina-Next:使用Next-DiT使Lumina-T2X更强大、更快。 CoRR公司 abs/2406.18583 ( 2024 ) 【i24】 彭文硕 , 张开鹏 , 岳阳 , 张浩 , 于乔 :
图像分类中视觉语言基础模型的数据自适应回溯。 CoRR公司 abs/2407.08787 ( 2024 ) [第23条] 陈梦照 , 邵文琪 , 彭旭 , 王佳浩 , 彭高 , 张开鹏 , 于乔 , 罗萍(Ping Luo) :
EfficientQAT:大型语言模型的高效量化软件培训。 CoRR公司 abs/2407.11062 ( 2024 ) [i22] 赵丽瑞 , 杨天朔 , 邵文琪 , 张玉欣(Yuxin Zhang) , 于乔 , 罗萍(Ping Luo) , 张开鹏 , 荣融记 :
Diffree:使用扩散模型绘制文本引导的无形状对象。 CoRR公司 abs/2407.16982 ( 2024 ) 【i21】 孟凡清 , 金旺(Jin Wang) , 李传浩 , 泉丰路 , 郝天 , 廖佳琪 , 西周朱 , 戴纪峰 , 于乔 , 罗萍(Ping Luo) , 张开鹏 , 邵文琪 :
MMIU:评估大型视觉语言模型的多模态多图像理解。 CoRR公司 腹肌/2408.02718 ( 2024 ) [i20] 李泽楷 , 郭子耀 , 赵望波 , 张天乐 , Zhi-Qi Cheng先生 , 萨米尔卡其色 , 张开鹏 , 艾哈迈德·萨杰迪 , Konstantinos N.Plataniotis公司 , 王凯(Kai Wang) , 杨友 :
在数据集提取中优先对齐。 CoRR公司 abs/2408.03360 ( 2024 ) 2023 [j4] 飞鸿路 , 杭晨 , 康丽 , 邓启亮 , 赵健(Jian Zhao) , 张开鹏 , 洪翰 :
朝向高质量面部面部阻塞修复。 ACM事务处理。 Multim公司。 计算。 Commun公司。 申请。 19 ( 1 ) : 24:1-24:23 ( 2023 ) [第16条] 陈梦照 , 邵文琪 , 彭旭 , 林明宝 , 张开鹏 , 费超 , 荣融记 , 于乔 , 罗萍(Ping Luo) :
DifferentRate:高效视觉变换器的不同压缩率。 ICCV公司 2023 : 17118-17128 [第15条] 沈启来(Shenqi Lai) , 西渡 , 贾国 , 张开鹏 :
RaMLP:通过区域感知混合实现愿景MLP。 国际JCAI 2023 : 999-1007 [第14条] 孟凡清 , 邵文琪 , 张林鹏 , 崇河江 , 张开鹏 , 于乔 , 罗萍(Ping Luo) :
基础模型是高效的多模式多任务模型选择器。 NeurIPS公司 2023 [i19] 陈梦照 , 邵文琪 , 彭旭 , 林明宝 , 张开鹏 , 费超 , 荣融记 , 于乔 , 罗萍(Ping Luo) :
DifferentRate:高效视觉变换器的不同压缩率。 CoRR公司 abs/2305.17997 ( 2023 ) [i18] 彭旭 , 邵文琪 , 张开鹏 , 彭高 , 刘硕 , 孟雷 , 孟凡清 , 黄思源(Siyuan Huang) , 于乔 , 罗萍(Ping Luo) :
LVLM-eHub:大型视觉语言模型的综合评估基准。 CoRR公司 abs/2306.09265 ( 2023 ) [i17] 岳阳 , 张开鹏 , 葛玉英 , 邵文琪 , 薛泽岳 , 于乔 , 罗萍(Ping Luo) :
对齐、调整和注入:声音引导的统一图像生成。 CoRR公司 abs/2306.11504 ( 2023 ) [i16] 张一元 , 开雄功 , 张开鹏 , 李洪生 , 于乔 , 欧阳万里 , 项羽月 :
元转换器:多模式学习的统一框架。 CoRR公司 abs/2307.10802 ( 2023 ) 【i15】 邵文琪 , 胡玉涛 , 彭高 , 孟雷 , 张开鹏 , 孟凡清 , 彭旭 , 黄思源(Siyuan Huang) , 李洪生 , 于乔 , 罗萍(Ping Luo) :
Tiny LVLM-eHub:与Bard的早期多模态实验。 CoRR公司 腹肌/2308.03729 ( 2023 ) [第14条] 孟凡清 , 邵文琪 , 张林鹏 , 崇河江 , 张开鹏 , 于乔 , 罗萍(Ping Luo) :
基础模型是高效的多模式多任务模型选择器。 CoRR公司 abs/2308.06262 ( 2023 ) [i13] 邵文琪 , 陈梦照 , 张兆阳 , 彭旭 , 赵丽瑞 , 李志谦 , 张开鹏 , 彭高 , 于乔 , 罗萍(Ping Luo) :
OmniQuant:大型语言模型的全方位校准量化。 CoRR公司 abs/2308.13137 ( 2023 ) [i12] 韩嘉明 , 张仁瑞 , 邵文琪 , 彭高 , 彭旭 , 韩晓 , 张开鹏 , 刘桓 , 宋文 , 郭子玉 , 徐东路 , 帅仁 , 温亚非 , 陈晓欣 , 项羽月 , 李洪生 , 于乔 :
ImageBind-LLM:多模式指令调整。 CoRR公司 abs/2309.03905 ( 2023 ) [i11] 张浩 , 张开鹏 , 徐鲁敏 , 沈启来(Shenqi Lai) , 邵文琪 , 南宁郑 , 罗萍(Ping Luo) , 于乔 :
语言驱动的动物身体和面部开放视觉关键点检测。 CoRR公司 abs/2310.05056 ( 2023 ) [i10] 郭子耀 , 王凯(Kai Wang) , 乔治·卡泽纳维特 , 李慧(音) , 张开鹏 , 杨友 :
通过难对齐轨迹匹配实现无损数据集提取。 CoRR公司 abs/2310.05773 ( 2023 ) [第九章] 张一元 , 开雄功 , 丁晓翰 , 张开鹏 , 吕方瑞 , 库尔特·科伊策 , 项羽月 :
走向统一有效的领域泛化。 CoRR公司 abs/2310.10008 ( 2023 ) [i8] 刘延庆 , 顾建阳 , 王凯(Kai Wang) , 郑朱 , 张开鹏 , 魏江 , 杨友 :
DREAM+:通过双向代表匹配进行高效数据集提取。 CoRR公司 绝对值/230.15052 ( 2023 ) [i7] 刘延庆 , 王凯(Kai Wang) , 邵文琪 , 罗萍(Ping Luo) , 于乔 , 迈克·郑寿 , 张开鹏 , 杨友 :
MLLMs增强视觉语言表征学习。 CoRR公司 abs/2311.18765 ( 2023 ) [i6] 韩嘉明 , 开雄功 , 张一元 , 王佳琪 , 张开鹏 , 林大华 , 于乔 , 彭高 , 项羽月 :
OneLLM:将所有模式与语言相结合的一个框架。 CoRR公司 abs/2312.03700 ( 2023 ) [i5] 林玉琪(Yuqi Lin) , 陈明浩 , 张开鹏 , 李恒嘉 , 李明明 , 郑阳 , 吕东琴 , 林斌(Binbin Lin) , 刘海峰 , 邓才 :
TagCLIP:一个本地到全球的框架,用于在不经过培训的情况下增强CLIP的开放本地多标签分类。 CoRR公司 abs/2312.12828 ( 2023 ) 2021 [第13条] 张开鹏 , 李振强 , 李志峰 , 刘伟 , 佐藤洋一 :
记忆神经路由。 NeurIPS公司 2021 : 13744-13756 2020 [j3] 张开鹏 , 刘宁(Ning Liu) , 高旺 :
基于改进NGA的关节空间时间最优轨迹规划的双线程方法。 J.机器人学 2020 : 6859589:1-6859589:13 ( 2020 ) [第12条] 张展鹏 , 张开鹏 :
FarSee-Net:通过高效多尺度上下文聚合和特征空间超分辨率实现实时语义分割。 ICRA公司 2020 : 8411-8417 [i4] 张展鹏 , 张开鹏 :
FarSee-Net:通过高效多尺度上下文聚合和特征空间超分辨率实现实时语义分割。 CoRR公司 2003年3月13日 ( 2020 )
2010 – 2019
2019 [注2] 温延东 , 张开鹏 , 李志峰 , 于乔 :
深度人脸识别中心丢失的综合研究。 国际期刊计算。 视觉。 127 ( 6-7 ) : 668-683 ( 2019 ) [第11条] 王凯(Kai Wang) , 杨剑飞 , 大郭 , 张开鹏 , 彭晓江 , 于乔 :
参与强度回归的Bootstrap模型集成和秩损失。 国际资本市场协会 2019 : 551-556 [第10条] 大郭 , 王凯(Kai Wang) , 杨剑飞 , 张开鹏 , 彭晓江 , 于乔 :
探索基于面部、身体和图像线索的群体凝聚力预测规则。 国际资本市场协会 2019 : 557-561 [i3] 王凯(Kai Wang) , 杨剑飞 , 大郭 , 张开鹏 , 彭晓江 , 于乔 :
参与强度回归的Bootstrap模型集成和秩损失。 CoRR公司 abs/1907.03422 ( 2019 ) 2018 【c9】 赵泰周 , 李成汉 , 张开鹏 , 胡成利 , 温斯顿·H·徐 :
PIVTONS:具有条件图像完成功能的姿势不变虚拟试穿鞋。 接种疫苗(6) 2018 : 654-668 【c8】 张开鹏 , 张雅良 , 温斯顿·H·徐 :
深度伪装人脸识别。 CVPR研讨会 2018 : 32-36 【c7】 李成汉 , 张开鹏 , 胡成利 , 恰文成 , 温斯顿·H·徐 :
人脸幻觉的属性增强卷积神经网络。 CVPR研讨会 2018 : 721-729 【c6】 张开鹏 , 张展鹏 , 恰文成 , 温斯顿·H·徐 , 于乔 , 刘伟 , 张彤(音译) :
面部幻觉的超同一卷积神经网络。 ECCV(11) 2018 : 196-211 【c5】 王凯(Kai Wang) , 曾晓星 , 杨剑飞 , Debin Meng公司 , 张开鹏 , 彭晓江 , 于乔 :
基于面部、身体和图像线索的群体情绪识别级联注意网络。 国际资本市场协会 2018 : 640-645 [i2] 张开鹏 , 张展鹏 , 恰文成 , 温斯顿·H·徐 , 于乔 , 刘伟 , 张彤(音译) :
面部幻觉的超同一卷积神经网络。 CoRR公司 abs/1811.02328 ( 2018 ) 2017 【c4】 张开鹏 , 张展鹏 , 王浩(Hao Wang) , 李志峰 , 于乔 , 刘伟 :
使用内部级联上下文CNN检测人脸。 ICCV公司 2017 : 3190-3198 【c3】 连治滩 , 张开鹏 , 王凯(Kai Wang) , 曾晓星 , 彭晓江 , 于乔 :
基于个体面部情感CNN和基于全局图像CNN的群体情感识别。 国际资本市场协会 2017 : 549-552 2016 [j1] 张开鹏 , 张展鹏 , 李志峰 , 于乔 :
基于多任务级联卷积网络的联合人脸检测与对齐。 IEEE信号处理。 莱特。 23 ( 10 ) : 1499-1503 ( 2016 ) [c2] 张开鹏 , 连治滩 , 李志峰 , 于乔 :
基于深度卷积神经网络的性别和微笑分类。 CVPR研讨会 2016 : 739-743 【c1】 温延东 , 张开鹏 , 李志峰 , 于乔 :
一种用于深度人脸识别的鉴别特征学习方法。 ECCV(7) 2016 : 499-515 [i1] 张开鹏 , 张展鹏 , 李志峰 , 于乔 :
基于多任务级联卷积网络的联合人脸检测与对齐。 CoRR公司 abs/1604.02878 ( 2016 )