哈金于
优化列表
![笔记](https://dblp.uni-trier.de/img/note-mark.dark.12x12.png)
2020年–今天
2024 [j7] Ju-ho Kim先生 , 郑宇熙 , Hyun-seo Shin先生 , 林昌英 , 哈金于 :
FA-ExU-Net:对短噪声语音鲁棒的说话人验证系统的嵌入式提取器和增强模型的同步训练。 IEEE ACM传输。 音频语音语言处理。 32 : 2269-2282 ( 2024 ) 2023 [第51条] Young-Joo Han(韩永珠) , 哈金于 :
SS-BSN:用于非局部自相似自监督去噪的注意盲点网络。 国际JCAI 2023 : 800-809 [公元50年] 郑宇熙 , 林昌英 , Ju-ho Kim先生 , Hyun-seo Shin先生 , 哈金于 :
使用大型预训练自监督学习模型进行说话人验证的一步知识提取和微调。 棘突间 2023 : 5271-5275 [i29] Young-Joo Han(韩永珠) , 哈金于 :
SS-BSN:用于非局部自相似自监督去噪的注意盲点网络。 CoRR公司 abs/2305.09890 ( 2023 ) [第28条] 郑宇熙 , 林昌英 , Ju-ho Kim先生 , Hyun-seo Shin先生 , 哈金于 :
使用大型预训练自监督学习模型进行说话人验证的一步知识提取和微调。 CoRR公司 abs/2305.17394 ( 2023 ) [i27] Wonbin Kim女士 , Hyun-seo Shin先生 , Ju-ho Kim先生 , 郑宇熙 , 林昌英 , 哈金于 :
PAS:用于抗噪声说话人验证的部分加性语音数据增强方法。 CoRR公司 abs/2307.10628 ( 2023 ) [i26] Hyun-seo Shin先生 , 郑宇熙 , Ju-ho Kim先生 , 林昌英 , Wonbin Kim女士 , 哈金于 :
HM-Conformer:一种基于Conformer的音频深度伪造检测系统,具有分层池和多级分类令牌聚合方法。 CoRR公司 abs/2309.08208 ( 2023 ) [i25] Ju-ho Kim先生 , 郑宇熙 , Hyun-seo Shin先生 , 林昌英 , 哈金于 :
Diff-SV:使用基于分数的扩散概率模型进行抗噪说话人验证的统一层次框架。 CoRR公司 abs/2309.08320 ( 2023 ) 【i24】 Young-Joo Han(韩永珠) , 哈金于 :
NM-FlowGAN:基于归一化流和生成对抗网络的混合方法建模sRGB噪声。 CoRR公司 abs/2312.10112 ( 2023 ) 2022 [j6] 宋贤渊 , 哈金于 :
BPCN:说话人欺骗检测中卷积神经网络的双点输入。 传感器 22 ( 12 ) : 4483 ( 2022 ) [公元49年] 沈惠珍 , 郑哲文(Jee-weon Jung) , Ju-ho Kim先生 , 哈金于 :
关注Max特征图和声场景分类联合训练。 ICASSP公司 2022 : 1036-1040 [公元48年] 郑哲文(Jee-weon Jung) , 嘻嘻嘻 , Hemlata Tak公司 , 沈惠珍 , Joon Son Chung先生 , 李凤珍 , 哈金于 , 尼古拉斯·W·D·埃文斯 :
AASIST:使用集成光谱-时间图形注意力网络的音频防抖。 ICASSP公司 2022 : 6367-6371 [公元47年] Ju-ho Kim先生 , 沈惠珍 , 郑宇熙 , 哈金于 :
RawNeXt:具有深层聚合和扩展动态缩放策略的可变时长语音的说话人验证系统。 ICASSP公司 2022 : 7647-7651 [公元46年] 沈惠珍 , 郑宇熙 , Jae-Han公园 , 李嘉惠 , 哈金于 :
用于文本无关说话人验证的图形关注特征聚合。 ICASSP公司 2022 : 7972-7976 [公元45年] Ju-ho Kim先生 , 郑宇熙 , 沈惠珍 , 哈金于 :
用于噪声环境中说话人验证的扩展U-Net。 棘突间 2022 : 590-594 [公元44年] 郑哲文(Jee-weon Jung) , Hemlata Tak公司 , 沈惠珍 , 嘻嘻嘻 , 李凤珍 , Soo-Whan Chung先生 , 哈金于 , 尼古拉斯·W·D·埃文斯 , 托米·金努恩 :
SASV 2022:第一个具有欺骗意识的说话人验证挑战。 棘突间 2022 : 2893-2897 [公元43年] 沈惠珍 , Hemlata Tak公司 , 刘雪晨 , 嘻嘻嘻 , 郑哲文(Jee-weon Jung) , Joon Son Chung先生 , Soo-Whan Chung先生 , 哈金于 , 李凤珍 , 马西米利亚诺·托迪斯科 , 赫克特·德尔加多 , 孔爱利(Kong Aik Lee) , 萨希杜拉马里兰州 , 托米·金努恩 , 尼古拉斯·W·D·埃文斯 :
第一个欺骗感知说话人验证挑战的基线系统:分数和嵌入融合。 奥德赛 2022 : 330-337 [第23条] 郑哲文(Jee-weon Jung) , Hemlata Tak公司 , 沈惠珍 , 嘻嘻嘻 , 李凤珍 , Soo-Whan Chung先生 , 洪国康 , 哈金于 , 尼古拉斯·W·D·埃文斯 , 托米·金努恩 :
SASV挑战2022:具有欺骗意识的说话人验证挑战评估计划。 CoRR公司 abs/2201.10283 ( 2022 ) [i22] 沈惠珍 , Hemlata Tak公司 , 刘雪晨 , 嘻嘻嘻 , 郑哲文(Jee-weon Jung) , Joon Son Chung先生 , Soo-Whan Chung先生 , 哈金于 , 李凤珍 , 马西米利亚诺·托迪斯科 , 赫克特·德尔加多 , 孔爱利(Kong Aik Lee) , 萨希杜拉马里兰州 , 托米·金努恩 , 尼古拉斯·W·D·埃文斯 :
第一个欺骗感知说话人验证挑战的基线系统:分数和嵌入融合。 CoRR公司 abs/2204.09976 ( 2022 ) 【i21】 Ju-ho Kim先生 , 郑宇熙 , 沈惠珍 , 哈金于 :
用于噪声环境中说话人验证的扩展U-Net。 CoRR公司 abs/2206.13044 ( 2022 ) [i20] 郑宇熙 , Hyun-seo Shin先生 , Ju-ho Kim先生 , 林昌英 , 哈金于 :
用于音乐类型分类的卷积通道分离和频率子带聚合。 CoRR公司 abs/2211.01599 ( 2022 ) [i19] Ju-ho Kim先生 , 郑宇熙 , Hyun-seo Shin先生 , 林昌英 , 哈金于 :
通用音频模型的集成参数高效调谐。 CoRR公司 abs/2211.02227 ( 2022 ) 2021 [c42] 郑哲文(Jee-weon Jung) , 沈惠珍 , Ju-ho Kim先生 , 哈金于 :
DCASENET:用于探测和分类声学场景和事件的集成预训练深度神经网络。 ICASSP公司 2021 : 621-625 [公元41年] 郑哲文(Jee-weon Jung) , 嘻嘻嘻 , 哈金于 , Joon Son Chung先生 :
为说话人验证绘制注意力网络图。 ICASSP公司 2021 : 6149-6153 [i18] Ju-ho Kim先生 , 沈惠珍 , 郑哲文(Jee-weon Jung) , 哈金于 :
从中庸教师那里学习度量:一种改进说话人验证系统泛化的监督学习方法。 CoRR公司 腹肌/2104.06604 ( 2021 ) [i17] 沈惠珍 , Ju-ho Kim先生 , 郑哲文(Jee-weon Jung) , 哈金于 :
考虑类抽象的联合学习声场景分类的注意最大特征图。 CoRR公司 abs/2104.07213 ( 2021 ) [i16] 郑哲文(Jee-weon Jung) , 嘻嘻嘻 , Hemlata Tak公司 , 沈惠珍 , Joon Son Chung先生 , 李凤珍 , 哈金于 , 尼古拉斯·W·D·埃文斯 :
AASIST:使用集成光谱-时间图形注意力网络的音频防抖。 CoRR公司 abs/2110.01200 ( 2021 ) 【i15】 沈惠珍 , 郑宇熙 , Jae-Han公园 , 李嘉惠 , 哈金于 :
用于文本相关说话人验证的图形关注特征聚合。 CoRR公司 abs/2112.12343 ( 2021 ) 2020 [j5] 宋贤渊 , Min-Sung Koh公司 , Jae-Han公园 , 哈金于 :
针对自动说话人验证系统的新重播攻击。 IEEE接入 8 : 36080-36088 ( 2020 ) 【j4】 Jee-Weon Jung先生 , 嘻嘻嘻 , 沈惠珍 , 哈金于 :
声场景分类中的知识提取。 IEEE接入 8 : 166870-166879 ( 2020 ) [公元40年] Ju-ho Kim先生 , Jee-Weon Jung先生 , 沈惠珍 , 哈金于 :
用于声场景分类的音频标签表示引导的双注意网络。 数据中心 2020 : 76-80 [公元39年] 宋贤渊 , 哈金于 :
回放攻击检测中卷积神经网络的多点输入。 ICASSP公司 2020 : 6444-6448 [公元38年] 沈惠珍 , 嘻嘻嘻 , 郑哲文(Jee-weon Jung) , 哈金于 :
用于回放欺骗检测的带声学配置的自我监督预训练。 棘突间 2020 : 1091-1095 [公元37年] 郑哲文(Jee-weon Jung) , 沈惠珍 , Ju-ho Kim先生 , Seung-bin Kim先生 , 哈金于 :
使用音频标记进行声学场景分类。 棘突间 2020 : 1176-1180 [公元36年] 郑哲文(Jee-weon Jung) , Seung-bin Kim先生 , 沈惠珍 , Ju-ho Kim先生 , 哈金于 :
改进的RawNet具有特征映射缩放功能,用于使用原始波形验证与文本无关的说话人。 棘突间 2020 : 1496-1500 [公元35年] Seung-bin Kim先生 , 郑哲文(Jee-weon Jung) , 沈惠珍 , Ju-ho Kim先生 , 哈金于 :
使用原始波形进行短音说话人验证的分段聚合。 棘突间 2020 : 1521-1525 [公元34年] Jee-Weon Jung先生 , Ju-ho Kim先生 , 沈惠珍 , Seung-bin Kim先生 , 哈金于 :
用于说话人验证的选择性深扬声器嵌入增强。 奥德赛 2020 : 171-178 [公元33年] 宋贤渊 , Min-Sung Koh公司 , 哈金于 :
用于鲁棒欺骗检测的时移语音信号的相位谱。 奥德赛 2020 : 319-325 [第14条] 郑哲文(Jee-weon Jung) , 沈惠珍 , 嘻嘻嘻 , 哈金于 :
辅助信息在回放攻击欺骗检测中的作用研究。 CoRR公司 abs/2001.11688 ( 2020 ) [i13] 郑哲文(Jee-weon Jung) , Seung-bin Kim先生 , 沈惠珍 , Ju-ho Kim先生 , 哈金于 :
改进了RawNet,使用Raw Waveforms对文本相关的说话人进行过滤式重新缩放验证。 CoRR公司 abs/2004.00526 ( 2020 ) [i12] Seung-bin Kim先生 , 郑哲文(Jee-weon Jung) , 沈惠珍 , Ju-ho Kim先生 , 哈金于 :
使用原始波形进行短句说话人验证的分段聚合。 CoRR公司 abs/2005.03329 ( 2020 ) [i11] 沈惠珍 , 郑哲文(Jee-weon Jung) , Ju-ho Kim先生 , Seung-bin Kim先生 , 哈金于 :
集成重播欺骗感知文本相关说话人验证。 CoRR公司 abs/2006.05599 ( 2020 ) [i10] 沈惠珍 , 郑哲文(Jee-weon Jung) , Ju-ho Kim先生 , 哈金于 :
在声场景分类中使用深层结构捕获分散的鉴别信息。 CoRR公司 abs/2007.04631 ( 2020 ) [第九章] 郑哲文(Jee-weon Jung) , 嘻嘻嘻 , 哈金于 , Joon Son Chung先生 :
为说话人验证绘制注意力网络图。 CoRR公司 abs/2010.11543 ( 2020 )
2010 – 2019
2019 [j3] 嘻嘻嘻 , Byung-Min So先生 , 伊尔霍·杨 , 宋贤渊 , 哈金于 :
使用深度神经网络自动恢复损坏的音频文件。 数字。 投资。 30 : 117-126 ( 2019 ) [公元32年] Jee-Weon Jung先生 , 嘻嘻嘻 , 沈惠珍 , 哈金于 :
基于余弦的说话人嵌入师生学习在说话人验证中的短音补偿。 阿斯鲁 2019 : 335-341 [公元31年] 郑哲文(Jee-weon Jung) , 嘻嘻嘻 , 沈惠珍 , 哈金于 :
提取声学场景分类中专家深度神经网络的知识。 数据中心 2019 : 114-118 [公元30年] 嘻嘻嘻 , 郑哲文(Jee-weon Jung) , 沈惠珍 , 哈金于 :
使用软标签的师生学习进行声场景分类。 棘突间 2019 : 614-618 [公元29年] 郑哲文(Jee-weon Jung) , 沈惠珍 , 嘻嘻嘻 , 哈金于 :
针对ASVspoof 2019挑战,使用端到端DNN,利用补充的高分辨率信息重放攻击检测。 棘突间 2019 : 1083-1087 [公元28年] 郑哲文(Jee-weon Jung) , 嘻嘻嘻 , Ju-ho Kim先生 , 沈惠珍 , 哈金于 :
RawNet:高级端到端深度神经网络,使用原始波形进行与文本无关的说话人验证。 棘突间 2019 : 1268-1272 [公元27年] 嘻嘻嘻 , 郑哲文(Jee-weon Jung) , 伊尔霍·杨 , 宋贤渊 , 沈惠珍 , 哈金于 :
基于说话人基向量和全说话人硬否定挖掘的说话人验证端到端损失。 棘突间 2019 : 4035-4039 [i8] 嘻嘻嘻 , 郑哲文(Jee-weon Jung) , 伊尔霍·杨 , 宋贤渊 , 沈惠珍 , 哈金于 :
基于说话人基向量的端到端损失和用于说话人验证的全说话人硬否定挖掘。 CoRR公司 abs/1902.02455 ( 2019 ) [i7] 郑哲文(Jee-weon Jung) , 嘻嘻嘻 , Ju-ho Kim先生 , 沈惠珍 , 哈金于 :
RawNet:高级端到端深度神经网络,使用原始波形进行文本相关说话人验证。 CoRR公司 abs/1904.08104 ( 2019 ) [i6] 郑哲文(Jee-weon Jung) , 沈惠珍 , 嘻嘻嘻 , 哈金于 :
在ASVspoof 2019挑战赛中,使用端到端DNN,用补充的高分辨率信息重播攻击检测。 CoRR公司 abs/1904.10134 ( 2019 ) [i5] 嘻嘻嘻 , 郑哲文(Jee-weon Jung) , 沈惠珍 , 哈金于 :
使用师生学习和软标记进行声场景分类。 CoRR公司 abs/1904.10135 ( 2019 ) [i4] 嘻嘻嘻 , 郑哲文(Jee-weon Jung) , 沈惠珍 , 伊尔霍·杨 , 哈金于 :
基于余弦相似性的对抗过程。 CoRR公司 abs/1907.00542 ( 2019 ) [i3] 沈惠珍 , 嘻嘻嘻 , 郑哲文(Jee-weon Jung) , 哈金于 :
采用声学配置的自我监督预培训,用于回放欺骗检测。 CoRR公司 abs/1910.09778 ( 2019 ) 2018 [公元26年] 郑哲文(Jee-weon Jung) , 嘻嘻嘻 , 沈惠珍 , 哈金于 :
基于DNN的多层次特征集成用于声场景分类。 数据中心 2018 : 118-122 [公元25年] 郑哲文(Jee-weon Jung) , 嘻嘻嘻 , 伊尔霍·杨 , 沈惠珍 , 哈金于 :
使用深度神经网络的完整端到端说话人验证系统:从原始信号到验证结果。 ICASSP公司 2018 : 5349-5353 [公元24年] 郑哲文(Jee-weon Jung) , 嘻嘻嘻 , 伊尔霍·杨 , 沈惠珍 , 哈金于 :
使用原始波形进行与文本无关的扬声器验证,避免端到端DNN中的扬声器过度匹配。 棘突间 2018 : 3583-3587 【c23】 沈惠珍 , 郑哲文(Jee-weon Jung) , 嘻嘻嘻 , 宋贤渊 , 哈金于 :
基于噪声类多任务学习的自动说话人验证重放欺骗检测系统。 TAAI公司 2018 : 172-176 [i2] 沈惠珍 , Jee-Weon Jung先生 , 嘻嘻嘻 , 宋贤渊 , 哈金于 :
通过多任务学习,利用重放噪声重放攻击欺骗检测系统。 CoRR公司 腹肌/1808.09638 ( 2018 ) [i1] 郑哲文(Jee-weon Jung) , 嘻嘻嘻 , 沈惠珍 , 哈金于 :
通过基于余弦的说话人嵌入师生学习实现说话人验证中的短句补偿。 CoRR公司 abs/1810.10884 ( 2018 ) 2017 [注2] Myung-Jae Kim先生 , 伊尔霍·杨 , Min-Seok Kim女士 , 哈金于 :
使用简化的背景说话人语音特征集进行说话人识别的直方图均衡。 前沿信息技术。 电子。 工程师。 18 ( 5 ) : 738-750 ( 2017 ) [公元22年] Jee-Weon Jung先生 , 嘻嘻嘻 , 伊尔霍·杨 , 宋贤渊 , 沈惠珍 , 哈金于 :
DCASE2017基于DNN的音频场景分类:双输入功能、平衡成本和随机数据复制。 数据中心 2017 : 59-63 【c21】 伊尔霍·杨 , 嘻嘻嘻 , 宋贤渊 , 哈金于 :
对从短测试话语中提取的i向量应用补偿技术,使用深度神经网络进行说话人验证。 ICASSP公司 2017 : 5490-5494 [公元20年] 嘻嘻嘻 , 郑哲文(Jee-weon Jung) , 伊尔霍·杨 , 宋贤渊 , 哈金于 :
针对文本相关说话人验证的扩展端到端DNN联合培训。 棘突间 2017 : 1532-1536 2016 [第19条] 嘻嘻嘻 , 伊尔霍·杨 , Myung-Jae Kim先生 , 宋贤渊 , 哈金于 :
基于高级b向量系统的深度神经网络作为说话人验证分类器。 ICASSP公司 2016 : 5465-5469 2013 [第18条] Myung-Jae Kim先生 , 伊尔霍·杨 , 哈金于 :
基于模糊C均值的直方图均衡算法在说话人识别中的应用。 SLSP公司 2013 : 143-151 2012 [第17条] 伊尔霍·杨 , Min-Seok Kim女士 , Byung-Min So先生 , Myung-Jae Kim先生 , 哈金于 :
基于核主成分分析集成的鲁棒说话人识别。 海地(1) 2012 : 71-78 2011 [第16条] 伊尔霍·杨 , Min-Seok Kim女士 , Byung-Min So先生 , Myung-Jae Kim先生 , 哈金于 :
基于特征增强方法集成的说话人识别。 伊奇特(1) 2011 : 606-613 2010 [第15条] Min-Seok Kim女士 , 伊尔霍·杨 , 哈金于 :
用于说话人验证的核多模态鉴别分析。 ICASSP公司 2010 : 4498-4501
2000 – 2009
2009 [第14条] Min-Seok Kim女士 , 伊尔霍·杨 , 哈金于 :
基于核多模态判别分析的鲁棒说话人识别。 伊克泰 2009 : 319-322 2008 [第13条] Min-Seok Kim女士 , 伊尔霍·杨 , 哈金于 :
最大化GMM之间的距离以进行说话人验证。 ICNC(6) 2008 : 175-178 [第12条] Min-Seok Kim女士 , 伊尔霍·杨 , 哈金于 :
基于贪婪核PCA的鲁棒说话人识别。 ICTAI(2) 2008 : 143-146 2007 [第11条] 金圣周 , Min-Seok Kim女士 , 哈金于 :
移动环境下基于LSF时间分解的说话人识别。 ICESS公司 2007 : 338-346 [第10条] Min-Seok Kim女士 , 哈金于 :
一种新的基于旋转的说话人识别特征变换方法。 ICTAI(1) 2007 : 68-73 2006 【c9】 Min-Seok Kim女士 , 哈金于 , Keun-Chang-Kwak公司 , 苏英池 :
基于混合PCA和LDA的鲁棒文本无关说话人识别。 云母 2006 : 1067-1074 2005 【c8】 哈金于 :
基于增强PCA的未知误匹配条件下的说话人识别。 国际标准化信息系统 2005 : 668-676 2002 【c7】 哈金于 , 金素金(Jin Suk Kim) :
一个训练提示生成算法用于连接的口语识别。 棘突间 2002 : 1557-1560 2000 [j1] 哈金于 , 哦容焕 :
使用非均匀单位识别500单词词汇的神经网络。 神经网络 13 ( 6 ) : 681-688 ( 2000 ) 【c6】 哈金于 , Hoon Kim先生 , Joon Mo Hong公司 , 金敏生 , Jong-Seok Lee(李宗硕) :
使用单程算法的大词汇量韩语连续语音识别。 棘突间 2000 : 278-281
1990 – 1999
1998 【c5】 哈金于 , Hoon Kim先生 , Jae-Seung Choi先生 , Joon Mo Hong公司 , Kew-Suh公园 , Jong-Seok Lee(李宗硕) , 李熙友(Hee-Youn Lee) :
韩国广播新闻语音的自动识别。 ICSLP公司 1998 1997 【c4】 哈金于 , 哦容焕 :
使用声学子单词单元识别500词汇单词的神经网络。 ICASSP公司 1997 : 3277-3280 1996 【c3】 哈金于 , 哦容焕 :
一种使用声学子词单元进行连续语音识别的神经网络。 ICSLP公司 1996 : 506-509 1995 【c2】 哈金于 , 金圣周 , 哦容焕 :
连续语音识别中的模糊音素相似关系估计。 国际能源署/美国国际能源署 1995 : 665-671 [c1] 哈金于 , 哦容焕 :
使用非均匀单元进行连续语音识别的神经网络。 EUROSPEECH公司 1995 : 1677-1680
合著者索引
![](https://dblp.uni-trier.de/img/cog.dark.24x24.png)