迪普·维贾亚塞南
人员信息
优化列表
2020年–今天
2024 [j7] Shikha Baghel公司 , 史莱亚斯·拉莫吉 , 索米尔·贾因 , 普拉蒂克·罗伊·乔杜里 , 普拉奇·辛格 , 迪普·维贾亚塞南 , 斯里拉姆·加纳帕西 :
2023年DISPLACE挑战总结——对话环境中SPeaker和LAlanguage的数字化。 语音通信。 161 : 103080 ( 2024 ) [i7] 谢里夫·巴布·卡卢里 , 普拉奇·辛格 , 普拉蒂克·罗伊·乔杜里 , 阿波瓦·库尔卡尼 , Shikha Baghel公司 , 普拉迪奥斯·赫格德 , Swapnil Sontakke公司 , Deepak K.T.公司。 , S.R.马哈德瓦·普拉桑纳 , 迪普·维贾亚塞南 , 斯里拉姆·加纳帕西 :
第二个替代挑战:对话环境中SPeaker和LAlanguage的数字化。 CoRR公司 abs/2406.09494 ( 2024 ) 2023 [公元32年] Parag Jha公司 , 大卫·S·苏曼 , 迪普·维贾亚塞南 :
基于美国有线电视新闻网(CNN)的印度次大陆周围卫星图像的热带气旋强度估计。 CVIP(2) 2023 : 172-185 [公元31年] 维迪亚什雷·卡纳布尔 , 迪普·维贾亚塞南 , Sumam David S公司 , Sreejith Govindan公司 :
使用合成数据从显微镜尿液涂片图像中增强细菌和脓细胞语义分割的深度学习方法。 CVIP(1) 2023 : 244-255 [c30] 哈沙尔·辛格 , 维迪亚什雷·卡纳布尔 , 大卫·S·苏曼 , 迪普·维贾亚塞南 , Sreejith Govindan公司 :
基于对抗学习的低分辨率革兰氏染色显微图像半监督语义分割。 CVIP(2) 2023 : 362-373 [公元29年] Shikha Baghel公司 , 史莱亚斯·拉莫吉 , 西达尔特 , 兰贾纳·H , 普拉奇·辛格 , 索米尔·贾因 , 普拉蒂克·罗伊·乔杜里 , 考斯图布·库尔卡尼 , 斯瓦普尼·帕迪 , 迪普·维贾亚塞南 , 斯里拉姆·加纳帕西 :
2023年DISPLACE挑战——对话环境中SPeaker和LAlanguage的数字化。 INTERSPEECH公司 2023 : 3562-3566 [i6] Shikha Baghel公司 , 史莱亚斯·拉莫吉 , 西达尔特 , 兰贾纳·H , 普拉奇·辛格 , 索米尔·贾因 , 普拉蒂克·罗伊·乔杜里 , 考斯图布·库尔卡尼 , 斯瓦普尼·帕迪 , 迪普·维贾亚塞南 , 斯里拉姆·加纳帕西 :
替代挑战:对话环境中SPeaker和LAlanguage的数字化。 CoRR公司 abs/2303.00830 ( 2023 ) [i5] Shikha Baghel公司 , 史莱亚斯·拉莫吉 , 索米尔·贾因 , 普拉蒂克·罗伊·乔杜里 , 普拉奇·辛格 , 迪普·维贾亚塞南 , 斯里拉姆·加纳帕西 :
2023年DISPLACE挑战总结——对话环境中SPeaker和LAlanguage的数字化。 CoRR公司 abs/2311.12564 ( 2023 ) 2022 [j6] 沙贾汗阿布巴克 , 迪普·维贾亚塞南 , 大卫·S·苏曼 , 普亚·K·苏雷什 , 萨拉斯威·斯雷拉姆 :
低倍渗出细胞学图像的语义分割:一种半监督方法。 计算。 生物医药 150 : 106179 ( 2022 ) [公元28年] 沙贾汗阿布巴克 , 迪普·维贾亚塞南 , 大卫·S·苏姆 , 普亚·K·苏雷什 , Saraswathy Sreeram公司 :
渗出细胞学图像的半监督语义分割。 CVMI公司 2022 : 429-440 [c27] 马扬克·拉杰普罗希特 , 沙贾汗阿布巴克 , 迪普·维贾亚塞南 , 大卫·S·苏曼 , 普亚·K·苏雷什 , 萨拉斯威·斯雷拉姆 :
使用对抗训练对渗出细胞学图像进行半监督语义分割。 CVMI公司 2022 : 539-551 [公元26年] 沙贾汉·阿博巴克 , 阿卡什·维玛 , 迪普·维贾亚塞南 , 大卫·S·苏曼 , 普亚·K·苏雷什 , Saraswathy Sreeram公司 :
胸腹腔积液低分辨率细胞学图像的语义分割。 NCC公司 2022 : 82-87 [i4] Chethan Reddy G.P.公司。 , Pullagurla Abhijith Reddy公司 , 维迪亚什雷·卡纳布尔 , 迪普·维贾亚塞南 , 大卫·S·苏曼 , Sreejith Govindan公司 :
DIBaS数据集中革兰氏染色显微图像的半自动标记和语义分割。 CoRR公司 abs/2208.10737 ( 2022 ) 2021 [公元25年] 谢里夫·巴布·卡卢里 , 迪普·维贾亚塞南 , 斯里拉姆·加纳帕西 , Ragesh Rajan M公司 , Prashant Krishnan五世 :
NISP:一个用于说话人分析的多语言多重音数据集。 ICASSP公司 2021 : 6953-6957 [公元24年] 科特拉·文卡塔·赛·里特维克 , 谢里夫·巴布·卡卢里 , 迪普·维贾亚塞南 :
从DiCOVA数据集上的光谱特征检测COVID-19。 Interspeech公司 2021 : 936-940 2020 [j5] 谢里夫·巴布·卡卢里 , 迪普·维贾亚塞南 , 斯里拉姆·加纳帕西 :
根据短时语音数据自动分析扬声器。 语音通信。 121 : 16-28 ( 2020 ) 【c23】 S.拉克希米 , 科特拉·文卡塔·赛·里特维克 , 迪普·维贾亚塞南 , 大卫·S·苏曼 , 萨拉斯威·斯雷拉姆 , 普亚·K·苏雷什 :
基于深度学习模型的Ki-67指数估计和自动标记数据。 欧洲工商管理委员会 2020 : 1412-1415 [公元22年] 沙贾汗阿布巴克 , 迪普·维贾亚塞南 , 大卫·S·苏姆 , 普亚·K·苏雷什 , Saraswathy Sreeram公司 :
渗出细胞学恶性肿瘤自动检测的深度学习模型。 ICSPCC公司 2020 : 1-5 [i3] 谢里夫·巴布·卡卢里 , 迪普·维贾亚塞南 , 斯里拉姆·加纳帕西 , Ragesh Rajan M公司 , Prashant Krishnan五世 :
NISP:用于说话人评测的多语言多内容数据集。 CoRR公司 abs/2007.06021 ( 2020 ) [i2] 科特拉·文卡塔·赛·里特维克 , 谢里夫·巴布·卡卢里 , 迪普·维贾亚塞南 :
从电话质量语音数据中检测新冠肺炎患者。 CoRR公司 腹肌/2011.04299 ( 2020 )
2010 – 2019
2019 [j4] Ragesh Rajan M公司 , 迪普·维贾亚塞南 , 阿什温·维贾亚库玛 :
预测 加马卡 s-卡纳蒂克音乐中的基本装饰。 IEEE接入 7 : 175386-175395 ( 2019 ) 【c21】 谢里夫·巴布·卡卢里 , 迪普·维贾亚塞南 , 斯里拉姆·加纳帕西 :
一种基于深度神经网络的端到端模型,用于从短时语音中估计联合身高和年龄。 ICASSP公司 2019 : 6580-6584 [公元20年] S.拉克希米 , 迪普·维贾亚塞南 , 大卫·S·苏曼 , 萨拉斯威·斯雷拉姆 , 普亚·K·苏雷什 :
Ki-67标记指数自动评估的综合深度学习方法。 TENCON公司 2019 : 2310-2314 2018 [第19条] Ragesh Rajan M公司 , 阿什温·维贾亚库马尔 , 迪普·维贾亚塞南 :
卡纳提克音乐中美学元素的预测:一种机器学习方法。 INTERSPEECH公司 2018 : 2042-2046 [第18条] 阿南德·阿什塔穆蒂 , 普拉纳夫·普拉萨德 , 沙申克达尔 , 迪普·维贾亚塞南 :
频率轮廓建模以合成狂欢音乐的自然长笛演奏。 SPCOM公司 2018 : 172-176 2016 [c17] 萨钦·韦内卡尔 , 索拉巴·奈尔 , 迪普·维贾亚塞南 , 罗希特·兰扬 :
一种使用时间信号分析和机器学习对正常/异常心音图记录进行分类的新方法。 CinC公司 2016 [第16条] 萨钦·韦内卡尔 , 迪普·维贾亚塞南 , 罗希特·兰扬 :
使用神经网络和增强树对多模态数据中的心跳进行稳健检测的新方法。 CinC公司 2016 [第15条] 谢里夫·巴布·卡卢里 , 阿什温·维贾亚库玛 , 迪普·维贾亚塞南 , 丽塔·辛格 :
从语音数据中估计多个物理参数。 MLSP公司 2016 : 1-5 2014 [i1] 马纳西·文卡泰什(Manasij Venkatesh) , 维卡斯·马贾吉 , 迪普·维贾亚塞南 :
使用隐马尔可夫模型对脱机手写识别中的卡纳达字符进行隐式分割。 CoRR公司 abs/1410.4341 ( 2014 ) 2012 [j3] 迪普·维贾亚塞南 , 法比奥·瓦伦特 , 埃尔维·布拉德 :
MFCC和TDOA功能以外的会议录音的多流扬声器日记化。 语音通信。 54 ( 1 ) : 55-67 ( 2012 ) [第14条] 迪普·维贾亚塞南 , 法比奥·瓦伦特 :
基于大时差特征向量的会议发言人日记化。 ICASSP公司 2012 : 4173-4176 [第13条] 迪普·维贾亚塞南 , 法比奥·瓦伦特 :
大时差矢量的降维,用于说话人日记化。 SAPA@INTERSPEECH公司 2012 : 64-67 [第12条] 迪普·维贾亚塞南 , 法比奥·瓦伦特 :
DiarTk:一个用于多流发言人日记化研究及其在会议记录中的应用的开源工具包。 INTERSPEECH公司 2012 : 2170-2173 2011 [注2] 迪普·维贾亚塞南 , 法比奥·瓦伦特 , 埃尔维·布拉德 :
MFCC和TDOA特征的信息论组合用于说话人区分。 IEEE传输。 语音音频处理。 19 ( 2 ) : 431-438 ( 2011 ) [第11条] 法比奥·瓦伦特 , 迪普·维贾亚塞南 , 彼得·莫特利切克 :
基于演讲者角色n-gram模型的会议演讲者日记。 ICASSP公司 2011 : 4416-4419 [第10条] 迪普·维贾亚塞南 , 法比奥·瓦伦特 , 彼得·莫特利切克 :
通过信息瓶颈系统输出组合实现多流扬声器日记化。 ICASSP公司 2011 : 4420-4423 2010 【c9】 迪普·维贾亚塞南 , 法比奥·瓦伦特 , 埃尔维·布拉德 :
超过两个声学特征流的多流扬声器日记化。 ICASSP公司 2010 : 4950-4953 【c8】 法比奥·瓦伦特 , 彼得·莫特利切克 , 迪普·维贾亚塞南 :
会议记录的变异贝叶斯说话人日记。 ICASSP公司 2010 : 4954-4957 【c7】 迪普·维贾亚塞南 , 法比奥·瓦伦特 , 埃尔维·布拉德 :
基于信息瓶颈框架的快速多流日记化研究进展。 INTERSPEECH公司 2010 : 2650-2653
2000 – 2009
2009 [j1] 迪普·维贾亚塞南 , 法比奥·瓦伦特 , 埃尔维·布拉德 :
会议数据发言人日记化的信息论方法。 IEEE传输。 语音音频处理。 17 ( 7 ) : 1382-1393 ( 2009 ) 【c6】 迪普·维贾亚塞南 , 法比奥·瓦伦特 , 埃尔维·布拉德 :
基于互信息的频道选择,用于会议数据的演讲者日记化。 ICASSP公司 2009 : 4065-4068 【c5】 迪普·维贾亚塞南 , 法比奥·瓦伦特 , 埃尔维·布拉德 :
KL重新排列,用于具有多个特征流的说话者二元化。 INTERSPEECH公司 2009 : 1059-1062 2008 【c4】 迪普·维贾亚塞南 , 法比奥·瓦伦特 , 埃尔维·布拉德 :
结合凝聚聚类和顺序聚类进行说话人日记化。 ICASSP公司 2008 : 4361-4364 【c3】 迪普·维贾亚塞南 , 法比奥·瓦伦特 , 埃尔维·布拉德 :
在信息瓶颈框架中集成时差特性以实现快速说话人日记化。 INTERSPEECH公司 2008 : 40-43 2007 [c2] 迪普·维贾亚塞南 , 法比奥·瓦伦特 , 埃尔维·布拉德 :
会议数据演讲者日记化的聚合信息瓶颈。 ASRU公司 2007 : 250-255 【c1】 斯里加内什·马德瓦纳 , 迪普·维贾亚塞南 , Thanigai Murugan Kadiresan公司 :
LipiTk:一个用于在线手写识别的通用工具包。 SIGGRAPH课程 2007 : 13