2007年第13届KDD:美国加利福尼亚州圣何塞
帕维尔·伯克欣 , 里奇·卡鲁阿纳 , 吴新东 :
第13届ACM SIGKDD知识发现和数据挖掘国际会议论文集,美国加利福尼亚州圣何塞,2007年8月12-15日。 ACM公司 2007 ,国际标准图书编号 978-1-59593-609-7 克里斯·安德森 :
计算长尾中的潜在需求。 1 Usama M.Fayyad公司 :
从挖掘网络到发明互联网背后的新科学。 2-3 乔恩·克莱恩伯格 :
挖掘社交网络数据的挑战:过程、隐私和悖论。 4-5
研究跟踪文件
迪帕克·阿加瓦尔 , 迪曼·巴曼 , 迪米特里奥斯·古诺普洛斯 , 尼尔·E·杨 , 翻转Korn , 迪维什·斯利瓦斯塔瓦 :
在分级摘要中高效解释更改。 6-15 迪帕克·阿加瓦尔 , 安德烈·布罗德 , 迪帕扬·查克拉巴蒂 , 德扬·迪克利克 , 瓦尼娅·约西福夫斯基 , 梅萨姆·萨耶迪安 :
在多个分辨率下估计罕见事件的发生率。 16-25岁 迪帕克·阿加瓦尔 , 斯鲁贾纳·梅鲁古 :
大规模二元数据的预测离散潜在因素模型。 26-35 查鲁·C·阿加瓦尔 , 菲利普·S·余 :
数据流中的字符串分类。 36至45 查鲁·C·阿加瓦尔 , 钠-钽 , 王建勇 , 冯建华 , 穆罕默德·贾维德·扎基 :
Xproj:一个用于预测xml文档结构集群的框架。 46-55 尼古拉·阿克 , Anindya Ghose公司 , 泛神经炎G.Ipeirotis :
给我看看钱!: 通过挖掘消费者评论得出产品特征的定价能力。 56-65 安德鲁·阿诺德 , 刘燕(Yan Liu) , 安倍直树 :
用图形granger方法进行时间因果建模。 66-75 里卡多·巴扎·耶茨 , 亚历山德罗·提贝里 :
从查询日志中提取语义关系。 76-85 希拉·贝克尔 , 玛尔塔·阿里亚斯 :
使用专家建议随概念漂移进行实时排名。 86-94 罗伯特·M·贝尔 , 耶胡达·科伦 , 克里斯·沃林斯基 :
在多个尺度上建立关系模型,以提高大型推荐系统的准确性。 95-104 迪帕瓦利·巴格瓦特 , Kave Eshghi公司 , 潘卡杰·梅赫拉 :
基于内容的文档路由和索引分区,用于大型语料库中基于相似性的可扩展搜索。 105-112 Wanpracha艺术Chaovalitwongse , 雅居扇 , 拉杰什·萨奇迪奥 :
支持特征机对异常大脑活动进行分类。 113-122 陈建辉 , 郑钊 , 叶洁平 , 刘欢 :
用于聚类的非线性自适应距离度量学习。 123-132 陈一新 , 李图 :
实时流数据的基于密度的聚类。 133-142 彼得·A·周 , 布雷特·巴德 , 塔玛拉·G·科尔达 , 艾哈迈德·阿卜杜拉利 :
使用PARAFAC2进行跨语言信息检索。 143-152 云芝(Yun Chi) , 宋晓丹 , 周登勇(Dengyong Zhou) , 小野幸二 , Belle L.Tseng女士 :
结合时间平滑度的进化谱聚类。 153-162年 云芝(Yun Chi) , 生火朱 , 宋晓丹 , Jun’ichi Tatemura公司 , Belle L.Tseng女士 :
通过社区分解对博客圈进行结构和时间分析。 163-172 苏米特·乔普拉 , Trivikraman Thampy公司 , 莱希 , 安德鲁·卡普林 , 燕乐存 :
用非参数潜在流形模型发现房价的隐含结构。 173-182 保罗·科托弗里 , 基利安·斯托菲尔 :
随机过程和时态数据挖掘。 183-190年 丹尼尔·克拉布特里 , 彼得·安德烈 , 高晓英 :
利用未充分表示的查询方面进行自动查询扩展。 191-200 阿伦·库洛塔 , 迈克尔·L·威克 , 罗伯特·J·霍尔 , 马修·马尔齐利 , 安德鲁·麦克拉姆 :
使用自适应相似性度量对数据库记录进行规范化。 201-209 戴文元 , 桂龙雪 , 强阳(Qiang Yang) , Yong Yu(永余) :
基于协同聚类的域外文档分类。 210-219 考斯塔夫达斯 , 杰夫·G·施耐德 :
检测分类数据集中的异常记录。 220-229 阿尼尔班·达斯古普塔 , Petros Drineas公司 , 布洛斯·哈布 , 瓦尼娅·约西福夫斯基 , 迈克尔·W·马奥尼 :
文本分类的特征选择方法。 230-239 伊恩·大卫德森 , S.S.拉维 , 马丁·埃斯特尔 :
高效的增量约束聚类。 240-249 梅格纳·迪奥达尔(Meghana Deodhar) , 乔伊迪普·戈什 :
同时联合聚类和从复杂数据中学习的框架。 250-259 克里斯·H·Q·丁 , 荣进 , 陶莉 , 霍斯特·D·西蒙 :
使用格林函数和核正则化的学习框架及其在推荐系统中的应用。 260-269 《德京斗》 , 格温·A·弗里什科夫 , 贾维荣 , 罗伯特·M·弗兰克 , 艾伦·D·马洛尼 , 唐·M·塔克 :
神经电磁本体(NEMO)的开发:挖掘脑电波本体的框架。 270-279 格雷戈里·德鲁克 , 克里斯·帕尔 , 安德鲁·麦克拉姆 , 朱晓金 :
采用混合生成/鉴别方法的半监督分类。 280-289 丽莎·弗里德兰 , 大卫·D·延森 :
寻找部落:从就业模式中识别紧密联系的个人。 290-299 加布里埃尔·佩昌丰 , 于旭 , 刘欢 , 菲利普·S·余 :
时间相关的事件层次结构构造。 300-309 拜伦·J·高 , 马丁·埃斯特尔 , Jin-yi Cai公司 , 奥利弗·舒尔特 , 辉雄 :
最小一致子集覆盖问题及其在数据挖掘中的应用。 310-319 荣格 , 马丁·埃斯特尔 , 文进 , 伊恩·大卫德森 :
约束驱动的集群。 320-329 福斯卡·吉安诺蒂 , 米尔科·南尼 , 法比奥·皮内利 , 迪诺·佩德莱斯基 :
轨迹模式挖掘。 330-339 甄国 , 张忠飞 , 埃里克·P·星 , 克里斯托斯·法洛索斯 :
增强了多媒体数据库中多模式数据挖掘的最大限度学习。 340至349 汉内斯·海金海默 , Jouni K.Seppänen公司 , 艾诺·欣卡宁 , 海基·曼尼拉 , 塔内利·米利卡宁 :
从二进制数据中寻找低熵集和树。 350-359 弗里佐·A·L·詹森 , 沃尔夫冈·格兰泽尔 , 巴特·德摩尔 :
结合文本挖掘和引文分析的生物信息学动态混合聚类。 360-369 Yookyung Jo先生 , 卡尔·拉戈兹 , C.李·贾尔斯 :
通过图形和文本之间的相关性检测研究主题。 370-379 卡氏Panagiotis Karras , 糖化迪米特里斯 , 尼科斯·马穆利斯 :
在总结中利用确定性保证的对偶性。 380-389 柯一平 , 郑景明 , 威尔弗雷德·吴 :
图形数据库中的相关搜索。 390-399 亚历山大·科尔茨 , Wen-tau Yih先生 :
提高高精度文本分类器的基线。 400-409 斯利瓦桑·拉克斯曼 , P.S.萨斯特里 , K.P.乌尼克里什南 :
在事件流中查找频繁情节的快速算法。 410-419 朱尔·莱斯科维奇 , 安德烈亚斯·克劳斯 , 卡洛斯·盖斯特林 , 克里斯托斯·法洛索斯 , 珍妮·范布赖森 , Natalie S.瞥一眼 :
网络中具有成本效益的疫情检测。 420-429 李金燕 , 刘桂梅 , 黄利顺(Limsoon Wong) :
挖掘统计上重要的等价类和增量鉴别新兴模式。 430-439 李萍 :
用于降维的极稀疏稳定随机投影 我 α(0<alpha<=2)范数。 440-449 刘毅(音) , 荣进 , 阿尼尔·K·贾恩 :
BoostCluster:通过成对约束促进聚类。 450-459 罗大卫 , Siau-Cheng Khoo公司 , 刘超(Chao Liu) :
高效挖掘迭代模式以发现软件规范。 460-469 博龙 , 张忠飞(Mark) , 菲利普·S·余 :
关系聚类的概率框架。 470-479 海基·曼尼拉 , 埃维马里亚·特尔齐 :
嵌套和分段嵌套。 480-489 乔竹梅 , 沈雪华 , 城厢寨 :
多项式主题模型的自动标记。 490-499 大卫·M·米姆诺 , 安德鲁·麦克拉姆 :
专业建模,用于将论文与审稿人进行匹配。 500-509 弗拉维亚·莫瑟 , 荣格 , 马丁·埃斯特尔 :
属性和关系数据的联合聚类分析,无需预先指定聚类数。 510-519 拉梅什·纳拉帕蒂 , 苏珊·迪特摩尔 , 约翰·D·拉弗蒂 , 金昂(Kin Ung) :
多尺度主题层析成像。 520-529 齐格弗里德·尼杰森 , 埃莉萨·弗罗蒙特 :
从项集格挖掘最优决策树。 530-539 高拉夫·潘迪 , 迈克尔·斯坦巴赫 , 罗希特·古普塔 , 图沙尔·加格 , 维平·库马尔 :
基于关联分析的蛋白质相互作用网络转换:功能预测案例研究。 540-549 Seung-Taek公园 , 大卫·M·彭诺克 :
将协作过滤技术应用于电影搜索以获得更好的排名和浏览。 550-559 雷蒙德·波恩 , 阿方索·卡德纳斯 , 大卫·巴特勒 , 特伦斯·克里奇洛 :
跟踪多个主题以查找有趣的文章。 560-569 菲利普·拉德林斯基 , 托尔斯滕·约阿希姆斯 :
积极探索从点击数据中学习排名。 570-579 律师桑德勒 :
层次混合模型:概率分析。 580-589 佐藤一成 , 中川裕志 :
基于dirichlet先验的参数混合模型的多文档知识发现。 590-598 文森特·席克尔·祖伯 , 博伊·法尔廷斯 :
使用层次聚类学习推荐系统中使用的概念。 599-608 D.斯卡利 :
从片面反馈中进行实践学习。 609-618 贝尼亚·沙帕伦科 , 托尔斯滕·约阿希姆斯 :
信息谱系学:揭示非超链接文档数据库中的思想流。 619-628 谢迪·沙哈塔 , 法赫里·卡雷 , 默罕默德·卡迈勒 :
用于增强文本分类的基于概念的模型。 629-637 维克多·S·盛 , 查尔斯·X·林 :
成本敏感学习中的部分示例获取。 638-646 志贺本木 , 高川一川 , Hiroshi Mamitsuka先生 :
一种谱聚类方法,用于将数字矢量与模块化网络进行优化组合。 647-656 安德鲁·史密斯 , 查尔斯·埃尔坎 :
使生成分类器对选择偏差具有鲁棒性。 657-666 宋秀瑶 , 吴明熙 , 克里斯托弗·杰梅因 , 桑杰·兰卡 :
多维数据的统计变化检测。 667-676 Rohini K.Srihari公司 , 李旭 , Tushar Saxena公司 :
使用分级的跨文档证据线索生成假设。 677-686 孙继萌 , 克里斯托斯·法洛索斯 , Spiros Papadimitriou公司 , 菲利普·S·余 :
GraphScope:大型时间演化图的无参数挖掘。 687-696 高拉夫·坦登 , 菲利普·K·陈 :
用于检测网络和主机异常的规则验证中的加权与修剪。 697-706 魏棠 , 辉雄 , 史忠 , 吴杰 :
增强半监督聚类:特征投影视角。 707-716 Chayant Tantipathanandh公司 , 塔尼亚·伯格·沃尔夫 , 大卫·坎佩 :
动态社交网络中社区识别的框架。 717-726 Choon Hui Teo先生 , 亚历山大·斯莫拉 , S.V.N.维什瓦纳坦 , Quoc V.Le公司 :
用于正则化风险最小化的可扩展模块凸解算器。 727-736 航空通 , 克里斯托斯·法洛索斯 , 布赖恩·加拉赫 , 蒂娜·埃利亚西·拉德 :
大型属性图中的快速最佳模式匹配。 737-746 航空通 , 克里斯托斯·法洛索斯 , 耶胡达·科伦 :
用于图形挖掘的快速方向感知接近度。 747-756 大卫·S·沃格尔 , 奥格尼安·阿斯帕罗乌霍夫 , 托比亚斯·谢弗 :
可扩展的前瞻性线性回归树。 757-764 吉列斯·弗里肯 , 马蒂杰斯·范·吕文 , 阿诺·西贝斯 :
描述差异。 765-774 李婉 , Wee Keong Ng公司 , 舒国汉 , 文森特·C·S·李 :
梯度下降法的隐私保护。 775-783 王轩辉 , 城厢寨 , 小虎 , 史伯乐 :
从协调的文本流中挖掘相关的突发主题模式。 784-793 王雪瑞 , 克里斯·帕尔 , 安德鲁·麦克拉姆 :
异质属性文本的广义成分分析。 794-803 雷蒙德·齐文王 , 简培 , 阿达·韦奇·傅(Ada Wai-Chee Fu) , 王珂(Ke Wang) :
开采有利面。 804-813 吴俊杰 , 辉雄 , 吴鹏(音) , 陈健(Jian Chen) :
稀有类分析的局部分解。 814-823年 徐晓伟 , 努尔坎·尤鲁克 , 冯志丹 , 托马斯·A·J·施魏格 :
SCAN:一种用于网络的结构化聚类算法。 824-833 容颜 , 杰琳娜·特西奇 , 约翰·史密斯 :
用于多标签分类的模型共享子空间提升。 834-843 德拉戈米尔·扬科夫 , 伊蒙·基奥 , 何塞·麦迪纳 , Bill Yuan-chi Chiu先生 , 维克托·佐丹 :
在均匀缩放下检测时间序列模体。 844-853 叶洁平 , 水王记 , 陈建辉 :
利用二次约束二次规划学习判别分析中的核矩阵。 854-863 袁俊松 , 吴颖(音) , 杨明(音) :
从频繁项集到语义上有意义的视觉模式。 864-873 西安张 , 于浩 , 朱晓燕 , 李明(音) , 大卫·R·切里顿 :
从问题到答案的信息距离。 874-883 赵洪坤 , 孟维义(Weiyi Meng) , 克莱门特·T·余 :
从搜索引擎的搜索结果记录中挖掘模板。 884-893年 郑淑怡 , 宋瑞华 , 纪荣文 , 狄武 :
包装器生成和模板检测的联合优化。 894-902 朱军(Jun Zhu) , 张波 , 聂再庆 , 纪荣文 , 肖文洪 :
网页理解:综合方法。 903-912
行业和政府跟踪文件
Sitaram Asur公司 , 斯里尼瓦桑Parthasarathy , Duygu Ucar公司 :
描述交互图进化行为的基于事件的框架。 913-921 丽贝卡·卡斯塔尼奥 , 基里·瓦格斯塔夫 , 史蒂夫·钱恩 , 蒂莫西·斯托夫 , 本阳堂 :
火星航天器未校准数据的船上分析。 922-930 安德鲁·S·法斯特 , 丽莎·弗里德兰 , 马克·迈尔 , 布莱恩·泰勒 , 大卫·D·延森 , 亨利·G·戈德堡 , 约翰·科莫罗斯克 :
用于改进证券欺诈检测的关系数据预处理技术。 941-949 明华 , 简培 :
清理隐藏的缺失数据:一种启发式方法。 950-958 罗恩·科哈维 , 兰德尔·M·海恩 , 丹·索默菲尔德 :
网上受控实验实用指南:倾听客户的声音,而不是河马的声音。 959-967 罗萍(Ping Luo) , 辉雄 , 凯文·吕 , 中之石 :
对等网络中的分布式分类。 968-976 克劳迪娅·佩里奇 , Saharon Rosset公司 , 理查德·劳伦斯 , 比安卡·扎德罗兹尼 :
用于客户钱包估计和其他应用程序的高分位数建模。 977-985 赵俊华 , 赵阳东 , 张培(音译) :
为防止停电而开采复杂电网。 986-994 赵树斌 , 乔纳森·贝茨 :
从网上核实和学习事实。 995-1003 朱光裕 , 蒂莫西·贝西娅 , 维卡斯·克里希纳 :
提取相关命名实体以进行自动费用报销。 1004-1012
行业和政府跟踪短文
查鲁·C·阿加瓦尔 :
海量音频数据流的分类和分割框架。 1013-1017 克里斯·柯里 , 罗伯特·格罗斯曼 , 大卫洛克 , 史蒂夫·维奇 , 约瑟夫·布加伊斯基 :
检测支付卡数据的大数据集的变化:案例研究。 1018-1022 Rong Pan公司 , 赵俊晖 , 文森特·文成·郑 , 杰弗里·俊峰(Jeffrey Junfeng Pan) , 窦慎 , Sinno Jialin Pan公司 , 强阳(Qiang Yang) :
传感器网络中跟踪模型的区域约束半监督挖掘。 1023-1027 魏鹏 , 查尔斯·佩恩 , 李涛 , 王海勋 :
用于系统管理的事件摘要。 1028-1032 R.巴拉特·拉奥 , 金波碧 , 格伦·冯 , 马科斯·萨尔马尼奥夫 , 南希·奥布乔夫斯基 , 大卫·P·奈迪 :
LungCAD:经临床批准的用于肺癌检测的机器学习系统。 1033-1037 罗伯特·J·严 , 查尔斯·X·林 :
股票选择的机器学习。 1038-1042 叶燕芳 , 王定鼎 , 陶莉 , 东一叶 :
IMDS:智能恶意软件检测系统。 1043-1047 尹晓欣 , 韩嘉伟 , 菲利普·S·余 :
与网络上多个相互冲突的信息提供者一起发现真相。 1048-1052
面板
斯里尼瓦桑Parthasarathy :
十字路口的数据挖掘:成功、失败和学习。 1053-1055
![](https://dblp.uni-trier.de/img/cog.dark.24x24.png)