跳到主要内容
研究论文

面向计算事实检查

出版:2014年3月1日出版历史
跳过抽象节

摘要

我们的新闻充斥着来自数据的“事实”主张。过去,数据库研究的重点是如何回答查询,但没有太多注意识别结果声明的更微妙的品质,例如,声明是“樱桃色的”吗?本文提出了一个框架,将基于结构化数据的索赔建模为参数化查询。一个关键的见解是,通过扰动索赔的参数并观察其结论如何变化,我们可以了解到有关索赔的很多信息。这个框架使我们能够将实际的事实检查任务——逆向工程(通常是有意的)模糊声明,以及反驳有疑问的声明——作为计算问题来制定。除了建模框架之外,我们还开发了一个算法框架,通过提供适当的算法构建块,实现“元”算法的高效实例化。我们提供了真实世界的示例和实验,证明了我们模型的威力、算法的效率以及结果的有用性。

参考文献

  1. C.C.Aggarwal,编辑。管理和挖掘不确定数据。施普林格,2009年。谷歌学者谷歌学者数字图书馆数字图书馆
  2. P.Agrawal和J.Widom。置信软件连接算法。集成电路驱动单元, 2009, 628--639.谷歌学者谷歌学者数字图书馆数字图书馆
  3. A.M.安德鲁。另一种有效的二维凸包算法。信息处理信件, 9(1979), 216--219.谷歌学者谷歌学者交叉引用交叉引用
  4. M.A.Bender和M.Farach-科尔顿。重新审视生命周期评价问题。拉丁语, 2000, 88--94.谷歌学者谷歌学者数字图书馆数字图书馆
  5. S.Börzsönyi、D.Kossmann和K.Stocker。天际线操作员。集成电路驱动单元, 2001, 421--430.谷歌学者谷歌学者数字图书馆数字图书馆
  6. S Cohen、J.T.Hamilton和F.Turner。计算新闻。CACM公司, 54(2011), 66--71.谷歌学者谷歌学者数字图书馆数字图书馆
  7. S.Cohen、C.Li、J.Yang和C.Yu。计算新闻学:对数据库研究人员的号召。CIDR公司, 2011.谷歌学者谷歌学者
  8. Harish D.、P.N.Darera和J.R.Haritsa。通过计划图简化确定稳健计划。超大规模数据库, 2008, 1124--1140.谷歌学者谷歌学者数字图书馆数字图书馆
  9. N.N.Dalvi、C.Ré和D.Suciu。概率数据库:泥土中的钻石。CACM公司, 52(2009), 86--94.谷歌学者谷歌学者数字图书馆数字图书馆
  10. J.Fischer和V.Heun。rmq信息的一种新的简洁表示法以及增强后缀数组的改进。逃生, 2007, 459--470.谷歌学者谷歌学者数字图书馆数字图书馆
  11. S.Ganguly。参数查询优化算法的设计与分析。超大规模数据库, 1998, 228--238.谷歌学者谷歌学者数字图书馆数字图书馆
  12. J.Gray、A.Bosworth、A.Layman和H.Pirahesh。数据立方体:一种关系聚合操作符,将group-by、cross-tab和sub-total进行了泛化。集成电路驱动单元, 1996, 152--159.谷歌学者谷歌学者数字图书馆数字图书馆
  13. D.Harel和R.E.Tarjan。寻找最近共同祖先的快速算法。暹罗, 13(1984), 338--355.谷歌学者谷歌学者数字图书馆数字图书馆
  14. Z.He和E.Lo。回答top-k查询中的“为什么不”问题。集成电路驱动单元, 2012, 750--761.谷歌学者谷歌学者数字图书馆数字图书馆
  15. A.Hulgeri和S.Sudarshan。AniPQO:非线性成本函数的几乎非侵入式参数查询优化。超大规模数据库, 2003, 766--777.谷歌学者谷歌学者数字图书馆数字图书馆
  16. Y.E.Ioanidis、R.T.Ng、K.Shim和T.K.Sellis。参数化查询优化。超大规模数据库, 1992, 103--114.谷歌学者谷歌学者数字图书馆数字图书馆
  17. R.Jampani、F.Xu、M.Wu、L.L.Perez、C.Jermaine和P.J.Haas。蒙特卡洛数据库系统:接近数据的随机分析。TODS公司, 36(2011), 18.谷歌学者谷歌学者数字图书馆数字图书馆
  18. H.T.Kung、F.Luccio和F.P.Preparia。求一组向量的最大值。JACM公司, 22(1975), 469--476.谷歌学者谷歌学者数字图书馆数字图书馆
  19. X Lin、A.Mukherji、E.A.Rundensteiner、C.Ruiz和M.O.Ward。PARAS:在线关联挖掘的参数空间框架。超大规模数据库6(2013), 193--204.谷歌学者谷歌学者数字图书馆数字图书馆
  20. Y.Luo、X.Lin、W.Wang和X.Zhou。Spark:关系数据库中的top-k关键字查询。SIGMOD公司, 2007, 115--126.谷歌学者谷歌学者数字图书馆数字图书馆
  21. K.Mouratidis和H.Pang。计算子空间top-k查询的不可变区域。超大规模数据库, 6(2012), 73--84.谷歌学者谷歌学者数字图书馆数字图书馆
  22. A.Das Sarma、A.G.Parameswaran、H.Garcia-Molina和J.Widom。从数据合成视图定义。ICDT公司, 2010, 89--103.谷歌学者谷歌学者数字图书馆数字图书馆
  23. M.A.Soliman、I.F.Ilyas、D.Martinenghi和M.Tagliasacchi。评分函数不确定的排名:语义和敏感性度量。SIGMOD公司, 2011, 805--816.谷歌学者谷歌学者数字图书馆数字图书馆
  24. R.E.Tarjan。路径压缩在平衡树上的应用。JACM公司, 26(1979), 690--715.谷歌学者谷歌学者数字图书馆数字图书馆
  25. Q.T.Tran和C.Y.Chan。如何回答“为什么不”问题。SIGMOD公司, 2010, 15--26.谷歌学者谷歌学者数字图书馆数字图书馆
  26. Q.T.Tran、C.Y.Chan和S.Parthasarathy。按输出查询。SIGMOD公司, 2009, 535--548.谷歌学者谷歌学者数字图书馆数字图书馆
  27. E.Wu和S.Madden。Scorpion:解释聚合查询中的异常值。超大规模数据库, 6(2013), 553--564.谷歌学者谷歌学者数字图书馆数字图书馆
  28. Y.Wu、P.K.Agarwal、C.Li、J.Yang和C.Yu。面向计算事实检查。技术报告,杜克大学,2013年。http://www.cs.duke.edu/dbgroup/papers/WuAgarwalEtAl-13-fact_check.pdf。谷歌学者谷歌学者
  29. A.Yu、P.K.Agarwal和J.Yang。处理大量连续的首选项top-k查询。SIGMOD公司, 2012, 397--408.谷歌学者谷歌学者数字图书馆数字图书馆

建议

评论

登录选项

检查您是否可以通过登录凭据或您的机构访问本文。

登录

完全访问权限

  • 发布于

    封面图片VLDB捐赠会议记录
    VLDB捐赠会议记录 第7卷第7期
    2014年3月
    108页
    国际标准编号:2150-8097
    期刊目录

    出版商

    VLDB捐赠

    出版历史

    • 出版:2014年3月1日
    发布于聚乙烯低密度脂蛋白第7卷第7期

    限定符

    • 研究论文

PDF格式

以PDF文件的形式查看或下载。

PDF格式

电子阅读器

使用eReader联机查看。

电子阅读器