模型:我开发了重要的建模方法用于自然语言的各种领域加工——句法、语音、形态学和机器翻译,以及语义偏好、名称变化,甚至数据库支持的网站。我们的目标不仅仅是捕捉句子的结构,但也有语法中的深层规律和一种语言(以及跨语言)的词汇。我和我的学生总是在考虑新问题和更好的模型。对于例如,潜在变量和非参数贝叶斯方法让我们对数据是如何产生的建立一个语言学家可信的解释。我们最新的模型继续包含语言思想,但它们还包括深层神经网络,以适应意外规则和大型预处理语言模型利用大型语料库中隐含的知识。
算法:一个好的数学模型会定义最好的数据分析,但我们能计算那个分析?我的学生和我一直在开发新的算法,处理复杂的结构化预测和学习问题由越来越复杂的模型构成。与许多领域不同机器学习,我们必须处理字符串、树、,对齐和语法。我最喜欢的工具包括动态编程、马尔可夫链蒙特卡罗(MCMC)、信念传播和其他变分近似、自动微分、,确定性退火,随机局部搜索,从粗到细搜索、整数线性规划和松弛方法。我特别喜欢以富有成效的新方式连接不同的技术。
一般范例:我和我的学生也在努力开创性的通用统计和算法范式问题(不限于NLP)。我们正在开发一个高级声明性编程语言Dyna,它允许惊人的简短程序,由许多有趣的通用效率技巧支持,因此这些不必重新发明,也不必在新的环境中重新实现设置所有时间。我们还展示了如何学习执行快速准确地进行近似统计的策略推理,以及如何正确地训练这些本质上有区别的贝叶斯方法的策略。我们还开发了其他机器学习技术与通用建模框架兴趣,主要用于结构化预测和时间序列建模。
衡量成功:我们实施新方法并评估他们仔细研究自然语言的集合。我们不断提高技术水平。虽然我们的工作可以当然可以在当今的最终用户应用程序中使用,例如机器翻译和信息提取,我们自己通常专注于建立该领域的长期基础。
总的来说,我有广泛的兴趣,工作范围很广NLP中的基本主题,利用计算机的不同领域科学。查看我的文件,个人简历,和研究综述了解更多信息;另请参见有关我的通知风格.