2015年研究项目

患者EMR数据的自动表型:特征提取和选择

教员导师:蔡天喜博士 
研究生导师:盛宇(Sheng Yu)
项目参与者:罗兰多·阿科斯塔(Rolando Acosta)、威廉·阿特曼(William Artman)、卡桑德拉·布迪亚克(Cassandra Burdziak)

在这个项目中,学生们获得了在电子病历(EMR)系统中开发用于患者分类的自动表型算法的重要步骤的实际经验。学生们使用自然语言处理(NLP)工具从维基百科等在线来源的有关疾病的文章中提取医学概念。学生们从多个网站收集了研究结果,并准备了相关概念列表,用于解析EMR中的自由文本临床笔记。NLP软件生成每个患者笔记中提到每个概念的次数。学生总结了NLP概念的分布,并进行了关联测试,以使用NLP数据确定与感兴趣表型相关的概念的最终列表。

SES在儿童急性淋巴细胞白血病治疗中的不同结果

教员导师:博士。唐娜·纽伯格
其他导师:特蕾西·布隆奎斯特、乔伊·安东内利
项目参与者:塞尔吉奥·巴雷拉、兰迪·达维拉、艾米丽·罗伯茨

该项目审查了最近一项临床试验的疗效和毒性结果,以确定治疗结果的可能差异。对种族和民族的简单调查并没有发现这种差异,但对SES的初步观察表明存在细微差异。参与者了解了临床试验和急性淋巴细胞白血病,这是最常见的儿童恶性肿瘤。他们还了解了统计数据分析以及为临床医生准备反映该分析的报告的过程。

环境因素和BRCA基因突变对卵巢癌风险的影响

教员导师:埃里克·切特根·切特根博士
研究生导师:凯西·伊文斯
项目参与者:Andrea Lane、Jennifer Osei、Nathalie Quiroz

学生们考虑了一项基于人群的病例对照研究,该研究基于1994年3月1日至1999年6月30日期间在以色列发现的所有卵巢癌患者(Modan等人,2001年)。该研究的主要目的是检测BRCA1/2基因和已知的卵巢癌生殖/妇科危险因素之间的相互作用。为了测试生殖风险因素和BRCA1/2之间的相互作用对卵巢癌风险的影响,学生们进行了大量分析,从标准逻辑回归到更有效的方法,例如利用人口中基因-环境独立性假设的个案分析。他们的主要目的是在代表一个人BRCA1/2突变状态的二分法变量与她使用口服避孕药和分娩之间存在交互作用的情况下测试遗传效应。

探针测序对芯片基因表达测量的影响

教员导师:Rafa Irizarry博士
研究生导师:瑞恩·孙
项目参与者:Kevin Kupiec、Randy Williams、Pedro Agrinsoni Munoz

在过去十年中,可以在网上找到免费数据的领域数量大幅增加。发现和预测算法不再能够通过下载、解析和分析数据来构建。例如,创建和使用在线电影评论来构建推荐系统或推特来预测股票奖励。学生们学会了从推特上下载数据,学会了将英语句子处理成数字摘要,并使用R语言构建了一个预测算法。