计算机科学>机器学习
标题: TFWT:使用Transformer的表格特征权重
摘要: 本文提出了一种新的特征加权方法,以解决现有表格数据特征处理方法的局限性。 通常,现有方法对一个数据集中的所有样本和特征都具有同等重要性。 这种简化的处理方法忽略了每个特征的独特贡献,因此可能会遗漏重要的特征信息。 因此,在具有丰富功能的复杂数据集中,它会导致性能不佳。 为了解决这个问题,我们引入了一种新的表格式数据特征加权方法——Transformer表格式特征加权。 我们的方法采用Transformer来捕获复杂的特征相关性,并在上下文中为离散和连续特征分配适当的权重。 此外,我们采用强化学习策略进一步微调加权过程。 我们在各种真实世界数据集和各种下游任务中的广泛实验结果表明了TFWT的有效性,并突出了在表格数据分析中增强特征权重的潜力。