营养学5k:走向对普通食品的自动营养理解

奎因·泰晤士河、阿琼·卡普尔、韦德·诺里斯、方婷霞、利维乌·帕纳伊特、托比亚斯·韦恩德、杰克·西姆; IEEE/CVF计算机视觉和模式识别会议记录,2021年,第8903-8911页

摘要


从视觉数据中了解食品的营养成分是一个具有挑战性的计算机视觉问题,有可能对公众健康产生积极和广泛的影响。该领域的研究仅限于该领域现有的数据集,这些数据集缺乏足够的多样性或具有营养理解能力的培训模型所需的标签。我们介绍了Nutrition5k,这是一个由5k个不同的真实世界菜肴组成的新型数据集,具有相应的视频流、深度图像、分量权重和高精度营养成分注释。我们通过训练一种计算机视觉算法来展示该数据集的潜力,该算法能够以优于专业营养学家的精度预测复杂的现实菜肴的热量和宏量营养素值。此外,我们提出了一个基线,用于合并深度传感器数据以改进营养预测。我们发布Nutrition5k,希望它能加速营养理解领域的创新。数据集位于https://github.com/google-research-datasets/Nutrition5k。

相关材料


[pdf格式][支持][arXiv公司]
[围巾]
@会议记录{泰晤士河2021_CVPR,author={泰晤士河、奎因河和卡普尔河、阿琼河和诺里斯河、韦德河和夏河、方亭河和帕纳伊特河、利维乌河和韦扬德河、托拜厄斯河和西姆河、杰克},title={Nutrition5k:走向通用食品的自动营养理解},booktitle={计算机视觉和模式识别(CVPR)的IEEE/CFF会议记录},月={6月},年份={2021},页码={8903-8911}}