摘要
背景
方法
结果
结论
背景
介绍
花粉热的患病率和严重程度
社交媒体的过敏监测
文本分类的深度学习
贡献
-
我们在社交媒体花粉过敏监测的背景下引入深度学习应用程序,取代当前主流的传统机器学习分类器; -
我们注重挑战非正式词汇,如果不解决传统的基于关键字/词汇的有限方法,就会导致低估/高估的情况; -
我们提出用细粒度分类代替最常见的二元分类器,将其分为4类,即与干草热相关/干草热非相关; -
我们用广泛的天气变量列表来丰富数据,以便识别潜在的模式,之前的研究主要集中在温度和花粉率上。
方法
研究设计
-
推特定量和定性监测干草热的框架开发; -
多种深度学习体系结构对在线用户生成内容分类的评估; -
针对特定领域的嵌入式培训和评估,以提高准确性和性能; -
通过预测概率和嵌入向量调查演示内部工作; -
与天气变量的相关性,用于模式识别和未来预测。
数据提取
嵌入式开发
目标数据
-
搜索词: “花粉热” 或 “花粉热” ; -
最大推文数: n个 =1000(由于符合规定标准的职位数量有限,从未达到); -
自/至日期: 秒 =2018/06/01, 单位 =2018年12月31日,遵循每周计划; -
地理坐标:爱丽丝·斯普林斯(-23.698,133.880)、悉尼(-33.868,151.209)、墨尔本(-37.813,144.963)和布里斯班(-27.469,153.025)。
注释过程
培训和测试
天气相关性
结果
准确性评估
分类输出
误差分析
天气相关性
讨论
深度学习方法验证
关于花粉热的知识发现
结论
数据和材料的可用性
笔记
“Until date”参数不包括在该日期发布的推文,而作者并不知道这些推文(因此存在周末间隙)。 自10月起,这一问题已得到解决和纠正。
缩写
美国存托凭证: -
药物不良反应 AIHW公司: -
澳大利亚健康与福利研究所 应收账: -
过敏性鼻炎 ASCIA公司: -
澳大利亚临床免疫学和变态反应学会 美国有线电视新闻网: -
卷积神经网络 数据链接: -
深度学习 企业资源规划: -
估计常住人口 手套: -
单词表示的全局向量 GRU公司: -
门控递归单元 HCP公司: -
健康专业人士 高频: -
花粉热 LSTM: -
长短期记忆 毫升: -
机器学习 自然语言处理: -
自然语言处理 注册号: -
循环神经网络 世界卫生组织: -
世界卫生组织
工具书类
澳大利亚卫生与福利研究所(AIHW)。 过敏性鼻炎(“花粉热”)。 2016 https://www.aihw.gov.au/reports/chronir-respiratory-conditions/attrimission-r%hinitis -花粉热/内容物/过敏性鼻炎 2019年1月30日访问。 Vigo M、Hassan L、Vance W、Jay C、Brass A、Cruickshank S英国呼吸:使用经验抽样方法收集一个国家的季节性过敏症状。 2017年美国医学信息协会杂志; 25(1):88–92. D’Amato G、Holgate ST、Pawankar R、Ledford DK、Cecchi L、Al-Ahmad M、Al-Enezi F、Al-Muhsen S、Ansotegui I、Baena-Cagnani CE等。气象条件、气候变化、新出现的因素、哮喘和相关过敏性疾病。 世界变态反应组织的声明。 世界过敏组织杂志2015; 8(1):1. 夏露,王佳,范伟。一种基于深度学习的命名实体识别方法,用于健康社交媒体中的药物不良事件识别和提取。 参加:智能健康国际会议。 香港:施普林格出版社:2017年。 第237-48页。 Nikfarjam A、Sarker A、O'connor K、Ginn R、Gonzalez G。社交媒体的药物警戒:使用带有单词嵌入聚类特征的序列标签挖掘药物不良反应提及。 2015年美国医学信息协会杂志; 22(3):671–81. Sarker A,Gonzalez G.通过多中心训练检测药物不良反应的便携式自动文本分类。 生物信息杂志。 2015; 53:196–207. Patki A、Sarker A、Pimpalkhute P、Nikfarjam A、Ginn R、O’Connor K、Smith K、Gonzalez G。从社交媒体中挖掘药物不良反应信号:超越提取。 程序BioLinkSig。 2014; 2014:1–8. Jonnagaddala J,Jue TR,Dai H-J。不良药物反应推特帖子的二进制分类。 摘自:美国HI大岛生物计算太平洋研讨会社交媒体挖掘共享任务研讨会论文集。HI大岛屿:PSB:2016。 第4-8页。 Scanfeld D、Scanfell V、Larson EL。通过社交网络传播健康信息:推特和抗生素。 《美国传染病控制》2010; 38(3):182–8. Byrd K、Mansurov A、Baysal O。挖掘推特数据用于流感检测和监测。 摘自:《国际医疗系统软件工程研讨会论文集》。 奥斯汀:ACM:2016。 第43-9页。 Culotta A.通过分析推特信息来检测流感疫情。 收录:社交媒体分析第一次研讨会论文集。 华盛顿特区:ACM:2010年。 第115-22页。 Wang C-K,Singh O,Tang Z-L,Dai H-J。使用递归神经网络模型对推文进行分类,以传达与流感相关的信息。 摘自:2017年利用社交媒体进行数字疾病检测国际研讨会论文集(DDDSM-2017)。 台北:亚洲自然语言处理联合会:2017。 第33-38页。 Lee K、Agrawal A、Choudhary A。挖掘社交媒体流以改进公共卫生过敏监测。 在:2015年IEEE/ACM国际社会网络分析与挖掘进展会议(ASONAM)。 巴黎:IEEE:2015。 第815-22页。 de Quincey E.社交媒体确定花粉热季节和药物疗效的潜力。 星球@风险。 2014; 2(4):293–97. de Quincey E、Kyriacou T、Pantin T。#干草热; 对英国花粉热相关推文的纵向研究。摘自:第六届数字健康国际会议论文集。 蒙特利尔:ACM:2016。 第85-9页。 Gesualdo F、Stilo G、D'Ambrosio A、Carloni E、Pandolfi E、Velardi P、Fiocchi A、Tozzi AE。推特可以作为过敏信息的来源吗? 花粉计数与报告过敏性鼻结膜炎症状和抗组胺药物名称的推文的相关性。 公共科学图书馆一号。 2015; 10(7):0133706. Cowie S、Arthur R、Williams H.@choo:利用社交媒体追踪英国的花粉和花粉热。 传感器。 2018; 18(12):4434. Leaman R、Wojtulewicz L、Sullivan R、Skariah A、Yang J、Gonzalez G。走向互联网药物警戒:从健康相关社交网络的用户帖子中提取药物不良反应。 摘自:2010年生物医学自然语言处理研讨会论文集。 乌普萨拉:计算语言学协会:2010年。 第117-25页。 Edwards IR,Lindquist M.药物警戒中的社交媒体和网络。 药物安全。 2011; 34(4):267–271. Collobert R、Weston J、Bottou L、Karlen M、Kavukcuoglu K、Kuksa P。从头开始的自然语言处理(几乎)。 J Mach Learn Res.2011; 12(8月):2493–537。 澳大利亚临床免疫与过敏学会(ASCIA)。 花粉过敏。2017年。 https://www.allergy.org.au/images/pcc/ASCIA_pcc_Pollen_allergy_2017.pdf 。访问时间:2019年1月30日。 世界过敏组织(WAO)。 2016年世界过敏周。 2016 https://www.worldallergy.org/UserFiles/file/WorldAllergyWeek2016FactSheet%.pdf 。访问时间:2019年1月30日。 Ziska L、Knowlton K、Rogers C、Dalan D、Tierney N、Elder MA、Filley W、Shropshire J、Ford LB、Hedberg C等。最近纬度变暖与北美中部豚草花粉季节的延长有关。 Proc Nat科学院。 2011; 108(10):4248–51. 澳大利亚统计局(ABS)。 移民,澳大利亚,2014-15。 2016 http://www.abs.gov.au/AUSSTATS/abs @.nsf/Lookup/3412.0Main+功能12014-1%5? 开放文档格式 。访问时间:2019年1月30日。 Cvetkovski B、Kritikos V、Yan K、Bosnic-Anticevich S。告诉我你的花粉热:从患者角度对过敏性鼻炎管理进行定性调查。 NPJ初级护理呼吸医学,2018年; 28(1):3. Ginn R、Pimpalkhute P、Nikfarjam A、Patki A、O’Connor K、Sarker A、Smith K、Gonzalez G。药物不良反应推特挖掘:语料库和分类基准。摘自:第四届健康和生物医学文本处理资源构建和评估研讨会论文集。 Citeser:2014年。 Davison KP、Pennebacker JW、Dickerson SS。 谁在说话? 疾病支持群体的社会心理。 《美国心理学》2000; 55(2):205. Tuarob S,Tucker CS,Salathe M,Ram N.一种用于发现社交媒体消息中健康相关知识的集成异构分类方法。 生物信息杂志。 2014; 49:255–68. Subramani S、Michalska S、Wang H、Whittaker F、Heyward B。推特数据的文本挖掘和实时分析:澳大利亚花粉热预测案例研究。 参加:国际卫生信息科学会议。 凯恩斯:施普林格出版社:2018年。 第134–45页。 Gao S,Young MT,Qiu JX,Yoon H-J,Christian JB,Fearn PA,Tourassi GD,Ramanthan A.癌症病理报告信息提取的分级关注网络。 2017年美国医学信息协会杂志; 25(3):321–30. Nguyen DT、Al Mannai KA、Joty S、Sajjad H、Imran M、Mitra P.使用卷积神经网络对社交网络上危机相关数据进行稳健分类。 参加:第十一届国际AAAI网络和社交媒体会议。 蒙特利尔:AAAI:2017。 Majumder N,Poria S,Gelbukh A,Cambria E.基于深度学习的文档建模,用于从文本中检测个性。 IEEE智能系统。 2017; 32(2):74–9. Poria S、Cambria E、Hazarika D、Vij P。使用深度卷积神经网络深入研究讽刺推文。 arXiv预打印arXiv:1610.08815。 2016 Poria S,Cambria E,Gelbukh A.使用深度卷积神经网络进行观点挖掘的方面提取。基于知识的系统。 2016; 108:42–49. Poria S、Chaturvedi I、Cambria E、Hussain A.基于卷积mkl的多模态情感识别和情感分析。 在:2016年IEEE第16届国际数据挖掘会议(ICDM)。 巴塞罗那:IEEE:2016。 第439-48页。 Goller C,Kuchler A.通过结构反向传播学习任务相关的分布式表示。 摘自:神经网络国际会议论文集(ICNN'96),第1卷。 华盛顿特区:IEEE:1996。 第347-52页。 Gers FA、Schmidhuber J、Cummins F。学会忘记:用lstm持续预测。 第九届国际人工神经网络会议:ICANN’99。 爱丁堡:IET:1999。 第850-55页。 Cho K,Van Merriönboer B,Gulcehre C,Bahdanau D,Bougares F,Schwenk H,Bengio Y.使用rnn编码器-解码器学习短语表示,用于统计机器翻译。 arXiv预打印arXiv:1406.1078。 2014 Chung J,Gulcehre C,Cho K,Bengio Y。门控递归神经网络对序列建模的实证评估。 CoRR.2014; abs/1412.3555。 http://arxiv.org/abs/1412.3555。 https://dblp.org/rec/bib/journals/corr/ChungGCB14 . Colditz JB、Chu K-H、Emery SL、Larkin CR、James AE、Welling J、Primack BA。推特健康消息的实时信息发布。 美国公共卫生杂志。 2018; 108(8):1009–14. Carletta J.评估分类任务的一致性:kappa统计。 计算语言学。 1996; 22(2):249–54. Viera AJ、Garrett JM等,《理解观察者之间的协议:kappa统计》。 Fam Med.2005; 37(5):360–3. 塞族人O、Thapen N、Magnnis B、Hankin C、Foot V。使用哨兵实时处理社交媒体:一个综合征监测系统,其中包括健康分类的深度学习。 信息处理管理。 2019; 56(3):1166–84. Velardi P、Stilo G、Tozzi AE、Gesualdo F.针对精细症状监测的推特挖掘。 Artif Intell Med.2014; 61(3):153–63.