跳到主要内容

摘要

主要的社会和环境挑战涉及具有多种多尺度交互过程的复杂系统。例如,考虑干旱和水储量如何影响作物生产,农业和工业需求如何影响水质和可用性。预防措施,如推迟种植日期和采取新的农业做法以应对不断变化的天气模式,可以减少自然过程造成的损害。了解这些自然和人类过程是如何相互影响的,可以预测不良情况的影响,并研究采取预防措施的干预措施。对于这些过程中的许多过程,有一些专家模型结合了最先进的理论和知识,以量化系统对各种条件的响应。高效建模的一个主要挑战是跨学科建模方法的多样性,以及仅以需要复杂转换的格式提供的各种数据源。针对特定问题使用专家模型需要将模型与第三方数据集成,以及跨学科的模型集成。建模者面临着严重的异构性,这需要解决语义、时空和执行不匹配问题,这些问题目前大多是手工完成的,可能需要两年多的努力。
我们正在开发一种建模框架,该框架使用人工智能(AI)技术来减少建模工作量,同时确保决策的实用性。我们迄今为止的工作做出了一些创新性贡献:(1)智能用户界面,指导分析师构建建模问题,并通过建议相关选择和自动化步骤来帮助他们;(2) 模型的语义元数据,包括其建模变量和约束,确保模型相关性和对给定决策问题的正确使用;以及(3)数据集在建模变量方面的语义表示,支持自动数据选择和数据转换。该框架在MINT(模型集成)框架中实现,目前包括数据和模型,用于分析涉及气候、水资源可用性、农业生产和市场的自然和人类系统之间的相互作用。我们迄今为止的工作证明了人工智能技术在加速建模以支持决策方面的实用性,并揭示了未来工作的几个具有挑战性的方向。

工具书类

[1]
M.Abulaish和L.Dey。2007.使用基于本体的文本挖掘从MEDLINE摘要中提取生物关系和查询应答。数据与知识工程61,2(2007),228–262。
[2]
E.Afgan、D.Baker、B.Batut、M.Van Den Beek、D.Bouvier、M.Coech、J.Chilton、D.Clements、N.Coraor、B.A.Grüning和A.Guerler。2018年,用于可访问、可复制和协作生物医学分析的Galaxy平台:2018年更新。《核酸研究》46,W1(2018),W537–W544。
[3]
S.Auer、C.Bizer、G.Kobilarov、J.Lehmann、R.Cyganiak和Z.Ives。2007年,Dbpedia:开放数据网络的核心。在语义网中。施普林格,722-735。
[4]
基本模型接口。可从以下位置获得https://bmi-specif.readthedocs.io/en/latest/。
[5]
D.M.Blei、A.Y.Ng和M.I.Jordan。2003.潜在的dirichlet分配。机器学习研究杂志3,993–1022。
[6]
D.Brickley、M.Burgess和N.Noy。2019.谷歌数据集搜索:在开放的网络生态系统中构建数据集搜索引擎。在万维网会议(WWW'19)上。计算机械协会,美国纽约州纽约市,1365-1375年。
[7]
P.L.Buttigieg、N.Morrison、B.Smith、C.J.Mungall和S.E.Lewis。2013.环境本体论:将生物和生物医学实体联系起来。《生物医学语义学杂志》4,1(2013),43。
[8]
M.J.Cafarella、A.Halevy、D.Z.Wang、E.Wu和Y.Zhang。2008.网络表格:探索网络表格的力量。VLDB捐赠会议记录1,1(2008),538–549。
[9]
L.Carvalho、D.Garijo、C.B.Medeiros和Y.Gil。2018.Workflow Exploration and Evolution语义软件元数据。第十四届IEEE电子科学国际会议论文集,荷兰阿姆斯特丹。
[10]
S.Chalk、R.Hodgson和S.Ray。2017.Qudt工具包:开发框架,允许管理数字科学单位。美国化学学会论文摘要,253。
[11]
气候与预测(CF)公约和元数据。2020年。可从https://cfconventions.org/。
[12]
周期。2020http://plantscience.psu.edu/research/labs/kemanian/models-and-tools/cycles。
[13]
DataCube。2020https://www.w3.org/TR/vocab-data-cube/。
[14]
O.David、J.Ascough II、W.Lloyd、T.Green、K.Rojas、G.Leavesley和L.Ahuja。2013.环境建模框架设计的软件工程观点:对象建模系统。环境建模与软件39(2013),201-213。
[15]
数据目录词汇(DCAT)。2020https://www.w3.org/TR/vocab-dcat/。
[16]
A.Dimou、M.Vander Sande、P.Colpaert、R.Verborgh、E.Mannens和R.Van de Walle。2014.RML:异构数据集成RDF映射的通用语言。第七届网络链接数据研讨会会议记录。1184
[17]
D.轮毂。2020https://hub.docker.com/。
[18]
H.Dong、S.Liu、S.Han、Z.Fu和D.Zhang。2019.Tablesense:使用卷积神经网络检测电子表格。在AAAI人工智能会议记录中。第33卷。
[19]
A.S.Elshall、A.D.Arik、A.El-Kadi、S.Pierce、M.Ye、K.Burnett、C.Wada、L.Bremer和G.Chun。2020年,地下水可持续性:科学与政策之间互动的回顾。环境研究快报。https://doi.org/10.1088/1748-9326/ab8e8c。
[20]
B.T.Essawy、J.L.Goodall、H.Xu和Y.Gil。2017.OntoSoft本体评估,用于描述遗留水文建模软件。环境建模与软件92。
[21]
D.Garijo、D.Khider、Y.Gil、L.Carvalho、B.Essawy、S.Pierce、D.H.Lewis、V.Ratnakar、S.D.Peckham、C.Duffy和J.Goodall。2018.支持比较和重用的语义模型注册表。在《第九届国际环境建模与软件大会论文集》中,Ft Collins,CO。
[22]
D.Garijo、M.Osorio、D.Khider、V.Ratnakar和Y.Gil。2019.OKG Soft:一个具有机器可读科学软件元数据的开放知识图。第15届IEEE电子科学会议论文集。
[23]
W.Gatterbauer、P.Bohunsky、M.Herzog、B.Krüpl和B.Pollak。2007年。从网络表格中提取独立于领域的信息。第16届万维网国际会议论文集。ACM,71–80岁。
[24]
Y.Gil、P.A.Gonzalez-Calero、J.Kim、J.Moody和V.Ratnakar。2011.使用分布式数据和组件目录自动生成计算工作流的语义框架。《实验与理论人工智能杂志》23,4(2011)。
[25]
Y.Gil、D.Garijo、S.Mishra和V.Ratnakar。2016年,OntoSoft:科学软件的分布式语义注册。第十二届IEEE电子科学会议论文集。马里兰州巴尔的摩。
[26]
github。2020年开始提供https://github.com/。
[27]
GLDAS公司。2020年开始提供https://ldas.gsfc.nasa.gov/gldas。
[28]
A.Goel、C.Knoblock和K.Lerman。ICAI公司。利用数据中的结构,使用条件随机场进行精确标记。国际人工智能会议(ICAI)论文集。
[29]
R.V.Guha、D.Brickley和S.Macbeth。2016.Schema.org:网络结构化数据的演变。ACM通讯59,2(2016),44-51。
[30]
Z.GuoDong、S.Jian、Z.Jie和Z.Min,2005年。探索关系抽取中的各种知识。第43届计算语言学协会年会论文集。计算语言学协会,427-434。
[31]
C.Hill、C.DeLuca、M.Suarez和A.R.L.I.N.D.O Da Silva。2004年。地球系统建模框架的架构。科学与工程计算6,1(2004),18-28。
[32]
人道主义数据交换。2020年开始提供https://data.humdata.org/。
[33]
J.L.Hellerstein、S.Gu、K.Choi和H.M.Sauro。2019.生物医学模拟的最新进展:模型工程宣言。F1000研究8(2019)。
[34]
R.Hoehndorf、M.Dumontier、J.H.Gennari、S.Wimalaratne、B.De Bono、D.L.Cook和G.V.Gkoutos。2011.整合系统生物学模型和生物医学本体。BMC系统生物学5,1(2011),124。
[35]
A.J.Jakeman、R.A.Letcher和J.P.Norton。2006.环境模型开发和评估的十个迭代步骤。环境建模与软件21,5(2006)。https://doi.org/10.1016/j.envsoft.2006.01.004
[36]
S.Kandel、A.Paepcke、J.Hellerstein和J.Heer。2011.牧马人:数据转换脚本的交互式可视化规范。在SIGCHI计算机系统人为因素会议记录中。3363–3372.
[37]
A.Karpatne、A.Khandelwal、X.Chen、V.Mithal、J.Faghomus和V.Kumar。2016.全球内陆水动态监测:现状、挑战和机遇。计算可持续性。《计算智能研究》,J.Lassig、K.Kersting和K.Morik(编辑)。第645卷,查姆施普林格。https://doi.org/10.1007/978-3-319-31858-5_7。
[38]
A.R.Kemanian和C.O.Stöckle。2010年,C-Farm:评估土壤剖面碳平衡的简单模型。《欧洲农学杂志》32,1(2010),22-29。
[39]
A.Khandelwal、A.Karpatne、M.E.Marlier、J.Kim、D.P.Lettenmaier和V.Kumar。2017年。利用MODIS数据对水库地表水范围变化进行全球监测的方法。环境遥感202(2017),113-128。
[40]
A.坎德瓦尔。2019.ORBIT(基于排序的信息传输):一个物理引导的机器学习框架,用于监测全球范围内的水体动态。
[41]
G.金。2007年,《作为数据共享基础设施的Dataverse网络简介》,《社会学方法与研究》36,2(2007),173-199。
[42]
E.Koci、M.Thiele、O.Romero和W.Lehner。2016.电子表格中布局识别的单元格分类。在知识发现、知识工程和知识管理国际联合会议上。78–100.
[43]
S.Krishnan、J.Wang、E.Wu、M.J.Franklin和K.Goldberg,2016年。Activeclean:统计建模的交互式数据清理。VLDB捐赠会议记录9,12(2016)。
[44]
T.Krueger、T.Page、K.Hubacek、L.Smith和K.Hiscock。2012年,专家意见在环境建模中的作用。环境建模与软件36。https://doi.org/10.1016/j.envsoft.2012.01.011
[45]
A.Langegger和W.Wß。2009.XLWrap-使用SPARQL查询和集成任意电子表格。在ISWC'09《第八届国际语义网会议论文集》中。359–374.
[46]
Q.V.勒。2013.使用大规模无监督学习构建高级功能。2013年,IEEE声学、语音和信号处理国际会议论文集。8595–8598.
[47]
M.Lefrançois、A.Zimmermann和N.Bakerally。2017.用于从异构格式生成RDF的SPARQL扩展。在欧洲语义网络会议上。10249. 35–50.
[48]
H.Liu和P.Singh。2004.ConceptNet——一个实用的常识推理工具包。英国电信技术期刊22,4(2004),211-226。
[49]
M.McLennan和R.Kennell。2010年,《HUBzero:计算科学与工程传播与合作平台》,《科学与工程计算》12,2(2010),48–53。
[50]
F.Michel、L.Djimenou、C.Faron Zucker和J.Montagnat。2015年,使用xR2RML将关系数据库和非关系数据库转换为RDF。第11届网络信息系统和技术国际会议(WEBIST'15)。443–454.
[51]
T.Mikolov、I.Sutskever、K.Chen、G.S.Corrado和J.Dean。2013.单词和短语的分布式表示及其组成。神经信息处理系统进展。3111–3119.
[52]
G.A.米勒。1995年。WordNet:英语词汇数据库。ACM通讯38,11(1995),39–41。
[53]
MINT软件。可从以下位置获得https://mintproject.github.io/mint/。
[54]
模型联轴器工具包。可从以下位置获得https://www.mcs.anl.gov/research/projects/mct/。
[55]
MODFLOW公司。2020年美国地质调查局https://water.usgs.gov/ogw/modflow/。
[56]
D.M.Oliver、R.D.Fish、M.Winter、C.J.Hodgson、A.L.Heathwaite和D.R.Chadwick。2012.重视当地知识作为专家数据的来源:农民参与和决策支持系统的设计。环境建模与软件36。https://doi.org/10.1016/j.envsoft.2011.09.013。
[57]
OpenRefine。2020年。可从https://openrefine.org/。
[58]
M.Palmblad、A.L.Lamprecht、J.Ison和V.Schwämmle。2019.基于质谱的蛋白质组学中的自动化工作流合成。生物信息学35,4(2019),656–664。https://doi.org/10.1093/bioinformatics/bty646。
[59]
J.M.珀克尔。2017年,生物信息学工具如何将基因分析带给大众。《自然》5437643(2017),137-138。
[60]
E.Pebesma、T.Mailund和J.Hiebert。2016年,R.The R Journal 8,2中的测量单位。
[61]
S.D.Peckham和M.Stoica。2018.基于原则的半自动本体生成,支持数据集和模型的跨域互操作性。第九届国际环境建模与软件大会论文集。
[62]
S.D.Peckham、E.W.H.Hutton和B.Norris,2013年。地球科学中基于组件的集成建模方法:CSDMS的设计。计算机与地球科学53,3-12。
[63]
S.D.Peckham、M.Stoica、E.E.Jafarov、A.Endalamaw和W.R.Bolton。2017年。使用空间水文建模工具包TopoFlow进行可复制、基于组件的建模。《地球与空间科学》4,6(2017)。
[64]
J.Pennington、R.Socher和C.Manning。2014.手套:全球向量,用于单词表示。《2014年自然语言处理实证方法会议论文集》(EMNLP)。1532–1545.
[65]
M.Pham、S.Alse、C.A.Knoblock和P.Szekely。2016.语义标记:一种与域相关的方法。国际语义网络会议。查姆施普林格。
[66]
J.Pujara、A.Rajendran、M.Ghasemi Gol和P.Szekely。2019.开发表格理解模型的通用框架。国际语义网络会议-海报。
[67]
Y.Qu和C.J Duffy。2007.多过程流域模拟的半离散有限体积公式。水资源研究43,W08419。https://doi.org/10.1029/2006wr005752
[68]
S.K.Ramnandan、A.Mittal和C.Knoblock。2015.为数据源分配语义标签。欧洲语义网络会议。查姆施普林格。
[69]
R.G.Raskin和M.J.Pan。2005.地球与环境术语语义网中的知识表示(SWEET)。计算机与地球科学31,9(2005),1119–1125。https://doi.org/10.1016/j.cageo.2004.12.004。
[70]
RDF。2020年开始提供网址:https://www.w3.org/RDF/。
[71]
D.Ritze、O.Lehmberg和C.Bizer。2015.将HTML表与DBPedia匹配。第五届网络智能、挖掘和语义国际会议论文集。美国医学会,10。
[72]
P.Rodriguez-Tomé。1998年,《生物目录》。生物信息学14,5(1998年6月),469–470,https://doi.org/10.1093/bioinformatics/14.5.469
[73]
O.Ronneberger、P.Fischer和T.Brox。2015.U-net:生物医学图像分割的卷积网络。在医学图像计算和计算机辅助干预国际会议上,Springer 234-241。
[74]
萨拉瓦基(S.Sarawagi)。2008.信息提取。数据库基础与趋势1,3(2008),261-377。
[75]
模型的软件描述本体。2020年开始提供https://w3id.org/okn/o/sdm/。
[76]
L.Shamir、J.F.Wallin和A.Allen。2013年,天体物理学源代码共享实践。Astron计算。1 (2013), 54–58.
[77]
B.Shbita、A.Rajendran、J.Pujara和C.Knoblock。2019.解析、表示和转换度量单位。世界系统会议建模。华盛顿特区。
[78]
Y.Shi、K.J.Davis、C.J.Duffy和X.Yu。2013年,在关键区域观测站开发耦合地表水文模型并进行评估。水文气象学杂志14,1401–1420。
[79]
J.Slepicka、C.Yin、P.Szekely和C.Knoblock。2015年,KR2RML:异质源R2RML的另一种解释。第六届消费关联数据国际研讨会论文集。
[80]
C.O.Stöckle、A.R.Kemanian、R.L.Nelson、J.C.Adam、R.Sommer和B.Carlson。2014.CropSyst模型演变:从领域到区域再到全球,从研究到决策支持系统。环境建模与软件62(2014),361-369。
[81]
M.Stoica和S.D.Peckham。2018.构建定性和定量科学变量的本体蓝图。国际语义网络会议(P&D/Industry/BlueSky)。
[82]
M.Stoica和S.D.Peckham。2019.将新概念纳入科学变量本体。在公平世界中科学高级知识技术研讨会上。
[83]
M.Stoica和S.D.Peckham。2019.科学变量本体:机器可解释的定性和定量变量概念的自定义手动和自动创建与校准蓝图。世界系统会议建模。
[84]
科学变量本体(SVO)。2020年开始提供http://www.geoscienceontology.org/svo/1.0.0/。
[85]
P.Szekely、D.Garijo、D.Bhatia、J.Wu、Y.Yao和J.Pujara。2019.T2WML:Wikidata映射语言表。第十届知识获取国际会议(K-CAP’19)会议记录。美国纽约州纽约市计算机协会,267-270。
[86]
特里法塔。2020年开始提供https://www.trifacta.com/。
[87]
M.J.Turk、B.D.Smith、J.S.Oishi、S.Skory、S.W.Skillman、T.Abel和M.L.A.Norman。yt:用于天体物理模拟数据的多代码分析工具包。天体物理学杂志增补系列192,1。
[88]
Unidata公司。2012年,Integrated Data Viewer(IDV)3.1版[软件]。科罗拉多州博尔德:UCAR/Unidata。http://doi.org/10.5065/D6RN35XM
[89]
A.Voinov、N.Kolagani、M.K.McCall、P.D.Glynn、M.E.Kragt、F.O.Ostermann、S.A.Pierce和P.Ramu。2016年,与利益相关者一起建模——下一代。环境建模与软件77。https://doi.org/10.1016/j.envsoft.2015.11.016
[90]
B.Vu、J.Pujara和C.Knoblock。2019.D-REPR:一种描述和映射不同结构数据源到RDF的语言。第十届知识获取国际会议(K-CAP’19)会议记录。美国纽约州纽约市计算机协会,189-196年。
[91]
Z.Wei、K.Jia、X.Jia,A.Khandelwal和V.Kumar。2020年,使用语义融合网络进行全球河流监测。水12,8(2020),2258。
[92]
M.D.Wilkinson、B.Vandervalk和L.McCarthy。2011.语义自动发现和集成(SADI)Web服务设计模式、API和参考实现。《生物医学语义学杂志》2,8(2011)。https://doi.org/10.1186/2041-1480-2-8
[93]
R.Zanibbi、D.Blostein和J.R.Cordy。2004年,表格识别调查。IJDAR 7,1-16。https://doi.org/10.1007/s10032-004-0120-9
[94]
L.Zentner、M.Zenter、V.Farnsworth、M.McLennan、K.Madhavan和G.Klimeck。2014年,Nanohub.org:大型科学社区在软件可持续性方面的经验和挑战。开放研究软件杂志2(1),e19。
[95]
X.Zheng、D.G.Tarboton、D.R.Maidment、Y.Y.Liu和P.Passalacqua。2018年。使用最近排水沟上方的高度估算河道几何形状和流量曲线。《美国水资源协会杂志》54 4(2018),785–806。https://doi.org/10.1111/1752-1688.12661。

引用人

查看全部
  • (2023)用可解释的深度学习建立社区极端事件恢复力的动力学模型自然危害审查10.1061/NHREFO。NHENG-1696型24:2在线发布日期:2023年5月
  • (2023)基于bootstrap聚合神经网络的生物质气化制氢优化稳健模型开发国际氢能杂志2016年10月10日/j.ijhydene.2022.11048:29(10812-10828)网上发布日期:2023年4月
  • (2023)为非专业用户广泛传播水文模型的框架环境建模与软件2016年10月10日/j.envsoft.2023.105695164:C在线发布日期:2023年6月1日
  • 显示更多引用者

建议

评论

信息和贡献者

问询处

发布于

交互式智能系统封面图片ACM交易
交互式智能系统ACM事务 第11卷第2期
2021年6月
267页
国际标准编号:2160-6455
EISSN公司:2160-6463
DOI(操作界面):10.1145/3465444
期刊目录
如果复制品不是为了盈利或商业利益而制作或分发的,并且复制品的第一页载有本通知和完整引文,则允许免费制作本作品的全部或部分数字或硬拷贝以供个人或课堂使用。必须尊重ACM以外的其他人对本作品组成部分的版权。允许用信用证进行摘要。要以其他方式复制或重新发布,在服务器上发布或重新发布到列表,需要事先获得特定许可和/或付费。从请求权限[电子邮件保护].

出版商

计算机协会

美国纽约州纽约市

出版历史

出版:2021年7月21日
认可的:2021年2月1日
修订过的:2021年1月1日
收到:2020年5月1日
在TIIS中发布体积11,问题2

权限

请求对此文章的权限。

检查更新

作者标记

  1. 智能用户界面
  2. 集成建模
  3. 模型元数据
  4. 区域级决策
  5. 遥感数据

限定符

  • 研究文章
  • 推荐

资金来源

  • 国防高级研究计划局
  • 德克萨斯大学奥斯汀分校德克萨斯星球2050项目
  • 国家科学基金会

贡献者

其他指标

文献计量学和引文

文献计量学

文章指标

  • 下载量(最近12个月)790
  • 下载次数(最近6周)85

其他指标

引文

引用人

查看全部
  • (2023)用可解释的深度学习建模社区对极端事件的恢复力动力学自然危害审查10.1061/NHREFO。NHENG-1696型24:2在线发布日期:2023年5月
  • (2023)基于bootstrap聚合神经网络的生物质气化制氢优化稳健模型开发国际氢能杂志2016年10月10日/j.ijhydene.2022.11048:29(10812-10828)网上发布日期:2023年4月
  • (2023)为非专业用户广泛传播水文模型的框架环境建模与软件2016年10月10日/j.envsoft.2023.105695164:C在线发布日期:2023年6月1日
  • (2022)自动化模型到模型集成的多变量工作流组合2022年IEEE第18届国际电子科学会议(e-Science)10.1109/电子科学55777.2022.00030(159-170)在线发布日期:2022年10月
  • (2022)为跨学科气候研究创造会议场所:人文社会科学在重大挑战中的作用跨学科科学评论10.1080/03080188.2022.2148889(1-23)在线发布日期:2022年12月28日
  • (2022)基于响应面法的微生物燃料电池功率预测人工神经网络拓扑优化生物技术进展10.1002/btpr.325838:4在线发布日期:2022年4月20日
  • (2021)人工智能将来会写科学论文吗?人工智能杂志10.1609/aaai.12027年42:4(3-15)在线发布日期:2021年12月1日
  • (2021)生命科学中工作流自动合成的观点F1000研究10.12688/f1000研究。54159.110(897)在线发布日期:2021年9月7日
  • (2020)深度神经网络中支持起源的超参数分析数据和过程的来源和注释10.1007/978-3-030-80960-7_2(20-38)在线发布日期:2020年6月22日

视图选项

查看选项

PDF格式

以PDF文件查看或下载。

PDF格式

电子阅读器

使用联机查看电子阅读器.

电子阅读器

HTML格式格式

在中查看本文HTML格式格式。

HTML格式

获取访问权限

登录选项

完全访问权限

媒体

数字

其他

桌子

分享

分享

共享此出版物链接

在社交媒体上分享