#创建表示法对象。
我的旋转(_N) <- 符号_vec ( 预启动(_S)= "(" , 预结束(_E)= ") " ,
suff_start(启动)= "[" , 结束(suff_end)= "]" )
#符号对象是字符向量。
我的旋转(_N)
#>pref开始pref结束suff开始suff结束
#> "(" ") " "[" "]"
箭头_旋转
#>pref开始pref结束suff开始suff结束
#> "" " -> " " -> " ""
括号_旋转
#>预启动预结束开始
#> "" " (" " (" ")"
括号_旋转
#>pref开始pref结束suff开始suff结束
#> "" " [" " [" "]"
第一个不旋转
#>pref开始pref结束suff开始suff结束
#> "" "." "." ""
from_notation(从_旋转)
#>预启动预结束开始
#>“”“[来自”“[自”“]”
旋转(_N)
#>预启动预结束开始
#>“”“[第个,共个”“]”
to_notation(旋转)
#>pref开始pref结束suff开始suff结束
#>“”“[至”“[到”“]”
括号_箭头_旋转
#>pref开始pref结束suff开始suff结束
#> "" " [-> " " [-> " "]"
#从后缀中拆分前缀以获得命名字符串列表。
拆分引用后缀 (我的标签, 符号= my_notation)
#>美元优先股
#>[1]“煤炭”
#>
#>$suff(美元)
#>[1]“来自美国煤矿”
#翻转前缀和后缀,保持相同的符号。
flip_pref_suff(翻转引用) (我的标签, 符号= my_notation)
#>[1]“(来自美国煤矿)[煤炭]”
#更改符号。
开关_旋转 (我的标签, 来自= my_notation(我的旋转), 至= paren_符号)
#>[1]“煤炭(来自美国煤矿)”
#更改符号并翻转前缀和后缀。
开关_旋转 (我的标签, 来自= my_notation(我的旋转), 至= paren_符号, 翻转= 真的 )
#>[1]“来自美国煤矿(煤炭)”
标签
#>[1]“a[ofbinc]”“d[ofeinf]”“g[ofhini]”
#提取名词。
获得(_N) (标签, 符号= 括号_旋转)
#>名词名词名词
#>“a”“d”“g”
#提取介词短语。
获取_pps (标签, 符号= 括号_旋转)
#>pps pps
#>“of b in c”“of e in f”“of h in i”
#提取介词本身。
获取重新定位 (标签, 符号= 括号_旋转)
#>$介词
#>“中”“的[1]”“
#>
#>$介词
#>“中”“的[1]”“
#>
#>$介词
#>[1]中的“”
#提取介词的宾语。
#宾语由短语的介词命名。
获取对象(_O) (标签, 符号= 括号_旋转)
#>$个对象
#>中的
#>“b”“c”
#>
#>$个对象
#>中的
#>“e”“f”
#>
#>$个对象
#>中的
#>“h”“i”
#get_piece()函数是一个方便的函数
#那正是你想要的。
获取图片 (标签, 块= “名词” , 符号= 括号_旋转)
#>名词名词名词
#>“a”“d”“g”
获取图片 (标签, 块= “首选项” )
#>首选首选首选
#>“a”“d”“g”
获取图片 (标签, 件= “suff” )
#>后缀
#>“of b in c”“of e in f”“of h in i”
获取图片 (标签, 块= “第个,共个” )
#> [[1]]
#>第页,共页
#>“b”
#>
#> [[2]]
#>第页,共页
#>“e”
#>
#> [[3]]
#>第页,共页
#>“h”
获取图片 (标签, 块= “在” )
#> [[1]]
#>英寸
#>“c”
#>
#> [[2]]
#>英寸
#>“f”
#>
#> [[3]]
#>英寸
#>“i”
#当介词缺失时,返回一个空字符串。
获取图片 (标签, 块= “假的” )
#> [[1]]
#>伪造的
#> ""
#>
#> [[2]]
#>伪造的
#> ""
#>
#> [[3]]
#>伪造的
#> ""
标签
#>[1]“a[ofbinc]”“d[ofeinf]”“g[ofhini]”
#把标签分成几块,用“名词”和介词命名。
拆分标签 <- split_noun_pp (标签,
介词= 介词列表,
符号= 括号_旋转)
拆分标签
#> [[1]]
#>in的名词
#>“a”“b”“c”
#>
#> [[2]]
#>in的名词
#>“d”“e”“f”
#>
#> [[3]]
#>in的名词
#>“g”“h”“i”
#重新组合拆分标签。
粘贴_输出_打印 (拆分标签, 符号= 括号_旋转)
#>[1]“a[ofbinc]”“d[ofeinf]”“g[ofhini]”
#用新符号重新组合。
粘贴_输出_打印 (拆分标签, 符号= paren_符号)
#>[1]“a(of b in c)”“d(of e in f)”“g(of h in i)”
标签
#>[1]“a[ofbinc]”“d[ofeinf]”“g[ofhini]”
#为名词设置新值。
修饰名词 (标签,
new_nouns(新名)= c ( “煤炭” , “石油” , “天然气” ),
符号= 括号_旋转)
#>[1]“煤[的b in c]”“油[的e in f]”
#>[3]“天然气[h in i]”
标签
#>[1]“a[ofbinc]”“d[ofeinf]”“g[ofhini]”
#将几个标签中的名词改为“Production”和“Manufacture”,
#如修改图所示。
修改标签碎片 (标签,
块= “名词” ,
修改映射(_M)= 列表 ( 生产= c ( “a” , “b” , “c” , “d” ),
制造商= c ( “g” , “h” , “i” , “j” )),
符号= 括号_旋转)
#>[1]“b in c的生产”“e in f的生产”
#>[3]“制造[在i中的h]”
#改变“in”介词的宾语,
#根据修改图。
修改标签碎片 (标签,
件= “在” ,
修改映射(_M)= 列表 ( GHA公司= “c” , 南非法郎= c ( “f” , “i” )),
符号= 括号_旋转)
#>[1]“a[of b in GHA]”“d[of e in ZAF]”“g[of h in ZAF”
#改变“of”介词的宾语,
#根据修改图。
修改标签碎片 (标签,
块= “第个,共个” ,
修改映射(_M)= 列表 ( 煤炭= “b” , ` 原油 ` = c ( “e” , “h” )),
符号= 括号_旋转)
#>[1]“a[煤的c]”“d[原油的f]”“g[原油的i]”
标签
#>[1]“a[ofbinc]”“d[ofeinf]”“g[ofhini]”
#删除所有以“in”开头的介词短语。
删除标签碎片 (标签,
块= “在” ,
符号= 括号_旋转)
#>[1]“a[of b]”“d[of e]”“g[of h]”
#删除所有以“of”和“in”开头的介词短语。
#请注意,仍有一些空格。
删除标签碎片 (标签,
件= c ( “第个,共个” , “在” ),
符号= 括号_旋转)
#>[1]“a[]”“d[]”“g[]”
标签 <- c ( “生产[b in c]” , “d[煤的f值]” , “g[在美国共h个]” )
#使用默认的`pieces`参数,对整个标签进行匹配。
match_by_pattern(匹配_by-pattern) (标签, 正则表达式模式= “生产” )
#>[1]真-假-假
match_by_pattern(匹配_by-pattern) (标签, 正则表达式模式= “煤炭” )
#>[1]假真假
match_by_pattern(匹配_by-pattern) (标签, 正则表达式模式= “美国” )
#>[1]假假真
#检查标签的开头:匹配!
match_by_pattern(匹配_by-pattern) (标签, 正则表达式模式= “^生产” )
#>[1]真-假-假
#检查标签末端:无匹配!
match_by_pattern(匹配_by-pattern) (标签, 正则表达式模式= “生产$” )
#>[1]假假假
#按前缀或后缀搜索。
match_by_pattern(匹配_by-pattern) (标签, 正则表达式模式= “生产” , 个= “首选项” )
#>[1]真-假-假
match_by_pattern(匹配_by-pattern) (标签, 正则表达式模式= “生产” , 个= “suff” )
#>[1]假假假
#当工件为“pref”或“suff”时,只能指定一个。
#以下函数调用出错。
#match_by_pattern(标签,regex_pattern=“生产”,件数=c(“pref”,“to”))
#按名词或介词搜索。
match_by_pattern(匹配_by-pattern) (标签, 正则表达式模式= “生产” , 个= “名词” )
#>[1]真-假-假
匹配_by_pattern (标签, 正则表达式模式= “生产” , 个= “在” )
#>[1]假假假
#可以使用复杂的正则表达式模式进行搜索。
match_by_pattern(匹配_by-pattern) (标签,
正则表达式模式= 品牌或图案 ( c ( “c” , “f” )),
个= “在” )
#>[1]真-真-假
match_by_pattern(匹配_by-pattern) (标签,
正则表达式模式= 品牌或图案 ( c ( “b” , “煤炭” , “美国” )),
个= “在” )
#>[1]假假真
match_by_pattern(匹配_by-pattern) (标签,
正则表达式模式= 品牌或图案 ( c ( “b” , “煤炭” , “美国” )),
个= c ( “第个,共个” , “在” ))
#>[1]真真真
#使用介词的自定义列表。
匹配_by_pattern (标签,
正则表达式模式= 品牌或图案 ( c ( “b” , “煤炭” , “GBR” , “美国” )),
个= c ( “名词” , “第个,共个” , “在” , “至” ),
介词= c ( “第个,共个” , “至” , “在” ))
#>[1]真真真
标签 <- c ( “生产[b in c]” , “d[煤的f值]” , “g[在美国共h个]” )
标签
#>[1]“产量[b in c]”“d[煤in f]”“g[美国h的]”
#如果`pieces=“all”`(默认值),则可以替换整个标签。
替换by-pattern (标签,
正则表达式模式= “生产” ,
替换= “制造商” )
#>[1]“制造[b in c]”“d[煤in f]”
#>[3]“g[在美国为h]”
替换by-pattern (标签,
正则表达式模式= “煤炭” ,
更换= “石油” )
#>[1]“[b in c]”“d[in f]”“g[of h in USA]”
替换by-pattern (标签,
正则表达式模式= “美国” ,
更换= “GHA” )
#>[1]“【c中的b产量】”“d【f中的煤炭产量】””“g【GHA中的h产量】”
#替换为前缀和后缀。
替换by-pattern (标签,
正则表达式模式= “生产” ,
更换= “制造商” ,
个= “首选项” )
#>[1]“制造[b in c]”“d[煤in f]”
#>[3]“g[美国h的]”
替换by-pattern (标签,
正则表达式模式= “Coa” ,
更换= “鞠躬” ,
个= “后缀” )
#>[1]“产量[of b in c]”“d[of Bowl in f]”“g[of h in USA]”
#什么都不应该改变,因为后缀中有USA。
替换by-pattern (标签,
正则表达式模式= “SA” ,
更换= “SSR” ,
个= “首选项” )
#>[1]“产量[b in c]”“d[煤in f]”“g[美国h的]”
#现在是USA-->USSR,因为USA在后缀中。
替换by-pattern (标签,
正则表达式模式= “SA” ,
更换= “SSR” ,
个= “suff” )
#>[1]“[b in c]”“d[煤炭in f]”“g[苏联h的]产量”
#这将引发错误,因为只能指定“pref”或“suff”。
#replace_by-pattern(标签,
#regex_pattern=“SA”,
#替换=“SSR”,
#件=c(“pref”,“suff”)
#替换为名词或介词。
替换by-pattern (标签,
正则表达式模式= “生产” ,
更换= “制造商” ,
个= “名词” )
#>[1]“制造[b in c]”“d[煤in f]”
#>[3]“g[美国h的]”
替换_by_pattern (标签,
正则表达式模式= “^Pro” ,
更换= “反对” ,
个= “名词” )
#>[1]“传导[b in c]”“d[煤in f]”“g[美国h]”
#不匹配:字符串的错误边。
替换by-pattern (标签,
正则表达式模式= “专业$” ,
更换= “反对” ,
个= “名词” )
#>[1]“产量[b in c]”“d[煤in f]”“g[美国h的]”
#没有变化,因为“生产”是一个名词。
替换by-pattern (标签,
正则表达式模式= “生产” ,
更换= “制造商” ,
个= “第个,共个” )
#>[1]“产量[b in c]”“d[煤in f]”“g[美国h的]”
#现在尝试使用“of”。
替换by-pattern (标签,
正则表达式模式= “煤炭” ,
更换= “石油” ,
个= “第个,共个” )
#>[1]“[c中b的]产量”“d[f中石油的]产量”“g[美国h的]产量”
#没有变化,因为“煤”不“在”任何东西中。
替换_by_pattern (标签,
正则表达式模式= “煤炭” ,
更换= “石油” ,
个= “在” )
#>[1]“产量[b in c]”“d[煤in f]”“g[美国h的]”
#现在尝试输入“in”。
替换by-pattern (标签,
正则表达式模式= “美国” ,
更换= “GBR” ,
个= “在” )
#>[1]“【c中的b产量】”“d【f中的煤炭产量】””“g【GBR中的h产量】”
替换by-pattern (标签,
正则表达式模式= “澳元” ,
更换= “超级脆弱性极限” ,
个= “在” )
#>[1]“生产[b in c]”
#>[2]“d[煤的f值]”
#>[3]“在USupercalifragilisticexpialidocious]中,g为h”