×

有限状态传感器级联以提取文本中的专有名称。 (英语) Zbl 1015.68667号

Watson,Bruce W.(编辑)等人,《自动机的实现和应用》。2001年7月23日至25日在南非比勒陀利亚举行的CIAA 2001第六届国际会议。修订论文。柏林:斯普林格。莱克特。注释计算。科学。第2494115-124页(2002年)。
摘要:本文描述了一个有限状态级联,用于提取法语文本中的人名。我们提取这些专有名称是为了对文本进行分类和聚类。在有限状态预处理(在句子中划分文本、用字典标记等)之后,一系列有限状态变换器依次应用于文本,并定位表示人名存在的左右上下文。对这种提取的结果进行了评估。
有关整个系列,请参见[Zbl 1007.00059号].

MSC公司:

68单位99 计算方法和应用
第68页第50页 自然语言处理
65年第68季度 形式语言和自动机

软件:

INTEX公司
PDF格式BibTeX公司 XML格式引用
全文: 链接