纳塔利·弗里伯格;丹尼斯·莫雷尔 有限状态传感器级联以提取文本中的专有名称。 (英语) Zbl 1015.68667号 Watson,Bruce W.(编辑)等人,《自动机的实现和应用》。2001年7月23日至25日在南非比勒陀利亚举行的CIAA 2001第六届国际会议。修订论文。柏林:斯普林格。莱克特。注释计算。科学。第2494115-124页(2002年)。 摘要:本文描述了一个有限状态级联,用于提取法语文本中的人名。我们提取这些专有名称是为了对文本进行分类和聚类。在有限状态预处理(在句子中划分文本、用字典标记等)之后,一系列有限状态变换器依次应用于文本,并定位表示人名存在的左右上下文。对这种提取的结果进行了评估。有关整个系列,请参见[Zbl 1007.00059号]. MSC公司: 68单位99 计算方法和应用 第68页第50页 自然语言处理 65年第68季度 形式语言和自动机 软件:INTEX公司 PDF格式BibTeX公司 XML格式引用 \textit{N.Friburger}和\textit{D.Maurel},莱克特。注释计算。科学。2494115-124(2002年;Zbl 1015.68667) 全文: 链接