全文搜索

来自semantic-mediawiki.org
跳转到:航行,搜索
全文搜索
全文搜索支持数据类型使用字符串或文本存储其数据库表的属性。例如。数据类型“Page”保存wiki页面的名称,并将其显示为链接,数据类型“文本”保存任意长度的文本,数据类型“代码”保存预先格式化的技术文本(类似于数据类型文本)数据类型“URL”保存URI、URN和URL等。
关键词
查询 · 全文索引 · 全文 · 全文检索
目录

语义媒体Wiki 2.5.02017年3月14日发布,与MW 1.23.0-1.29.x兼容。为数据类型使用字符串或文本存储其数据库表的属性(例如。数据类型“Page”保存wiki页面的名称,并将其显示为链接,数据类型“文本”保存任意长度的文本,数据类型“代码”保存预先格式化的技术文本(类似于数据类型文本)数据类型“URL”保存URI、URN和URL等。

特征[编辑]

一般注意事项[编辑]

  • 这个FT_搜索表聚合数据类型的搜索内容,将其数据存储为BLOB(博客)URI(URI)值,例如。数据类型“Page”保存wiki页面的名称,并将其显示为链接,数据类型“文本”保存任意长度的文本,数据类型“代码”保存预先格式化的技术文本(类似于数据类型文本)数据类型“URL”保存URI、URN和URL等。
  • 这些数据类型使用烧焦,瓦查尔,或文本将其数据存储在数据库表中。
  • 支持的操作依赖于关系后端数据库(MySQL数据库,马里兰州开发银行数据库).
  • 对于MySQL和MariaDB数据库,处于布尔模式用作默认搜索模式。这允许软件使用一些特殊操作员。
  • 相关性和分数不用于任何排序目的,例如在最佳匹配中。
  • 文本消毒剂依赖于“onoi/tesa”库1帮助清理文本或字符串元素,以提供一些文本操作支持,以及在启用时使用语言检测的可能性。此库已预先安装,供Semantic MediaWiki使用。
  • 自定义停止字仅由“onoi/tesa”库应用1如果启用了语言检测,但MySQL/MariaDB提供了自己的标准列表2默认情况下启用
  • 从开始语义媒体Wiki 3.0.02018年10月11日发布,与MW 1.27.0-1.31.x兼容。:

中文、日语和韩语(CJK)语言支持说明[编辑]

  • 一般CJK支持是一项具有挑战性的工作,因为文本元素被分解为不被空格分隔的相应标记
  • “onoi/tesa”库1提供了一些简单的分词器的,它不需要语言检测,并将尝试提供开箱即用的基本CJK搜索。这需要ICU 54+。
  • Mroonga公司是一个MySQL存储引擎,据说是一个支持CJK的全文搜索、列存储
  • MySQL附带一个可选ngram全文分析器MeCab全文分析器插件.
  • 根据这个问题,MariadDB缺少这些解析器插件。2023年仍缺乏支持。

说明[编辑]

对于用户
  • 搜索包含有关可用搜索语法的一些示例和描述
对于系统管理员
对于开发人员
  • 技术说明提供了有关技术实现、微调和性能的一些信息