文章 2021-12-22 来自:开发者社区

Elasticsearch实战(五)-倒排索引与分词(下)

4 内置分词器Standard Analyzer默认分词器,按词切分,支持多语言,小写处理Simple Analyzer按照非字母切分,小写处理Whitespace Analyzer按空格切分Stop AnalyzerStop Word 指语气助词等修饰性词语,比如 the、an、的、这等等,特性是相比 Simple Analyzer 多 Stop Word 处理keyword Analyzer....

Elasticsearch实战(五)-倒排索引与分词(下)
文章 2021-12-22 来自:开发者社区

Elasticsearch实战(五)-倒排索引与分词

2.1.3 Token Filters针对 tokenizer 处理的单词进行再加工,比如转小写、删除或新增等处理,内置:lowercase 将所有 term 转换为小写stop 删除 stop wordsNGram 和 Edge NGram 连词分割Synonym 添加近义词的 term示例// filter 可以有多个 POST _analyze { "text":"a Hello wo...

Elasticsearch实战(五)-倒排索引与分词

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

Elasticsearch 技术团队

阿里云Elasticsearch兼容开源ELK功能,提供免运维全托管服务的弹性云搜索与分析引擎,致力于数据库加速、数据分析、信息检索、智能运维监控等场景服务;独有的云原生高性能内核、达摩院NLP分词、向量检索、智能运维、免费X-Pack高级商业特性等能力,全面提升企业应用效率,降低成本。

+关注