如何用Elasticsearch实现Word、PDF,TXT文件的全文内容检索?

如何用Elasticsearch实现Word、PDF,TXT文件的全文内容检索?

Elasticsearch简介开发环境核心问题文件上传关键字查询编码导入依赖文件上传文件查询多文件测试还存在的一些问题简单介绍一下需求能支持文件的上传,下载要能根据关键字,搜索出文件,要求要能搜索到文件里的文字,文件类型要支持word,pdf,txt文件上传,下载比较简单,要能检索到文...

Elasticsearch大文件检索性能提升20倍实践(干货)

Elasticsearch大文件检索性能提升20倍实践(干货)

项目中,有时候需要将一些扫描件、PDF文档、Word、Excel、PPT等文档内容导入Elasticsearch。比如:将《深入理解Elasticsearch》这边书导入ES,而这边书的全文内容被识别后的大小可能为3MB——5MB以上的字节。存入ES后是一个content字段,对这个content执...

Kibana Lens 入门

1 课时 |
69 人已学 |
免费

Elasticsearch实战进阶营

4 课时 |
218 人已学 |
免费

ElasticSearch 最新快速入门教程

98 课时 |
997 人已学 |
免费
开发者课程背景图

Elasticsearch大文件检索性能提升20倍实践(干货)

1、大文件是多大? ES建立索引完成全文检索的前提是将待检索的信息导入Elaticsearch。 项目中,有时候需要将一些扫描件、PDF文档、Word、Excel、PPT等文档内容导入Elasticsearch。 比如:将《深入理解Elasticsearch》这边书导入ES,而这边书的全文内容被识别...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

社区圈子

Elasticsearch 技术团队
Elasticsearch 技术团队
阿里云Elasticsearch兼容开源ELK功能,提供免运维全托管服务的弹性云搜索与分析引擎,致力于数据库加速、数据分析、信息检索、智能运维监控等场景服务;独有的云原生高性能内核、达摩院NLP分词、向量检索、智能运维、免费X-Pack高级商业特性等能力,全面提升企业应用效率,降低成本。
3027+人已加入
加入
相关电子书
更多
《云原生Elasticsearch增强版助力10倍日志写入性能提升》
阿里云Elasticsearch体系架构与特性解析
《Elasticsearch中国开发者调查报告》
立即下载 立即下载 立即下载