文章 2018-08-23 来自:开发者社区

10分钟上手,OpenCV自然场景文本检测(Python代码+实现)

在本教程中,您将学习如何使用EAST文本检测器在自然场景下检测文本。 本教程的主要目的是教读者利用OpenCV和EAST文本检测器来检测文本。 运行环境: EAST文本检测器需要OpenCV3.4.2或更高版本,有需要的读者可以先安装OpenCV。 主要内容: ● 教程第一部分分析为何在自然场景下进行文本检测的挑战性是如此之高。● 接下来简要探讨EAST文本检测器,为何使用,算...

文章 2018-08-16 来自:开发者社区

[雪峰磁针石博客]python标准模块介绍-string:文本常量和模板

string—文本常量和模板 作用:包含处理文本的常量和类。 Python版本:1.4及以后版本 最早的Python版本就有string模块。 之前在这个模块中实现的许多函数已经移至str对象的方法。 string模块保留了几个有用的常量和类,用于处理str对象。 代码地址 函数 capwords()的将字符串中所有单词的首字母大写。 #!python >>> import s....

文章 2018-08-09 来自:开发者社区

python实战,中文自然语言处理,应用jieba库来统计文本词频

模块介绍 安装:pip install jieba 即可 jieba库,主要用于中文文本内容的分词,它有3种分词方法: 1. 精确模式, 试图将句子最精确地切开,适合文本分析: 2. 全模式,把句子中所有的可以成词的词语都扫描出来,速度非常快,但是不能解决歧义; 3. 搜索引擎模式,在精确模式的基础上,对长词再词切分,提高召回率,适合用于搜索引擎分词。 我们用个小例子演示下 这...

文章 2018-08-06 来自:开发者社区

使用scikit-learn解决文本多分类问题(附python演练)

在我们的商业世界中,存在着许多需要对文本进行分类的情况。例如,新闻报道通常按主题进行组织; 内容或产品通常需要按类别打上标签; 根据用户在线上谈论产品或品牌时的文字内容将用户分到不同的群组...... 但是,互联网上的绝大多数文本分类文章和教程都是二文本分类,如垃圾邮件过滤(垃圾邮件与正常邮件),情感分析(正面与负面)。在大多数情况下,我们的现实世界问题要复杂得多。因此,这就是我们今天要做的事情....

文章 2018-06-26 来自:开发者社区

Python爬虫,用第三方库解决下载网页中文本的问题

还在辛辛苦苦的查找网页规律,写正则或者其他方式去匹配文本内容吗?还在纠结怎么去除小说网站的其他字符吗? 先来看看下面2张图,都是某小说网站的小说内容 怎么样,是不是很简洁!这就是今天给大家介绍的库,newspaper库! newspaper python3.x安装: pip install newspaper3k python2.7安装: pip install newsp...

文章 2018-06-14 来自:开发者社区

Python-TXT文本操作

一、列出IO操作的标识符及描述 标识符 描述 r 以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。 rb 以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式。 r+ 打开一个文件用于读写。文件指针将会放在文件的开头。 rb+ 以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。 w 打开一个文件只用于写入。如果该文件已存...

文章 2018-06-09 来自:开发者社区

零基础学python之文本和编码问题

字符串是个相当简单的概念:一个字符串是一个字符序列。问题出在”字符”的定义上。 在2015 年,”字符”的最佳定义是Unicode字符。因此,从Python 3 的str对象中获取 的元素是Unicode字符 Unicode 标准把字符的标识和具体的字节表述进行了如下的明确区分。 字符的标识,即码位,是0~1 114 111的数字(十进制),在Unicode标准中以4~6个十六进制数...

文章 2018-05-17 来自:开发者社区

手把手教你在Python中实现文本分类(附代码、数据集)

文本分类是商业问题中常见的自然语言处理任务,目标是自动将文本文件分到一个或多个已定义好的类别中。文本分类的一些例子如下: 分析社交媒体中的大众情感鉴别垃圾邮件和非垃圾邮件自动标注客户问询将新闻文章按主题分类目录 本文将详细介绍文本分类问题并用Python实现这个过程: 文本分类是有监督学习的一个例子,它使用包含文本文档和标签的数据集来训练一个分类器。端到端的文本分类训练主要由三个部分组成: 1.....

文章 2018-03-22 来自:开发者社区

如何用Python批量提取PDF文本内容?

本文为你展示,如何用Python把许多PDF文件的文本内容批量提取出来,并且整理存储到数据框中,以便于后续的数据分析。 问题 最近,读者们在后台的留言,愈发五花八门了。 写了几篇关于自然语言处理的文章后,一种呼声渐强: 老师,pdf中的文本内容,有没有什么方便的方法提取出来呢? 我能体会到读者的心情。 我展示的例子中,文本数据都是直接可以读入数据框工具做处理的。它们可能来自开放数据集合、网站...

文章 2018-03-12 来自:开发者社区

如何用Python和机器学习训练中文文本情感分类模型?

利用Python机器学习框架scikit-learn,我们自己做一个分类模型,对中文评论信息做情感分析。其中还会介绍中文停用词的处理方法。 疑惑 前些日子,我在微信后台收到了一则读者的留言。 我一下子有些懵——这怎么还带点播了呢? 但是旋即我醒悟过来,好像是我自己之前挖了个坑。 之前我写过《 如何用Python从海量文本抽取主题? 》一文,其中有这么一段: 为了演示...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

Python学习站

Python学习资料大全,包含Python编程学习、实战案例分享、开发者必知词条等内容。

+关注
相关镜像