文章 2017-05-02 来自:开发者社区

《NLTK基础教程——用NLTK和Python库构建机器学习应用》——2.5 词干提取

本节书摘来异步社区《NLTK基础教程——用NLTK和Python库构建机器学习应用》一书中的第2章,第2.5节,作者:Nitin Hardeniya,更多章节内容可以访问云栖社区“异步社区”公众号查看。 2.5 词干提取 所谓词干提取(stemming),顾名思义就是一个修剪枝叶的过程。这是很有效的方法,通过运用一些基本规则,我们可以在修剪枝叶的过程中得到所有的分词。词干提取是一种较为粗糙的规则....

文章 2017-05-02 来自:开发者社区

《NLTK基础教程——用NLTK和Python库构建机器学习应用》——2.4 标识化处理

本节书摘来异步社区《NLTK基础教程——用NLTK和Python库构建机器学习应用》一书中的第2章,第2.4节,作者:Nitin Hardeniya,更多章节内容可以访问云栖社区“异步社区”公众号查看。 2.4 标识化处理 机器所要理解的最小处理单位是单词(即分词)。所以除了标识化处理之外,我们不宜再对这些文本字符串做更进一步的处理。这里所谓的标识化,实际上就是一个将原生字符串分割成一系列有意义....

文章 2017-05-02 来自:开发者社区

《NLTK基础教程——用NLTK和Python库构建机器学习应用》——2.3 语句分离器

本节书摘来异步社区《NLTK基础教程——用NLTK和Python库构建机器学习应用》一书中的第2章,第2.3节,作者:Nitin Hardeniya,更多章节内容可以访问云栖社区“异步社区”公众号查看。 2.3 语句分离器 在某些NLP应用中,我们常常需要将一大段原生文本分割成一系列的语句,以便从中获取更多有意义的信息。直观地说,就是让语句成为一个可用的交流单元。当然,要想在计算机上实现这个任务....

文章 2017-05-02 来自:开发者社区

《NLTK基础教程——用NLTK和Python库构建机器学习应用》——2.2 文本清理

本节书摘来异步社区《NLTK基础教程——用NLTK和Python库构建机器学习应用》一书中的第2章,第2.2节,作者:Nitin Hardeniya,更多章节内容可以访问云栖社区“异步社区”公众号查看。 2.2 文本清理 一旦我们将各种数据源解析成了文本形式,接下来所要面临的挑战就是要使这些原生数据体现出它们的意义。文本清理就泛指针对文本所做的绝大部分清理、与相关数据源的依赖关系、性能的解析和外....

文章 2017-05-02 来自:开发者社区

《NLTK基础教程——用NLTK和Python库构建机器学习应用》——2.1 何谓文本歧义

本节书摘来异步社区《NLTK基础教程——用NLTK和Python库构建机器学习应用》一书中的第2章,第2.1节,作者:Nitin Hardeniya,更多章节内容可以访问云栖社区“异步社区”公众号查看。 2.1 何谓文本歧义 事实上,要想给文本/数据歧义这个术语一个定义是相当困难的。本书将它定义成从原生数据中获取一段机器可读的已格式化文本之前所要做的所有预处理工作,以及所有繁复的任务。该过程应该....

文章 2017-05-02 来自:开发者社区

《NLTK基础教程——用NLTK和Python库构建机器学习应用》——第2章 文本的歧义及其清理

本节书摘来异步社区《NLTK基础教程——用NLTK和Python库构建机器学习应用》一书中的第2章,作者:Nitin Hardeniya,更多章节内容可以访问云栖社区“异步社区”公众号查看。 第2章 文本的歧义及其清理 NLTK基础教程——用NLTK和Python库构建机器学习应用在上一章中,我们为Python以及NLTK库的学习开了一个不错的头,带你初步了解了一下如何针对一些文本资料进行一些有....

文章 2017-05-02 来自:开发者社区

《NLTK基础教程——用NLTK和Python库构建机器学习应用》——1.5 小结

本节书摘来异步社区《NLTK基础教程——用NLTK和Python库构建机器学习应用》一书中的第1章,第1.5节,作者:Nitin Hardeniya,更多章节内容可以访问云栖社区“异步社区”公众号查看。 1.5 小结 总而言之,本章致力于为自然语言处理这一领域提供一份简要概括。虽然,本书假定读者在NLP领域,以及使用Python编程方面具有一定的背景知识,但我们也提供了一份与Python和NLP....

文章 2017-05-02 来自:开发者社区

《NLTK基础教程——用NLTK和Python库构建机器学习应用》——1.4 练习

本节书摘来异步社区《NLTK基础教程——用NLTK和Python库构建机器学习应用》一书中的第1章,第1.4节,作者:Nitin Hardeniya,更多章节内容可以访问云栖社区“异步社区”公众号查看。 1.4 练习 请在不同的URL上尝试相同的练习。并试着绘制出相应的单词云。

文章 2017-05-02 来自:开发者社区

《NLTK基础教程——用NLTK和Python库构建机器学习应用》——1.3 向NLTK迈进

本节书摘来异步社区《NLTK基础教程——用NLTK和Python库构建机器学习应用》一书中的第1章,第1.3节,作者:Nitin Hardeniya,更多章节内容可以访问云栖社区“异步社区”公众号查看。 1.3 向NLTK迈进 尽管在这里,我们并不打算深入探讨自然语言处理理论,但也会尽快让你实际接触一下NLTK。因此,我打算先介绍一些NLTK的基本用例,这是一个很好的机会,你可以先为今后做类似事....

文章 2017-05-02 来自:开发者社区

《NLTK基础教程——用NLTK和Python库构建机器学习应用》——1.2 先从Python开始吧

本节书摘来异步社区《NLTK基础教程——用NLTK和Python库构建机器学习应用》一书中的第1章,第1.2节,作者:Nitin Hardeniya,更多章节内容可以访问云栖社区“异步社区”公众号查看。 1.2 先从Python开始吧 虽然,我们在这里并不打算对Python进行任何太过深入的探讨,但带你快速浏览一下Python的基础要点还是很有必要的。当然,为了观众着想,我们最好将这次基础性的快....

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

Python学习站

Python学习资料大全,包含Python编程学习、实战案例分享、开发者必知词条等内容。

+关注
相关镜像