阿里云搜索结果产品模块_内容安全

干货解析|深度学习文本分类在支付宝投诉文本模型上的应用

被很好的理解和刻画。本文主要介绍了深度学习中的 文本 分类任务,以及一些应用于 文本 分类的深度学习 模型文本 分类是自然语言处理领域最经典的场景之一,试图推断出给定的 文本(句子、文档等)的标签或标签集合。通过这些技术,计算机能够更好地理解人类的语言。针对 ...
来自: 开发者社区 > 博客 作者: 兔子酱 浏览:73 回复:0

百度开源其NLP主题模型工具包,文本分类等场景可直接使用L——LDA进行主题选择本质就是降维,然后用于推荐或者分类

支持用户以“拿来即用”的方式进行 文本 分类文本聚类、个性化推荐等多种场景的调研和应用。考虑到主题 模型训练成本较高以及开源主题 模型资源有限的现状,我们会陆续开放基于工业级语料训练的多个垂直领域的主题 模型,以及这些 模型在工业界的典型应用 ...
来自: 开发者社区 > 博客 作者: 桃子红了呐 浏览:6 回复:0

自然语言处理(NLP)类模型 - 机器学习PAI

PAI提供多种已经训练好的自然语言处理类 模型供您使用,包括新闻 分类文本内容反垃圾、金融 文本匹配、中文基础NER及BERT 文本向量化 ...
推荐

阿里云爆款特惠专场,精选爆款产品低至0.95折!

爆款ECS云服务器8.1元/月起,云数据库低至1.5折,限时抢购!
广告

谷歌做了45万次不同类型的文本分类后,总结出一个通用的“模型选择算法”

谷歌官方推出“ 文本 分类”指南教程。为了最大限度地简化选择 文本 分类 模型的过程,谷歌在进行大约450K的 文本 分类实验后,总结出一个通用的“ 模型选择算法”,并附上一个完整的流程图,非常实用。【新智元导读】谷歌官方 ...
来自: 开发者社区 > 博客 作者: 技术小能手 浏览:144 回复:0

基于LSTM搭建文本情感分类的深度学习模型:准确率95%

基于LSTM搭建 文本情感 分类的深度学习 模型:准确率95%基于情感词典的 文本情感 分类![image](https://yqfile.alicdn.com/8de3101cba9cd1910bb81e6c56a2d3e6de67a885.png ...
来自: 开发者社区 > 博客 作者: 技术小能手 浏览:97 回复:0

Yann LeCun新作:473种模型大对比,中日韩文本分类到底要用哪种编码?

Chinese, English, Japanese and Korean?》。这篇文章做了一个包含473种 模型的大型对比实验,实验的目的是对 文本 分类任务中不同语言(英语、汉语、韩语和日语)不同的level(utf-8 、字符等)和不同的encoding(bag ...
来自: 开发者社区 > 博客 作者: 燕儿199606 浏览:113 回复:0

基于文本分析算法实现新闻分类 - 机器学习PAI

本文为您介绍如何通过PAI提供的 文本类组件,快速构建 文本 分类 模型 ...

智能文本分类 - 自然语言处理

对用户输入的一段 文本,映射到具体的类目上。支持的类目体系可以是平层类目或者以树状形式组织的层次类目,系统内置两种默认 分类体系:新闻资讯领域类目体系、电商领域类目体系。其中:新闻资讯分为15个类目(健康、观点、旅游、经济、房产、文娱、社会、国际、消费 ...

文本分类配置 - 语言协同平台

新建 文本 分类配置 依次点击生产配置 - 业务常 ...

基于朴素贝叶斯分类器的文本分类算法(下)

分类 模型中的一种简单但性能优越的的 分类 模型。为了简化计算过程,假定各待 分类 文本特征变量是相互独立的,即“朴素贝叶斯 模型的假设”。相互独立表明了所有特征变量之间的表述是没有关联的。如上例中,[good]和[study]这两个特征变量就是 ...
来自: 开发者社区 > 博客 作者: 嗯哼9925 浏览:12 回复:0

基于朴素贝叶斯分类器的文本分类算法(上)

贝叶斯学习的相关理论(如果你对理论不感兴趣,请直接跳至第二部分<<基于朴素贝叶斯 分类器的 文本 分类算法(下)>>)。第二部分讲如何将贝叶斯 分类器应用到中文 文本 分类,随文附上示例代码。& ...
来自: 开发者社区 > 博客 作者: 嗯哼9925 浏览:11 回复:0

用深度学习(CNN RNN Attention)解决大规模文本分类问题 - 综述和实践

天花板非常低,不仅费时费力,覆盖的范围和准确率都非常有限。后来伴随着统计学习方法的发展,特别是90年代后互联网在线 文本数量增长和机器学习学科的兴起,逐渐形成了一套解决大规模 文本 分类问题的经典玩法,这个阶段的主要套路是人工特征工程+浅层 分类 模型。训练 文本 分类 ...
来自: 开发者社区 > 博客 作者: 玄学酱 浏览:66 回复:0

使用libsvm实现文本分类

宏观上总结一下,基于libsvm实现 文本 分类实现的基本过程,如下所示:选择 文本训练数据集和测试数据集:训练集和测试集都是类标签已知的;训练集 文本预处理:这里主要包括分词、去停用词、建立词袋 模型(倒排表);选择 文本 分类使用的特征向量(词向量 ...
来自: 开发者社区 > 博客 作者: shiyanjuncn 浏览:1134 回复:0

手把手教你在Python中实现文本分类(附代码、数据集)

;.join(topic_words)三、建模 文本 分类框架的最后一步是利用之前创建的特征训练一个 分类器。关于这个最终的 模型,机器学习中有很多 模型可供选择。我们将使用下面不同的 分类器来做 文本 分类:朴素贝叶斯 分类器线性 分类器支持向量机 ...
来自: 开发者社区 > 博客 作者: 技术小能手 浏览:336 回复:0

Raúl Garreta大神教你5步搭建机器学习文本分类器:MonkeyLearn

模型及其他事情。本文将会描述如何使用MonkeyLearn训练一个 文本 分类器,具体分为如下5步:1. 定义类别树2. 数据收集3. 数据标记4. 训练 分类器5. 测试&提升 分类器1.定义类别树在训练 文本 ...
来自: 开发者社区 > 博客 作者: 【方向】 浏览:548 回复:0

文本分类与SVM

高价在卖1.2&特征选择 文本 分类中最著名的特征提取方法就是向量空间 模型(VSM),即将样本转换为向量的形式。为了能实现这种转换,需要做两个工作:确定特征集和提取特征。1.2.1&确定特征集特征集其实就是词典 ...
来自: 开发者社区 > 博客 作者: skyme 浏览:1849 回复:0

Facebook 开源的快速文本分类器 FastTex

FastText是Facebook开发的一款快速 文本 分类器,提供简单而高效的 文本 分类和表征学习的方法,性能比肩深度学习而且速度更快。1. fastText 原理fastText 方法包含三部分: 模型架构、层次 Softmax 和 N ...
来自: 开发者社区 > 博客 作者: 晚来风急 浏览:228 回复:0

手把手教你用 TensorFlow 实现文本分类(上)

由于需要学习语音识别,期间接触了深度学习的算法。利用空闲时间,想用神经网络做一个 文本 分类的应用, 目的是从头到尾完成一次机器学习的应用,学习 模型的优化方法,同时学会使用主流的深度学习框架(这里选择tensorflow)。文章分为两部分,本文仅实现流程 ...
来自: 开发者社区 > 博客 作者: 玄学酱 浏览:290 回复:0

用神经网络进行文本分类

。聊天机器人内部一个基础的组成部分是 文本 分类器。让我们一起来探究一个用于 文本 分类的人工神经网络的内部结构。多层人工神经网络我们将会使用两层神经元(包括一个隐层)和词袋 模型来组织(organizing 似乎有更好的选择,求建议)我们的训练数据。有 ...
来自: 开发者社区 > 博客 作者: 玄学酱 浏览:98 回复:0

使用scikit-learn解决文本多分类问题(附python演练)

学习方法最适合解决它。如果来了一条新的投诉,我们希望将其分配到12个类别中的一个。 分类器假设每条新投诉都分配给一个且仅一个类别。这是 文本分类问题。是不是很迫不及待想看到我们可以做到什么程度呢!二、数据探索在深入研究机器学习 模型之前 ...
来自: 开发者社区 > 博客 作者: 技术小能手 浏览:30 回复:0

手把手教你用 TensorFlow 实现文本分类(上)

由于需要学习语音识别,期间接触了深度学习的算法。利用空闲时间,想用神经网络做一个 文本 分类的应用, 目的是从头到尾完成一次机器学习的应用,学习 模型的优化方法,同时学会使用主流的深度学习框架(这里选择tensorflow)。文章分为两部分,本文仅实现流程 ...
来自: 开发者社区 > 博客 作者: 玄学酱 浏览:290 回复:0

使用scikit-learn解决文本多分类问题(附python演练)

学习方法最适合解决它。如果来了一条新的投诉,我们希望将其分配到12个类别中的一个。 分类器假设每条新投诉都分配给一个且仅一个类别。这是 文本分类问题。是不是很迫不及待想看到我们可以做到什么程度呢!二、数据探索在深入研究机器学习 模型之前 ...
来自: 开发者社区 > 博客 作者: 技术小能手 浏览:30 回复:0

自然语言处理第一番之文本分类器

提取, 这篇文章会比较粗地描述下,在 文本 分类的一些实验传统 文本 分类方法这里主要描述两种特征提取方法:频次法、tf-idf、互信息、N-Gram。频次法频次法,顾名思义,十分简单,记录每篇文章的次数分布,然后将分布输入机器学习 模型,训练一个 ...
来自: 开发者社区 > 博客 作者: 知与谁同 浏览:156 回复:0

科普|文本分析浅析——文档分类

向量机、朴素贝叶斯、决策树等,它们的所能达到的细节早已超出了本文的范围。结论希望你现在对 文本 分类的基本原理及其工作流程,有更透彻的理解。作为总结,在监督学习中, 模型的建立是基于一个训练集。此后, 分类器在这个手工标记过的训练数据集上进行训练 ...
来自: 开发者社区 > 博客 作者: 小旋风柴进 浏览:370 回复:0

胶囊网络(Capsule Network)在文本分类中的探索

Classificationm,更多细节可以点击阅读原文进行参考。我们会在论文发表后公开源码。论文 模型 文本主要研究胶囊网络在 文本 分类任务上的应用, 模型的结构图如下:其中,连续两个卷积层采用动态路由替换池化操作。动态路由的具体细节如下 ...
来自: 开发者社区 > 博客 作者: 技术小能手 浏览:120 回复:0

NLPIR深度机器学习的文本分类

NLPIR深度 文本 分类,可以用于新闻 分类、简历 分类、邮件 分类、办公文档 分类、区域 分类等诸多方面。此外还可以实现 文本过滤,能够从大量 文本中快速识别和过滤出符合特殊要求的信息,可应用于品牌报道监测、垃圾信息屏蔽、敏感信息审查等领域。近年来,随着Intemet ...
来自: 开发者社区 > 博客 作者: ljrj123 浏览:31 回复:0

CNN-RNN中文文本分类,基于TensorFlow 实现

null使用卷积神经网络以及循环神经网络进行中文 文本 分类CNN做句子 分类的论文可以参看: https://arxiv.org/abs/1408.5882还可以去读dennybritz大牛的博客:http://www.wildml.com ...
来自: 开发者社区 > 博客 作者: 技术小能手 浏览:364 回复:0

基于Python的文本情感分类

.plot((0,1),(0,1),'r--')# 添加 文本注释plt.text(0.5,0.5,'ROC=%.2f' %auc2)# 设置坐标轴标签和标题plt.title('随机森林 模型的AUC ...
来自: 开发者社区 > 博客 作者: 秦玉坤 浏览:16 回复:0

灵玖NlpirParser智能挖掘平台文本分类过滤系统

  由于文档往往采用高频的词语来强调需要表达的特征涵义,而句子中往往是单一的词语,因此在句子检索中需要进一步选择更有区分能力的特征词。为此引入了 文本 分类过滤中常用的特征选择过程。  灵玖Nlpir Parser智能挖掘平台 文本 分类过滤系统能够根据文献 ...
来自: 开发者社区 > 博客 作者: ljrj123 浏览:318 回复:0

灵玖NlpirParser智能挖掘平台文本分类过滤系统

  由于文档往往采用高频的词语来强调需要表达的特征涵义,而句子中往往是单一的词语,因此在句子检索中需要进一步选择更有区分能力的特征词。为此引入了 文本 分类过滤中常用的特征选择过程。   灵玖Nlpir Parser智能挖掘平台 文本 分类过滤系统能够根据文献 ...
来自: 开发者社区 > 论坛 作者: ljrj123 浏览:1152 回复:0

基于sklearn的文本特征提取与分类

scikit-learn做 文本 分类&以及 文本挖掘之特征选择(python 实现)&等文章。题目是80万条短信作为训练数据,10%的垃圾短信(label = 1),90%正常短信(label = 0),然后在20万条数据作为测试对象 ...
来自: 开发者社区 > 博客 作者: yabmarlboro 浏览:1204 回复:0

用深度学习(CNN RNN Attention)解决大规模文本分类问题 - 综述和实践

,不仅费时费力,覆盖的范围和准确率都非常有限。后来伴随着统计学习方法的发展,特别是90年代后互联网在线 文本数量增长和机器学习学科的兴起,逐渐形成了一套解决大规模 文本 分类问题的经典玩法,这个阶段的主要套路是人工特征工程+浅层 分类 模型。训练 文本 分类器过程见下图 ...
来自: 开发者社区 > 博客 作者: 秦玉坤 浏览:69 回复:0

卡方检验用于文本分类中的特征提取

开方值,用这个值与事先设定的阈值比较,如果大于阈值(即偏差很大),就认为原假设不成立,反之则认为原假设成立。在 文本 分类的特征选择阶段,一般使用“词t与类别c不相关”来做原假设,计算出的开方值越大,说明对原假设的偏离越大,我们越 ...
来自: 开发者社区 > 博客 作者: yichudu 浏览:313 回复:0

手把手教你用 TensorFlow 实现文本分类(下)

本篇文章主要记录对之前用神经网络做 文本识别的初步优化,进一步将准确率由原来的65%提高到80%,这里优化的几个方面包括:● 随机打乱训练数据● 增加隐层,和验证集● 正则化● 对原数据进行PCA预处理● 调节训练参数(迭代次数 ...
来自: 开发者社区 > 博客 作者: 玄学酱 浏览:159 回复:0

有木有自然语言处理的大虾,给提供些中文文本分类语料资源,多谢!_关于自然语言处理的问题

有木有自然语言处理的大虾,给提供些中文 文本 分类语料资源,多谢!_关于自然语言处理的问题 ...
来自: 开发者社区 > 问答 作者: 知与谁同 浏览:6 回复:3

300万知乎多标签文本分类任务经验分享(附源码)

标注数据自动标注的 模型”。通俗点讲就是:当用户在知乎上提问题时,程序要能够根据问题的内容自动为其添加话题标签。一个问题可能对应着多个话题标签,如下图所示。这是一个 文本分类,多label的 分类问题(一个样本可能属于多个类别)。总共有 ...
来自: 开发者社区 > 博客 作者: 技术小能手 浏览:86 回复:0

【资源】用深度学习解决自然语言处理中的7大问题,文本分类、语言建模、机器翻译等

表现,这是最有趣的;事实上,单个 模型可以学习单词的含义和执行语言任务,从而避免需要一套专门的、人工的方法。这篇文章将介绍深度学习方法正在取得进展的7类有趣的自然语言处理任务。- 文本 分类- 语言建模- 语音识别- 字幕生成 ...
来自: 开发者社区 > 博客 作者: 技术小能手 浏览:867 回复:0

手把手教你如何用 TensorFlow 实现基于 DNN 的文本分类

实现好的函数库,例如 TensorFlow。在本文中,我们将利用 TensorFlow 实现一个基于深度神经网络(DNN)的 文本 分类 模型,希望对各位初学者有所帮助。文中所涉完整代码已经在 GitHub 上开源,感兴趣的朋友可以在以下链接中下载 ...
来自: 开发者社区 > 博客 作者: 玄学酱 浏览:164 回复:0

文本分类的背景和流程

正类和负类都通过上面的方法表示成 VSM 模型中的点,剩下的就是 分类预测了。KNN的思路是:把待 分类样本也对照词表(词表是统计训练集中所有出现过的词,然后去停止词、降维之后得到的)转换成向量,然后统计离它距离最近的K个点中,哪一类的训练 文本 ...
来自: 开发者社区 > 博客 作者: skyme 浏览:1328 回复:0
< 1 2 3 4 ... 1200 >
共有1200页 跳转至: GO

新品推荐

你可能感兴趣

热门推荐

企典文档内容 商标申请信息 商标注册信息 云计算服务器排行榜 大数据产品榜单
阿里云搜索结果产品模块_内容安全