文章 2017-04-26 来自:开发者社区

文本挖掘之特征选择(Python版)

  机器学习算法的空间、时间复杂度依赖于输入数据的规模,维度规约(Dimensionality reduction)则是一种被用于降低输入数据维数的方法。维度规约可以分为两类: 特征选择(feature selection),从原始的d维空间中,选择为我们提供信息最多的k个维(这k个维属于原始空间的子集) 特征提取(feature extraction),将原始的d维空间映射到k维空间中(新的.....

文章 2017-04-20 来自:开发者社区

Python实现简单文本分割工具

Python处理单个大文本文件时可能耗时较长而且多线程对单个文件的操作也要处理死锁等,对文件进行分割然后对分割后的文件进行多进程+多线程分别处理是一个不错的思路。 文 章分割可以按体积分割,也可以按行进行分割,一般情况下按行分割能保证数据的完整性,所以本脚本以按行分割实现,运行时,被分割文件和脚本位于同一目录, 运行后先输入被分割的文件全名,然后输入分割的数量,再输入输出的文件前缀就可以了!因为....

文章 2017-04-04 来自:开发者社区

Selenium2+python自动化49-判断文本(text_to_be_present_in_element)

前言 在做结果判断的时候,经常想判断某个元素中是否存在指定的文本,如登录后判断页面中是账号是否是该用户的用户名。 在前面的登录案例中,写了一个简单的方法,但不是公用的,在EC模块有个方法是可以专门用来判断元素中存在指定文本的:text_to_be_present_in_element。 另外一个差不多复方法判断元素的value值:text_to_be_present_in_element_val....

文章 2016-11-06 来自:开发者社区

【NLP】干货!Python NLTK结合stanford NLP工具包进行文本处理

干货!详述Python NLTK下如何使用stanford NLP工具包 作者:白宁超 2016年11月6日19:28:43 摘要:NLTK是由宾夕法尼亚大学计算机和信息科学使用python语言实现的一种自然语言工具包,其收集的大量公开数据集、模型上提供了全面、易用的接口,涵盖了分词、词性标注(Part-Of-Speech tag, POS-tag)、命名实体识别(Named Entity Re....

文章 2016-09-28 来自:开发者社区

python 文本聚类

读取excel excel 格式 excel.py # -*- coding: utf-8 -*- import xdrlib ,sys import xlrd import json def open_excel(file= '/home/lhy/data/data.xlsx'): try: data = xlrd.open_workbook(file) ...

文章 2016-08-28 来自:开发者社区

python读取文本数据写入到数据库及查询优化

文本数据格式 ip2int函数用于IP地址转化为整数 int2ip函数用于整数转化为IP地址 insert_row函数用于插入数据库记录 from __future__ import print_function import torndb def get_mysql_conn():     return&n...

文章 2016-08-06 来自:开发者社区

Python 文本转语音

文本转语音,一般会用在无障碍开发。下面介绍如何使用Python实现将文本文件转换成语音输出。 准备 使用Speech API 原理 示例代码 小总结 pyttsx方式 原理 示例代码 小总结 pyttsx深入研究 语音引擎工厂 引擎接口 元数据音调 更多测试 朗读文本 事件监听 打断发音 更换发音人声音 语速控制 音量控制 执行一个事件驱动循环 使用一个外部的驱动循环...

文章 2016-05-25 来自:开发者社区

Python模块探秘之smtplib,实现纯文本邮件的发送

今天学到了如何使用Python的smtplib库发送邮件,中间也是遇到了各种各样的错误和困难,还好都一一的解决了。下面来谈一谈我的这段经历。 配置你的邮箱 为什么要配置邮箱呢?具体要配置什么呢? 因为我们申请的一些免费邮箱都是默认不开启smtp/pop协议的。 SMTP是发邮件使用到的计算机网络中应用层协议中的一个;而POP则是收邮件时使用到的计算机网络中的应用层协议的其中一个。这都是...

文章 2016-05-16 来自:开发者社区

【转】python3 发邮件实例(包括:文本、html、图片、附件、SSL、群邮件)

特别留意群邮件方式,这是工作中用得多的。 附件,HTML,图片,都需要的。 文件形式的邮件 [python] view plain copy 1.#!/usr/bin/env python3 2.#coding: utf-8 3.import smtplib 4.from email.mime.text import MIMEText 5.from email....

文章 2016-05-13 来自:开发者社区

Python发送邮件的模块类(包括发送文本、HTML、带附件的邮件)

    使用Python发邮件,主要用到smtplib和email两个模块。#!/usr/bin/python # encoding=utf-8 # Filename: send_email.py from email.mime.image import MIMEImage from email.mime.multipart import MIMEMultipart from ...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

Python学习站

Python学习资料大全,包含Python编程学习、实战案例分享、开发者必知词条等内容。

+关注
相关镜像