文章 2022-02-16 来自:开发者社区

搜索引擎——用户搜索意图的理解及其难点解析,本质是利用机器学习用户的意图分类

用户搜索意图的理解及其难点解析 搜索引擎涉及的技术非常的繁复,既有工程架构方面的,又有算法策略方面的。综合来讲,一个搜索引擎的技术构建主要包含三大部分: 对 query 的理解 对内容(文档)的理解 对 query 和内容(文档)的匹配和排序 (点击放大图像)   我们今天主要探讨其中的 Query Understanding,即对 query 的理解。对 query 的理解, 换句话说...

文章 2022-02-16 来自:开发者社区

你的机器学习模型为什么会出错?奉上四大原因解析及五条改进措施

对开发者来说,目前有一系列的机器学习模型可供选择。雷锋网(公众号:雷锋网)了解,可以用线性回归模型预测具体的数值,用逻辑回归模型对不同的运算结果进行归类,以及用神经网络模型处理非线性的问题等等。 不论哪一种,当模型选定之后,下一步就是利用大量的现有数据对相关的机器学习算法进行训练,探究既定的输入数据和预想的输出结果之间的内在关系。但这时可能会出现一种情况:训练结果能够成功应用于原始输入和输出,可....

你的机器学习模型为什么会出错?奉上四大原因解析及五条改进措施
文章 2022-02-16 来自:开发者社区

纽约大学陈溪解析机器学习和智能决策:从一个高峰到另一个高峰还有多远?

6月24日下午,钛媒体和杉数科技主办的2017 AI 大师论坛在京举行,论坛邀请了五位算法优化、机器学习领域的顶尖教授、学者出席并发表学术演讲。论坛上,五位科学家围绕算法、数据、应用,结合各自的研究领域,畅谈了现状和未来的发展。纽约大学商学院助理教授陈溪参加此次论坛并发表题为“从机器学习到智能决策“的演讲。 雷锋网(公众号:雷锋网)了解到,陈溪博士目前是纽约大学商学院助理教授,Carnegie.....

纽约大学陈溪解析机器学习和智能决策:从一个高峰到另一个高峰还有多远?
文章 2022-02-16 来自:开发者社区

清华机器学习科学家李建:如何用深度学习来解析时空大数据?

雷锋网AI科技评论按:6月24日下午,钛媒体和杉数科技主办的2017 AI 大师论坛在京举行,论坛邀请了五位算法优化、机器学习领域的顶尖教授、学者出席并发表学术演讲,雷锋网(公众号:雷锋网)记者也对论坛进行了跟踪报道。本篇内容根据机器学习领域专家李建的论坛分享实录整理而成。 李建,清华大学交叉信息研究院助理教授、杉数科技科学家,美国马里兰大学博士、国内机器学习领域最顶尖的前沿科学家之一,国际学术....

清华机器学习科学家李建:如何用深度学习来解析时空大数据?
文章 2022-02-16 来自:开发者社区

Pedro Domingos深度解析机器学习五大流派中主算法精髓

本文联合编译:Blake, 高斐 Pedro Domingos是华盛顿大学计算机科学与工程学教授,也是国际机器学习协会的联合创始人之一。他曾在IST Lisbon获得电子工程和计算科学的硕士学位,在加州大学Irvine分校获得信息与计算科学博士学位。而后在IST作为助理教授工作了两年,于1999年加入华盛顿大学。他还是SIGKDD创新奖获得者(数据科学领域中最高奖项),也是AAAI Fello.....

Pedro Domingos深度解析机器学习五大流派中主算法精髓
文章 2022-02-14 来自:开发者社区

阿里云天池大赛赛题解析——机器学习篇-赛题一(7)

2.2.4 可视化数据分布       下面以可视化方式对数据特征、数据分布等进行探索分析。1. 箱形图       首先绘制训练集中特征变量V0 的箱形图:fig = plt.figure(figsize=(4, 6)) # 指定绘图对象的宽度和高度sns.boxplot(train_data['V0'],orient="v", wi....

阿里云天池大赛赛题解析——机器学习篇-赛题一(7)
文章 2022-02-14 来自:开发者社区

阿里云天池大赛赛题解析——机器学习篇-赛题一(6)

2.2 赛题数据探索2.2.1 导入工具包       先要导入一些Python 工具包,用于数据计算和可视化显示。import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as snsfrom scipy import statsimport warning....

阿里云天池大赛赛题解析——机器学习篇-赛题一(6)
文章 2022-02-14 来自:开发者社区

阿里云天池大赛赛题解析——机器学习篇-赛题一(5)

2.1.5 变量转换1. 变量转换的目的       在使用直方图、核密度估计等工具对特征分布进行分析的过程中,我们可能会发现一些变量的取值分布不平均,这将会极大影响估计。为此,我们需要对变量的取值区间等进行转换,使其分布落在合理的区间内。       如图1-2-11 所示,经过对数变换减轻了数据大量聚集在左侧的情况,其分布也更加趋于....

阿里云天池大赛赛题解析——机器学习篇-赛题一(5)
文章 2022-02-14 来自:开发者社区

阿里云天池大赛赛题解析——机器学习篇-赛题一(4)

2.1.3 缺失值处理1. 缺失值的产生原因和分类       缺失值的产生原因多种多样,主要分为机械原因和人为原因。机械原因是由机械导致的数据缺失,比如数据存储的失败、存储器损坏、机械故障导致某段时间的数据未能收集(对于定时数据采集而言)。人为原因是由人的主观失误、历史局限或有意隐瞒造成的数据缺失。比如,在市场调查中被访人拒绝透露相关问题的答案,或者回答的问题是无....

阿里云天池大赛赛题解析——机器学习篇-赛题一(4)
文章 2022-02-14 来自:开发者社区

阿里云天池大赛赛题解析——机器学习篇-赛题一(3)

2 数 据 探 索2.1 理论知识2.1.1 变量识别       变量识别就是对数据从变量类型、数据类型等方面进行分析。举个例子,数据如表1-2-1所示:表1-2-1       我们可以从以下方面对其进行变量识别:1. 输入变量与输出变量       输入变量(也称为“predictor”或“特征”)有....

阿里云天池大赛赛题解析——机器学习篇-赛题一(3)

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云机器学习平台PAI

阿里云机器学习PAI(Platform of Artificial Intelligence)面向企业及开发者,提供轻量化、高性价比的云原生机器学习平台,涵盖PAI-iTAG智能标注平台、PAI-Designer(原Studio)可视化建模平台、PAI-DSW云原生交互式建模平台、PAI-DLC云原生AI基础平台、PAI-EAS云原生弹性推理服务平台,支持千亿特征、万亿样本规模加速训练,百余落地场景,全面提升工程效率。

+关注