文章 2025-02-22 来自:开发者社区

Crawl4LLM:你的模型还在吃垃圾数据?CMU博士开源AI爬虫,自动筛选高价值网页,数据抓取质量飙升300%

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术! AI 在线答疑 -> 智能检索历史文章和开源项目 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 「数据采集进入智能时代:首个为LLM定制的爬虫系统开源了!」 大家好,我是蚝油菜花。如果说传统爬虫是「蝗虫过境...

Crawl4LLM:你的模型还在吃垃圾数据?CMU博士开源AI爬虫,自动筛选高价值网页,数据抓取质量飙升300%
文章 2023-05-16 来自:开发者社区

CMU专家团队创业,OtterTune让数据库插上AI的翅膀

近日,人工智能驱动的数据库管理初创公司OtterTune宣布完成了1200万美元A轮融资,本轮融资由Intel Capital和Race Capital领投,并得到了Accel的跟投。OtterTune成立于2021年,主要产品是通过使用机器学习来分析和优化数据库系统中的数百个配置设置,从而使其管理更加高效和经济。这个产品本身是基于几位创始人在卡内基梅隆计算机科学学院(CMU)的同名研究项目而来....

CMU专家团队创业,OtterTune让数据库插上AI的翅膀
文章 2023-05-15 来自:开发者社区

CMU创建一个开源的AI代码生成模型,C语言表现优于Codex

CMU 对现有开源和未开源的 AI 代码生成模型进行了全面深入的系统性评估,并分析了它们在 C、C++、Python 等 12 中不同编程语言中的代码自动完成表现。最近,语言模型(Language Model, LM)在建模编程语言源代码方面展现出了令人印象深刻的性能。这些模型擅长代码自动生成以及从自然语言描述中生成代码等下游任务。当前 SOTA 大规模语言代码模型(如 Austin et al....

CMU创建一个开源的AI代码生成模型,C语言表现优于Codex
文章 2022-04-13 来自:开发者社区

CMU德扑AI真是大奖拿到手软,Noam Brown获AAAI/ACM SIGAI博士论文奖

AAAI 2022 大会即将落下帷幕,目前所有奖项均已公布。近日,第 36 届 AAAI 人工智能会议正在线上召开。在公布了杰出论文奖、杰出学生论文奖、Distinguished 论文奖、最佳演示奖等多项论文奖之后,AAAI 官方又公布了新一届的 AAAI/ACM SIGAI 博士论文奖、经典论文奖、Robert S. Engelmore 纪念演讲奖和杰出服务奖等多个奖项。德扑 AI 作者 No....

CMU德扑AI真是大奖拿到手软,Noam Brown获AAAI/ACM SIGAI博士论文奖
文章 2022-02-17 来自:开发者社区

Siri不够聪明,再给它一双眼吧!CMU与苹果合作,摄像头让AI助手更精确

你也向往科幻片里的语音助手吗?比如托尼家的Jarvis、Friday,引得众多漫威迷的羡慕,它们不止是语音助手,简直可以说是智能管家!从生活起居到组装钢铁战衣再到研究敌人装备,可以说是无所不能。再看看自己手机里的语音助手,只能通过它调用一些基本功能,更不可能跳出手机跟主人在现实中互动。然而,近期卡内基梅隆大学人机交互研究所的研究人员设计了一款名叫“WorldGaze”的IOS程序,似乎可以将手机....

文章 2022-02-17 来自:开发者社区

“Google只认钱!机器学习20年没进步”,CMU学者炮轰AI第一大厂

“机器学习是一个了不起的工程成就。但这不是科学,远远不是。” “这技术现在所做的事情,跟1990年没什么差别,顶多就是规模更大,但并没有给我们带来比20年前更深刻的见解。” “Google比很多大学厉害,唯一的原因是他们的每个研究人员,能够比别人多雇佣十倍以上的研究生。” “在Google,一切都是商业计划。” “你会身处机器学习的最前沿,但,这只是一个工程学科。所有的基本目标都是大公司设定的,....

文章 2022-02-16 来自:开发者社区

独家 | 在CMU对话德扑AI团队:解密1+2技术架构,不攻反而不败

本文来自AI新媒体量子位(QbitAI) 放下想赢的执念后,AI赌神再没输给人类。 这个AI赌神拉丁名Libratus,中文名冷扑大师。今年1月,它在美国战胜四位顶级人类德扑玩家,赢得176万美元(虚拟货币)。 如今冷扑大师应创新工场李开复的邀请,来到国内,将与6位龙之队高手展开六天鏖战。 为此几天之前,量子位前往美国宾州匹兹堡卡内基梅隆大学(CMU),独家对话Libratus的两位创造者:T.....

独家 | 在CMU对话德扑AI团队:解密1+2技术架构,不攻反而不败
文章 2022-02-16 来自:开发者社区

安卓用户如何保护隐私?CMU搞了一个AI看门狗

本文来自AI新媒体量子位(QbitAI) 几乎所有的移动端App都要在某些方面收集、使用乃至共享你的私人数据。你可能需要不断地调整自己的隐私政策和权限设置才能更好地保护自己的隐私——但这并不是件容易的事,特别是当你自己也被那些复杂的选项搞糊涂,不知道如何安排才最适合自己的时候。 现在,一款新的App或许能帮上忙。 这款名为“隐私助手”的App由卡内基梅隆大学的研究者开发,利用机器学习技术让...

安卓用户如何保护隐私?CMU搞了一个AI看门狗
文章 2022-02-16 来自:开发者社区

只有音频没指纹,能抓对人吗?CMU音频分析AI说没问题

本文来自AI新媒体量子位(QbitAI) 2014年有恶作剧的人不停打给美国海岸警卫队报假警。那些人以为,没有指纹和DNA,只是个很短的电话录音,警方根本来不及找出打电话的位置。他们是不可能会被抓的。 然鹅,现在有了AI,音频分析技术已经到了前所未有的高度。 Rita Singh,是这一领域的顶尖科学家,工作于卡内基·梅隆大学的语言技术研究所。通过电话录音,她们团队可以准确地预测出打电话人的...

只有音频没指纹,能抓对人吗?CMU音频分析AI说没问题
文章 2022-02-16 来自:开发者社区

CMU计算机学院院长、谷歌工程VP:未来五年看好AI理解情绪和情感

Andrew Moore于2000年成为卡内基梅隆大学(CMU)的终身教授。2006年,Moore加入谷歌,负责建设一个新的工程团队,作为工程副总裁,Andrew负责公司零售业务部门Google shopping。Moore于2014年回到CMU担任计算机科学学院院长。Moore是计算机科学和人工智能领域最有影响力的人之一。 在福布斯的AI系列采访中,Moore发表了对不断演化的人工智能领域的见....

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

{"cardStyle":"activityCardStyle","productCardInfo":{"productTitle":"","productDescription":"","productContentLink":"","isDisplayProductIcon":true,"isOfficialLogo":false},"activityCardInfo":{"activityTitle":"AI 编码","activityDescription":"百万 Qwen-coder 大模型 tokens 免费体验,灵码79元起,加速 AI 应用落地 ","cardContentBackgroundMode":"LightMode","activityContentBackgroundImageLink":"","activityCardBottomInfoSelect":"activityPromotionInfoBlock","activityButton1":{"activityButtonText":"查看详情","activityButtonLink":"https://www.aliyun.com/benefit/scene/coding"},"activityButton2":{"activityButtonText":"立即体验","activityButtonLink":"https://bailian.console.aliyun.com/?spm=5176.30202035.J_VanPN1KXIVRyCVhZMwQ6t.6.1b791e71pokqL0&tab=model#/efm/model_experience_center/text?currentTab=textChat&modelId=qwen3-coder-plus"},"activityButton3":{"activityButtonText":"立即购买","activityButtonLink":"https://www.aliyun.com/benefit/scene/coding#J_1"}}}
AI 编码
百万 Qwen-coder 大模型 tokens 免费体验,灵码79元起,加速 AI 应用落地

阿里云机器学习平台PAI

阿里云机器学习PAI(Platform of Artificial Intelligence)面向企业及开发者,提供轻量化、高性价比的云原生机器学习平台,涵盖PAI-iTAG智能标注平台、PAI-Designer(原Studio)可视化建模平台、PAI-DSW云原生交互式建模平台、PAI-DLC云原生AI基础平台、PAI-EAS云原生弹性推理服务平台,支持千亿特征、万亿样本规模加速训练,百余落地场景,全面提升工程效率。

+关注