阿里云文档 2024-11-04

基于ModelScope模型库和GPU实例闲置计费功能低成本构建Google Gemma服务

Google在2024年02月21日正式推出了首个开源模型族Gemma,并同时上架了2b和7b两个版本。您可以使用函数计算的GPU实例以及函数计算的闲置模式低成本快速部署Gemma模型服务。

文章 2022-02-15 来自:开发者社区

Codis作者首度揭秘TiKV事务模型,Google Spanner开源实现!

大家好,我是 PingCAP 的 CTO 兼联合创始人,黄东旭。可能很多朋友认识我是因为之前做的一个开源的分布式 Redis 方案 Codis,但我今天的话题将从缓存转移到分布式数据库之上,给大家介绍一下我们在 TiKV 上的一些工作和想法。   随着时代的发展,应用和数据的规模越来越大。然而在这个一切都可以水平扩展的时代,你会发现,大多数应用的最下层的关系型数据库,竟然难以找到一个优雅...

Codis作者首度揭秘TiKV事务模型,Google Spanner开源实现!
文章 2022-02-14 来自:开发者社区

深度学习变天,模型越做越小!Google发布FLAN,模型参数少400亿,性能超越GPT-3

像OpenAI的GPT-3这样的语言模型,近年来层出不穷,企业也更愿意投入来研究如何利用AI技术和数据来学习文本生成等。 而GPT-3也不负众望,它及它的后继模型能够像人一样来写电子邮件、文本摘要、甚至写各种语言的代码。但它也有一个致命缺点,那就是训练时间长,需要海量的训练数据,并且生成的模型参数量极大,需要高性能运算设备才能发挥全部性能。目前的研究也在朝着更大的语言模型、更多任务的数....

深度学习变天,模型越做越小!Google发布FLAN,模型参数少400亿,性能超越GPT-3
文章 2022-02-14 来自:开发者社区

一行预处理代码,让你的CV模型更强!Google research教你用可学习的resizer

神经网络要求输入的数据的大小在每个mini-batch中是统一的,所以在做视觉任务的时候,一个重要的预处理步骤就是image resize,把它们调整到统一的大小进行训练。 通常缩放(image down-scaling)后的图像不会太大,因为如果分辨率过高会导致训练过程中模型占用的内存急剧上升,并且过高的分辨率也会导致训练速度和推理速度过慢。虽然近年来GPU的性能逐渐提升,但标准的输....

一行预处理代码,让你的CV模型更强!Google research教你用可学习的resizer
文章 2022-02-14 来自:开发者社区

比seq2seq模型快90倍!Google推出全新文本编辑模型FELIX

序列到序列(seq2seq)模型已经成为处理自然语言生成任务的有效方法,其应用范围从机器翻译到单语言生成任务,如摘要、句子融合、文本简化和机器翻译的译后编辑。 然而,对许多单语任务来说,这些模型是一个次优选择,因为所需的输出文本往往代表一个输入文本的轻微重写。在完成这些任务时,seq2seq模型速度较慢,因为它们一次生成一个输出单词(即自回归) ,而且浪费,因为大多数输入标记只是复制到....

比seq2seq模型快90倍!Google推出全新文本编辑模型FELIX

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。