阿里云,让 AI创新 触手可及

阿里云
AI创新 触手可及

依托大模型与云计算的协同发展,阿里云帮助企业和开发者以最快速度实现生成式和判别式的创新应用,拥抱 AI 时代。

依托大模型与云计算的协同发展,阿里云帮助企业和开发者以最快速度实现生成式和判别式的创新应用,拥抱 AI 时代。

常见的 AI 应用场景
  • 智能客服
  • 客服质检
  • 生成商品图
  • 商品信息提取

智能客服

传统客服系统往往依赖于预设脚本和有限的知识库,难以灵活应对复杂或新颖的问题。而基于 RAG(Retrieval-Augmented Generation)的智能客服能更准确地理解用户意图和诉求,即使面对复杂的语境和多变的表达方式也能有不错的表现,帮助提升客户体验。

技术实现参考

建立索引阶段

为了让大模型能回答某个私有领域的问题,您需要将私有知识文档通过以下步骤,存储到向量数据库中:


1. 从 PDF、PPT、HTML 等多种格式的文件中解析出文档语料。

2. 为了便于检索和组装提示词,您需要将文档分割成小的切片(chunk)。

3. 最后您需要将文档 chunk 向量化,再存入到向量数据库。

检索生成阶段

1. 收到用户问题后,首先将用户问题向量化。

2. 根据向量化的用户问题检索相关的文档 chunk,并进行相关性重排(rerank)。

3. 将用户问题相关的文档 chunk 组装到提示词中,让大模型生成答案。


阿里云的大模型平台服务百炼可以帮助您 0 代码完成一个 RAG 问答机器人的基础能力构建,您只需关注业务流程对接。如果您希望对 RAG 系统有更多的细节控制做优化,也可以使用借助 LlamaIndex 等开源框架来构建 RAG 系统。

参考架构图

智能客服-参考实现

客服质检

在客服质检领域,传统的质检方法主要依赖人工审核录音或聊天记录,通常因为成本只能实现抽检,同时还容易受到主观判断影响。而引入大模型则可以实现统一、规模化的客服质检,帮助企业不断改进客服质量,提高客户满意度。

技术实现参考

借助大模型来构建大规模的自动化客服质检,主要分为两个阶段:

数据收集阶段

1. 为了能大规模检测客服情况,您需要先将客户和客服的通话录音文件保存下来。

2. 在保存通话录音文件的同时,您也可以借助阿里云的 智能语音交互 - 语音识别 API 将通话记录以文字形式保存下来。

数据分析阶段

1. 借助 通义千问 Audio 大模型 API,您可以在识别通话记录中的文字的同时,识别双方沟通的语气、情绪等信息。

2. 你也可以借助 通义千问大语言模型 对文字记录做进一步更详尽的分析,如分析客服回答的正确性和可改进空间。

参考架构图

客服质检-参考实现

生成商品图

为了吸引消费者,提供精美的商品主图、商品海报以及商品模特图显得尤为重要。然而,传统的商品图制作通常需要专业的设计师、摄影师和后期编辑团队,耗时耗力,成本也高,对中小型商家尤为不利。大模型可以帮助解决这一问题。

技术实现参考

通义万相提供虚拟模特、鞋靴模特、图像背景生成等功能,可以用于生成精美的模特图或商品主图。操作过程如下:


1. 提供原图


  •     ◦ 基准图:提供一张真人图,作为生成模特图的基础。或者提供一张商品原图,作为生成商品主图的基础。
  •     ◦ 背景图:如果有想要让大模型参考的背景图,也可以提供。

2. 提供提示词


    例如,提供描述图像背景环境和模特全身形象的提示词。


3. 设置参数


    可以按需设置图片的长宽比或大小、图片风格、图片数量、随机性等参数。

参考架构图

生成商品图-参考实现

商品信息提取

在电商场景,如果商品库中原有的标记信息缺少某一维度后续要补充,通常需要投入大量人力来标注。借助视觉理解大模型,可以更低成本的快速解决这一问题。

技术实现参考

您只需要设计好提示词,就可以完成从商品图标和描述中提取结构化信息的任务。


参考架构图

商品信息提取-参考实现
模型选择,总有一款适合您
  • 文本生成类

    文本生成类

    通用对话:推荐通义千问系列大模型,适用于智能客服、撰写文稿、文本润色、总结摘要等场景。此外大模型服务平台百炼 上还提供了其他开源大模型的推理服务,比如您可以选择使用 Llama 3 来更好地应对英文场景,也可以根据需要选择 ChatGLM零一万物等其他模型。

    超长文档解读:推荐 Qwen-Long 月之暗面-Kimi 大模型,适用于超长文档或多文档的总结和分析。

    法律领域:推荐通义法睿 ,适用于法律咨询、案例分析和法规解读等。

  • 图像生成与图像理解类

    图像生成与图像理解类

    文生图:推荐通义万相StableDiffusion,适用于海报生成、艺术字生成等。

    图生文:推荐Qwen VL,不仅能进行OCR(图片文字识别),还能进一步总结和推理,例如从商品照片中提取属性,根据习题图进行解题等。

    图生图、图文生图:推荐通义万相,可用于生成证件照、模特图、各种风格(动漫、国风、二次元等)人像图,也可用于抠图、生成背景、更改图片元素等。

  • 语音和视频类

    语音和视频类

    语音合成(文本转语音):推荐 CosyVoice Sambert ,适用于智能语音客服、有声读物、车载导航、教育辅导等场景。

    语音识别(语音转文本):推荐通义听悟 采用的 Paraformer ,适用于实时会议记录、实时直播字幕、电话客服等场景。

    视频合成:数字人,推荐悦动人像EMO,可基于人物肖像和语音,生成数字人视频; 舞蹈视频,推荐舞动人像 AnimateAnyone,可基于人物图像和预设动作,生成舞蹈视频。您可以在百炼的模型广场中体验。

经典的 AI 落地范式,释放无限商业潜能
  • 01开始在你的模型中引入 AI

    建议您优先了解阿里云提供的开箱即用、按量计费的模型 API。这些 API 的背后是成熟的预训练模型,足以应对大部分业务场景。

  • 02部署您的独享推理服务

    当您需要远高于模型 API 支持的调用频率上限或不希望将数据传输给API 背后的服务,您可以部署独享的推理服务来应对这些场景。

  • 03面向您的业务定制 AI 模型

    当您使用的模型API成本过高、推理速度或业务表现不佳,您可以训练一个小模型来降本增速,提升模型在业务领域内的表现。

生成式 AI

生成式AI(Generative AI)能够基于学习到的数据模式自主生成新的数据实例,创造之前未曾存在的内容,如图片、音频、文本或视频等。

判别式 AI

判别式AI(Discriminative AI)专注于区分或判别不同类别的数据,目的是从给定的输入数据中预测或分类输出结果。判别式AI不关心数据的生成过程,而是学习如何将输入数据映射到一个或多个输出标签上。

  • 开始在模型中引入AI

    判别式 AI 的应用非常丰富,例如内容审核分割抠图文字识别等,您也可以点击
    查看更多
  • 部署独享推理服务

    判别式 AI 的模型部署选型策略可以参照生成式 AI,需注意百炼暂不支持判别式 AI 模型部署。
  • 定制 AI 模型

    判别式 AI 的模型训练选型策略可以参照生成式 AI,需注意百炼暂不支持判别式 AI 模型训练。

建议您优先了解阿里云提供的开箱即用、按量计费的模型 API。这些 API 的背后是成熟的预训练模型,足以应对大部分业务场景。

判别式 AI

开始在模型中引入AI

判别式AI(Discriminative AI)专注于区分或判别不同类别的数据,目的是从给定的输入数据中预测或分类输出结果。判别式AI不关心数据的生成过程,而是学习如何将输入数据映射到一个或多个输出标签上。

判别式 AI 的应用非常丰富,例如内容审核分割抠图文字识别等,您也可以点击
查看更多
服务全球海量客户,加速万千企业AI转型
  • 朗新科技
  • 海艺AI
  • 闪剪智能
  • 笔灵AI

朗新科技

朗新集团初创于1996年,总部位于江苏无锡,并在各地设有8大研发中心,业务和分支机构遍及全国31个省区及海外10多个国家及地区。朗新接入阿里云大模型服务平台百炼,建设电力行业专属模型,通过通义千问电力行业知识政策问答、电力账单解读、数据问答等场景中实现更智能化的用户服务新模式。

朗新科技

海艺AI

海艺 AI 是一家在 AIGC 垂直领域的行业先锋,专注于生成式AI的研发和应用,核心产品 SeaArt 是一款高效易用且用户友好的人工智能绘画工具。阿里云在单点推理性能上,为海艺 AI 提供了神行工具包(DeepGPU),帮助海艺 AI 的推理耗时提升至 3.95s,模型切换无感,LoRA 切换无感,大幅提升了 GPU 实例的负载性能。

海艺AI

闪剪智能

闪剪智能致力于为全球企业和用户提供简单、易用的视频创作软件,旗下有飞推、字说、Fixest、闪剪、闪剪智播、团队快剪等产品。通过接入通义AnimateAnyone API,结合数字人场景图生视频的玩法,让视频玩法更有个性更生动,为客户产品拉新、促活、留存等带来巨大的价值。接入通义AnimateAnyone API,结合数字人场景图生视频的玩法,让视频玩法更有个性更生动,为客户产品拉新、促活、留存等带来巨大的价值。

闪剪智能

笔灵AI

笔灵AI面向专业写作领域提供AI写作工具和多场景、全覆盖的AI创作型内容生成能力。通过接入阿里云的大模型技术全方位覆盖学术写作、商业文案、文书剧本等各类写作场景,大大提升创作效率。通过大模型技术全方位覆盖学术写作、商业文案、文书剧本等各类写作场景提效。

笔灵AI
连接全域开发者,掌握 AI 最新资讯