文章 2024-08-13 来自:开发者社区

【机器学习】FFmpeg+Whisper:二阶段法视频理解(video-to-text)大模型实战

一、引言 上一篇对Whisper原理和实战进行了讲解,第7次拿到了热榜第一。今天,我们在Whisper的基础上,引入ffmpeg工具对视频的音频进行抽取,再使用Whisper将音频转为文本,通过二阶段法实现视频内容的理解。 二、FFmpeg工具介绍 2.1 什么是FFmpeg FFmpeg是一个开源的跨平台多媒体处理工具,它可以处理音频/视频数据,包括转码、转换格...

【机器学习】FFmpeg+Whisper:二阶段法视频理解(video-to-text)大模型实战
文章 2024-08-13 来自:开发者社区

【机器学习】Whisper:开源语音转文本(speech-to-text)大模型实战

一、引言 上一篇对ChatTTS文本转语音模型原理和实战进行了讲解,第6次拿到了热榜第一。今天,分享其对称功能(语音转文本)模型:Whisper。Whisper由OpenAI研发并开源,参数量最小39M,最大1550M,支持包含中文在内的多种语言。由于其低资源成本、优质的生存效果,被广泛应用于音乐识别、私信聊天、同声传译、人机交互等各种语音转文本场景,且商业化后价格不菲。今天免费分享给大...

【机器学习】Whisper:开源语音转文本(speech-to-text)大模型实战
文章 2024-08-13 来自:开发者社区

【机器学习】Qwen2大模型原理、训练及推理部署实战

一、引言 刚刚写完【机器学习】Qwen1.5-14B-Chat大模型训练与推理实战 ,阿里Qwen就推出了Qwen2,相较于Qwen1.5中0.5B、1.8B、4B、7B、14B、32B、72B、110B等8个Dense模型以及1个14B(A2.7B)MoE模型共计9个模型,Qwen2包含了0.5B、1.5B、7B、57B-A14B和72B共计5个尺寸模型。从尺寸上来讲,最关键的就是推出...

【机器学习】Qwen2大模型原理、训练及推理部署实战
文章 2024-08-13 来自:开发者社区

【机器学习】GLM4-9B-Chat大模型/GLM-4V-9B多模态大模型概述、原理及推理实战

一、引言 周一(6.3)写完【机器学习】Qwen1.5-14B-Chat大模型训练与推理实战 ,周二(6.4)首次拿下CSDN热榜第一名,周三(6.5)清华智谱宣布开源GLM-4-9B,今天周四(6.6)马不停蹄开始部署实验+码字。 自ZHIPU AI于2023年3月14日发布ChatGLM-6B,截止目前,该系列已经发布了4代:ChatGLM-6B、ChatGLM2-6B、Ch...

【机器学习】GLM4-9B-Chat大模型/GLM-4V-9B多模态大模型概述、原理及推理实战
文章 2024-08-13 来自:开发者社区

【机器学习】Qwen1.5-14B-Chat大模型训练与推理实战

一、引言 Qwen是阿里巴巴集团Qwen团队的大语言模型和多模态大模型系列。现在,大语言模型已升级到Qwen1.5,共计开源0.5B、1.8B、4B、7B、14B、32B、72B、110B共计8个Dense模型以及1个14B(A2.7B)的MoE模型。多模态大模型主要是Qwen-VL图像大模型以及Qwen-Audio语音大模型。为了保证文章质量,今天重点介绍Qwen大语言模型的原理、训练...

【机器学习】Qwen1.5-14B-Chat大模型训练与推理实战
文章 2024-08-12 来自:开发者社区

掌握机器学习:从基础到实战的全路径导览

机器学习,这个听起来有些高深莫测的名词,实际上正逐渐渗透到我们生活的每一个角落。从推荐系统到自动驾驶汽车,从语音识别到股市分析,机器学习的应用无处不在。但如何从一个完全的新手成长为能够独立完成项目的实战高手呢?本文将为你揭示这一转变的秘密。 首先,我们需要理解机器学习的本质。简单来说,机器学习就是让...

文章 2024-08-03 来自:开发者社区

决策树下的智慧果实:Python机器学习实战,轻松摘取数据洞察的果实

当我们置身于数据的海洋,如何从中提炼出有价值的洞察,仿佛是在茂密的森林中寻找那最甜美的果实。决策树,作为一种直观易懂且强大的机器学习算法,就像是那棵指引我们方向的智慧之树,让我们能够轻松摘取数据洞察的果实。今天,就让我们一起踏上这场Python机器学习实战之旅,探索如何使用决策树来挖掘数据的秘密。 ...

文章 2024-07-28 来自:开发者社区

探索机器学习:从基础到进阶的实战之旅

在当今这个数据驱动的时代,机器学习已经成为了连接大数据与智能决策之间的桥梁。无论是在金融风险评估、医疗诊断、还是在自动驾驶汽车中,机器学习都扮演着不可或缺的角色。然而,对于许多初学者而言,机器学习的世界似乎充满了复杂的数学公式和难以理解的概念。本文将带领读者踏上一段由浅入深的机器学习之旅,从基础理论到实际应用,一...

文章 2024-07-27 来自:开发者社区

实战派教学:掌握Scikit-learn,轻松实现数据分析与机器学习模型优化!

在数据科学领域,Scikit-learn以其高效、易用和全面的特点,成为了无数数据分析师和机器学习工程师的首选工具。它不仅简化了数据预处理、模型训练与评估的流程,还提供了丰富的算法库,助力我们轻松应对各种复杂的数据分析问题。今天,我将通过实战派教学的方式,带你一步步掌握Scikit-learn,实现...

文章 2024-07-26 来自:开发者社区

从菜鸟到大师:Scikit-learn库实战教程,模型训练、评估、选择一网打尽!

在数据科学与机器学习的广阔天地中,Scikit-learn无疑是一座照亮前行道路的灯塔。对于初学者而言,掌握Scikit-learn不仅是踏入这一领域的敲门砖,更是通往大师之路的必经之路。今天,我们将以问题解答的形式,带领大家从菜鸟逐步成长为能够熟练进行模型训练、评估与选择的大师。 问题一:如何开始使用Sciki...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云机器学习平台PAI

阿里云机器学习PAI(Platform of Artificial Intelligence)面向企业及开发者,提供轻量化、高性价比的云原生机器学习平台,涵盖PAI-iTAG智能标注平台、PAI-Designer(原Studio)可视化建模平台、PAI-DSW云原生交互式建模平台、PAI-DLC云原生AI基础平台、PAI-EAS云原生弹性推理服务平台,支持千亿特征、万亿样本规模加速训练,百余落地场景,全面提升工程效率。

+关注