阿里云文档 2025-02-05

文字识别模型qwen-vl-ocr如何使用

通义千问OCR是文字提取专有模型,专注于文档、表格、试题、手写体文字等类型图像的文字提取能力。它能够识别多种文字,目前支持的语言有:汉语、英语、法语、日语、韩语、德语、俄语、意大利语、越南语、阿拉伯语。

文章 2025-01-21 来自:开发者社区

moonshot-v1-vision-preview:月之暗面Kimi推出多模态视觉理解模型,支持图像识别、OCR文字识别、数据提取

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日分享大模型与 AI 领域的最新开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术,欢迎关注我哦! 微信公众号|搜一搜:蚝油菜花 快速阅读 功能:支持图像识别、OCR文字识别、图像数据提取与分析。 技术:基于API调用,支持多轮对话、流式输出等特性。 应用:适用于内容审核、文档处理、医学影像分...

moonshot-v1-vision-preview:月之暗面Kimi推出多模态视觉理解模型,支持图像识别、OCR文字识别、数据提取
文章 2024-12-16 来自:开发者社区

Kimi 上线视觉思考模型,K1 系列强化学习模型正式开放,无需借助外部 OCR 处理图像与文本进行思考并回答

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日跟你分享最新的 AI 资讯和开源应用,也会不定期分享自己的想法和开源实例,欢迎关注我哦! 微信公众号|搜一搜:蚝油菜花 快速阅读 功能:k1视觉思考模型支持端到端图像理解和推理思维链展示。 技术:基于预训练和强化学习后训练,优化字符识别能力,表现全球领先。 应用:广泛应用于教育、学术研究、图像识别等领域...

Kimi 上线视觉思考模型,K1 系列强化学习模型正式开放,无需借助外部 OCR 处理图像与文本进行思考并回答
阿里云文档 2024-05-28

调用CreateModelAsyncPredict模型异步预测API

文档自学习创建异步预测任务接口。

阿里云文档 2024-05-28

调用GetModelAsyncPredict获取模型异步预测结果API

模型预测分为三种类型:长文档信息抽取、单票据信息抽取、表格信息抽取。

文章 2022-04-09 来自:开发者社区

阿里云机器学习平台PAI-AI行业插件-视觉模型平台OCR模型训练使用简明教程

1、创建实例2、数据准备1.创建数据集2.标注3.创建任务4.开始训练5.训练完成

阿里云机器学习平台PAI-AI行业插件-视觉模型平台OCR模型训练使用简明教程

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐