阿里云文档 2025-03-30

文字识别模型qwen-vl-ocr如何使用

通义千问OCR是文字提取专有模型,专注于文档、表格、试题、手写体文字等类型图像的文字提取能力。它能够识别多种文字,目前支持的语言有:汉语、英语、法语、日语、韩语、德语、俄语、意大利语、越南语、阿拉伯语。

文章 2025-02-22 来自:开发者社区

谷歌放大招!多模态模型PaliGemma 2 Mix上线:通吃问答+OCR+检测等多项视觉理解任务,28B参数无需额外加载模型

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术! AI 在线答疑 -> 智能检索历史文章和开源项目 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 ️ 「还在为多模态任务抓狂?谷歌PaliGemma 2 Mix出世:一个模型搞定检测+OCR+问答,准确率碾压专...

谷歌放大招!多模态模型PaliGemma 2 Mix上线:通吃问答+OCR+检测等多项视觉理解任务,28B参数无需额外加载模型
文章 2024-09-26 来自:开发者社区

阶跃星辰开源GOT-OCR2.0:统一端到端模型,魔搭一站式推理微调最佳实践来啦!

引言 OCR技术在将现实世界中的文本信息转换为可编辑、可搜索的数据方面发挥着至关重要的作用,它桥接着物理世界与数字世界,是实现信息自动化处理的关键技术。作为AI-1.0时代的技术成果,OCR技术已经相对成熟,被广泛应用于文档管理、自动驾驶、智能监控等多个领域。 然而,随着技术的发展和应用需求的提升,OCR 1.0技术逐渐展现出局限性。传统OCR系统在处理复杂场景、模糊图...

阶跃星辰开源GOT-OCR2.0:统一端到端模型,魔搭一站式推理微调最佳实践来啦!
文章 2024-08-15 来自:开发者社区

OCR -- 文本检测 - 训练DB文字检测模型

PaddleOCR提供DB文本检测算法,支持MobileNetV3、ResNet50_vd两种骨干网络,可以根据需要选择相应的配置文件,启动训练。 本节以icdar15数据集、MobileNetV3作为骨干网络的DB检测模型(即超轻量模型使用的配置)为例,介绍如何完成PaddleOCR中文字检测模型的训练、评估与测试。 3.1 数据准备 本次实验选取了场景文本检测和识别(...

OCR -- 文本检测 - 训练DB文字检测模型
问答 2024-07-31 来自:开发者社区

文字识别OCR的24978模型在线体验报错如何解决?

文字识别OCR的24978模型在线体验报错如何解决?API调用报:10001,参数出错

文章 2024-07-29 来自:开发者社区

印刷文字识别使用问题之模型已经生成,如何追加样本量

问题一:文字识别OCR调用出来的结果和在线的结果不一样,怎么回事? 文字识别OCR调用出来的结果和在线的结果不一样,怎么回事? 参考答案: 你选取的区域就是大片的 返回内容就会是你框选的区域。 ...

印刷文字识别使用问题之模型已经生成,如何追加样本量
文章 2024-07-29 来自:开发者社区

印刷文字识别使用问题之如何实让其他人标注,自己创建模型

问题一:在文字识别OCR我需要别人帮我标注,然后我这来创建模型,怎么做? 在文字识别OCR我需要别人帮我标注,然后我这来创建模型,怎么做? 参考答案: 建议你可以先复制标注任务,或者重新创建一下标注任务 关于本问题的更多回答可点击进行查看: https://developer.aliyun.com/ask/61235...

印刷文字识别使用问题之如何实让其他人标注,自己创建模型
问答 2024-07-17 来自:开发者社区

文字识别OCR模型ID:24711训练报错,怎么解决?

文字识别OCR模型ID:24711训练报错,怎么解决?这个列在标注的时候有很多份都无法正确识别内容

问答 2024-07-11 来自:开发者社区

我在训练身份证反面的文字识别OCR模型,训练出来的模型为什么只能识别横向拍的照片?竖着拍的识别不出来

我在训练身份证反面的文字识别OCR模型,标注时如果只标注kv区域,训练出来的模型为什么只能识别横向拍的照片?竖着拍的识别不出来。后面重新标注加上了目标区域,就都识别不出来了怎么回事?

问答 2024-07-10 来自:开发者社区

文字识别OCR需要识别五线谱的话,有没有对应的模型?

文字识别OCR需要识别五线谱的话,有没有对应的模型?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐