文章 2023-10-17 来自:开发者社区

[笔记]Python计算机视觉编程《一》 基本的图像操作和处理(一)

前言今天,图像和视频无处不在,在线照片分享网站和社交网络上的图像有数十亿之多。几乎对于任意可能的查询图像,搜索引擎都会给用户返回检索的图像。实际上,几乎所有手机和计算机都有内置的摄像头,所以在人们的设备中,有几 G 的图像和视频是一件很寻常的事。计算机视觉就是用计算机编程,并设计算法来理解在这些图像中有什么。计算机视觉的有力应用有图像搜索、机器人导航、医学图像分析、照片管理等。本书旨在为计算机视....

[笔记]Python计算机视觉编程《一》 基本的图像操作和处理(一)
文章 2023-08-16 来自:开发者社区

【计算机视觉 | 图像分类】arxiv 计算机视觉关于图像分类的学术速递(8 月 11 日论文合集)

一、分类|识别相关(8篇) 1.1 Hard No-Box Adversarial Attack on Skeleton-Based Human Action Recognition with Skeleton-Motion-Informed Gradient 基于骨架运动信息梯度的基于骨架的人体动作识别的硬非盒对抗攻击https://arxiv.org/abs/2308.05681最近...

【计算机视觉 | 图像分类】arxiv 计算机视觉关于图像分类的学术速递(8 月 11 日论文合集)
文章 2023-08-03 来自:开发者社区

计算机视觉实战(十)图像特征harris角点检测(附完整代码)

 角点检测的基本原理就是:在角点处画一个框,当这个框无论上下左右移动时像素点变化迅速。因为在一块平滑的区域,没有什么剧烈变化,如下图所示:  目前的角点检测算法可归纳为3类:基于灰度图像的角点检测;基于二值图像的角点检测;基于轮廓曲线的角点检测。  基本原理:依据lambad 1,lambad 2的大小不一样,我们可以判断是否是边界,或者角点。那是否有这样一个值来计算角点呢,而不是看两个lamb....

计算机视觉实战(十)图像特征harris角点检测(附完整代码)
文章 2023-08-03 来自:开发者社区

计算机视觉实战(七)图像金字塔与轮廓检测

图像金字塔  图像金字塔是图像多尺度表达的一种,是一种以多分辨率来解释图像的有效但概念简单的结构。一幅图像的金字塔是一系列以金字塔形状排列的分辨率逐步降低,且来源于同一张原始图的图像集合。其通过梯次向下采样获得,直到达到某个终止条件才停止采样。我们将一层一层的图像比喻成金字塔,层级越高,则图像越小,分辨率越低。  图像金字塔如下图所示:  那我们为什么要做图像金字塔呢?这就是因为改变像素大小有时....

计算机视觉实战(七)图像金字塔与轮廓检测
文章 2023-08-03 来自:开发者社区

计算机视觉实战(五)图像梯度计算

  这一节我们来看一下计算图像边缘的一些算子,提取图像边缘的信息有利于之后对图像中的物品进行更进一步的处理。图像梯度-Sobel算子我们首先来看以下我们需要处理的图片:img = cv2.imread('pie.png',cv2.IMREAD_GRAYSCALE) cv2.imshow("img",img) cv2.waitKey(0) cv2.destroyAllWindows()  这里我们....

计算机视觉实战(五)图像梯度计算
文章 2023-08-03 来自:开发者社区

计算机视觉实战(四)图像形态学操作

 本节主要介绍形态学的一些操作运算,通过代码跟效果可以清楚地认识到其大概的意思。形态学-腐蚀操作  通常都是二值的图像来做腐蚀操作。腐蚀的大概意思就是往里面缩一些。import cv2 import numpy as np img = cv2.imread('dige.png') cv2.imshow('dige', img) kernel = np.ones((3, 5), np.uint8)....

计算机视觉实战(四)图像形态学操作
文章 2023-08-03 来自:开发者社区

计算机视觉实战(二)图像基本操作

本文主要介绍OpenCv对图像的一些基本处理。包括图片、视频读取,读取感兴趣窗口,通道分离与合并,边界填充,直接对像素点进行操作,以及两张图片的融合。图片的读取  读取图片是OpenCv最基本的功能,实现起来也比较简单,调用cv2.imread()函数即可实现:import cv2 import matplotlib.pyplot as plt import numpy as np img = ....

计算机视觉实战(二)图像基本操作
文章 2023-08-01 来自:开发者社区

计算机视觉图像分类基础

1、简介视觉小白,针对视觉基础进行回顾,记录下个人学习过程,希望帮助刚入圈的小白有一定学习思路的帮助。从基础分类网络入手,针对目标检测常用的骨干网络进行讲解,便于后续轻量化目标检测的搭建。2、计算机视觉介绍计算机视觉主要分为目标分类、目标检测、目标分割三部分。目标分类:对一个目标进行识别。目标检测:对不同目标进行识别(例如动物园中不同动物进行识别)。目标分割:对同一目标,不同类别进行识别(例如班....

计算机视觉图像分类基础
文章 2023-07-20 来自:开发者社区

【计算机视觉】CLIP:连接文本和图像(关于CLIP的一些补充说明)

一、前言 我们推出了一个名为CLIP的神经网络,它可以有效地从自然语言监督中学习视觉概念。CLIP可以应用于任何视觉分类基准,只需提供要识别的视觉类别名称,类似于GPT-2和GPT-3的“零样本”功能。 尽管深度学习彻底改变了计算机视觉,但当前的方法存在几个主要问题: 典型的视觉数据集是劳动密集型的,创建成本高昂,同时只教授一小部分视觉概念;标准视觉模型擅长一项任务且仅擅长一项任务,并且需...

【计算机视觉】CLIP:连接文本和图像(关于CLIP的一些补充说明)
文章 2023-07-19 来自:开发者社区

【计算机视觉】DINOv2的四种模型代码示范,以 28 * 28 的图像示例(含源代码)

一、ViT-S/14 import torch import torchvision.transforms as T import matplotlib.pyplot as plt import numpy as np import matplotlib.image as mpimg from PIL import Image from sklearn.decomposition impor...

【计算机视觉】DINOv2的四种模型代码示范,以 28 * 28 的图像示例(含源代码)

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

计算机视觉