文章 2024-10-18 来自:开发者社区

聊一聊计算机视觉中常用的注意力机制以及Pytorch代码实现

聊一聊计算机视觉中常用的注意力机制以及Pytorch代码实现 注意力机制(Attention)是深度学习中常用的tricks,可以在模型原有的基础上直接插入,进一步增强你模型的性能。注意力机制起初是作为自然语言处理中的工作Attention Is All You Need被大家所熟知,从而也引发了一系列的XX is All You Need的论文命题,SENET-Squeeze-and-Exci....

聊一聊计算机视觉中常用的注意力机制以及Pytorch代码实现
文章 2023-06-20 来自:开发者社区

计算机视觉PyTorch迁移学习 - (二)

3.PyTorch实现迁移学习文件目录3.1数据集预处理这里实现一个蚂蚁与蜜蜂的图像分类,用到的数据集data下载dataset.pyfrom torchvision import datasets, transforms import torch train=transforms.Compose([ transforms.RandomResizedCrop(224), # 随机裁剪一...

计算机视觉PyTorch迁移学习 - (二)
文章 2023-06-20 来自:开发者社区

计算机视觉PyTorch迁移学习 - (一)

如何在只有6万张图像的MNIST训练数据集上训练模型。学术界当下使用最广泛的大规模图像数据集ImageNet,它有超过1,000万的图像和1,000类的物体。然而,我们平常接触到数据集的规模通常在这两者之间。假设我们想从图像中识别出不同种类的椅子,然后将购买链接推荐给用户。一种可能的方法是先找出100种常见的椅子,为每种椅子拍摄1,000张不同角度的图像,然后在收集到的图像数据集上训练一个分类模....

计算机视觉PyTorch迁移学习 - (一)
文章 2023-06-20 来自:开发者社区

计算机视觉PyTorch - 数据处理(库数据和训练自己的数据)

1. pytorch库自带数据为了更好的理解,这里以CIFAR10数据集作为训练和测试数据集。我们将使用CIFAR10数据集,它包含十个类别:[‘airplane’, ‘automobile’, ‘bird’, ‘cat’, ‘deer’, ‘dog’, ‘frog’, ‘horse’, ‘ship’, ‘truck’]。CIFAR-10 中的图像尺寸为3x32x32,也就是RGB的3层颜色通道....

计算机视觉PyTorch - 数据处理(库数据和训练自己的数据)
文章 2023-06-20 来自:开发者社区

计算机视觉PyTorch实现图像着色 - (二)

1.图像着色算法原理图像着色,通俗讲就是对黑白的照片进行处理,生成为彩色的图像。有点像买的图框画,自己用颜料在图框中进行填色。算法原理上用到了上一节讲到的Lab颜色空间,具体模型架构如下图所示:1.1 模型架构这里我把模型分为三个部分,对这三部分进行详细解释。第一部分第一部分实际是一个典型的VGG16模型,只不过去掉了VGG16后面池化层部分,在后面加上如下表的卷积层卷积层通道数卷积核步长填充p....

计算机视觉PyTorch实现图像着色 - (二)
文章 2023-06-20 来自:开发者社区

计算机视觉PyTorch实现图像着色 - (一)

在介绍图像着色原理之前,先介绍一下opencv的颜色空间目前基于opencv实现图像原理中定义的颜色空间分为三种:RGBRGB就是常说的光学三原色,R代表Red(红色),G代表Green(绿色),B代表Blue(蓝色),取值范围在[0,255]。自然界中肉眼所能看到的任何色彩都可以由这三种色彩混合叠加而成,因此也称为加色模式。import cv2 import matplotlib.pyplot....

计算机视觉PyTorch实现图像着色 - (一)
文章 2023-06-20 来自:开发者社区

计算机视觉PyTorch实现目标检测:SSD

目标检测算法概况目前目标检测点主流算法分为二种类型:二阶段方法:如R-CNN系算法,其主要思路是先通过启发式方法(selective search)或者CNN网络(RPN)产生一系列稀疏的候选框,然后对这些候选框进行分类与回归,two-stage方法的优势是准确度高单阶段方法:如Yolo和SSD,其主要思路是均匀地在图片的不同位置进行密集抽样,抽样时可以采用不同尺度和长宽比,然后利用CNN提取特....

计算机视觉PyTorch实现目标检测:SSD
文章 2023-06-20 来自:开发者社区

计算机视觉PyTorch实现风格迁移

神经网络风格迁移它主要是通过神经网络,将一幅艺术风格画(style image)和一张普通的照片(content image)巧妙地融合,形成一张非常有意思的图片。大白话说,图像往往由风格与内容组成,比如我们常常说画家的画风是怎么样的,毕加索的画风、动漫的画风。风格迁移就是保留一张图片的内容(物体,人物),用另一张图片的色彩画图风格去填充。风格迁移原理在介绍原理之前先普及一个知识点:通常将图像输....

计算机视觉PyTorch实现风格迁移
文章 2023-06-20 来自:开发者社区

计算机视觉PyTorch实现图像分类(二) - AlexNet

手写数字识别-AlexNet1.深度学习工程结构构建深度学习模型,实现数据训练测试是一个很复杂过程,建立一个合理的工程结构,把工程模型拆分成几个文件,每个文件负责深度学习工程一部分。常见的深度学习工程文件排列:project/ data.py utils.py model.py train.py inference.py 如上图所示,p...

计算机视觉PyTorch实现图像分类(二) - AlexNet
文章 2023-06-20 来自:开发者社区

计算机视觉PyTorch实现(一)

计算机视觉PyTorch实现(一)PyTorch基础模块计算机视觉可以被广泛应用于多个现实领域中。如做图像基本处理、图像识别、图像分割、目标跟踪、图像分类、姿态估计等。在深度学习中人们开发了很多的学习框架,如Caffe、MXNet、Pytorch和TensorFlow等。这些框架可以极大简化了构建深度学习神经网络的过程。在计算机视觉应用中通过pytorch模块构建不同的神经网络在不同网络层提取不....

计算机视觉PyTorch实现(一)

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

计算机视觉

包含图像分类、图像生成、人体人脸识别、动作识别、目标分割、视频生成、卡通画、视觉评价、三维视觉等多个领域

+关注