深度学习与图像识别
[TOC]
图像卷积卷积神经网络大范围应用于计算机视觉相关
卷积核
步长
均值模糊
均值模糊后,可以将图像中的高频噪声模糊掉
高斯模糊
边缘检测
图像卷积算子
提取特征全连接隐含层中的没一个节点都可以自动学习数据中的特征
每一个节点中都和它前面的一层中的所有节点相连
局部连接
卷积神经网络(Convolutional Neural Networks,CNN)
卷积神经网络结构
卷积层:特征提取层
池化层:特征映射层
下采样
在减少数据的处理量的同时,保持有用的信息
计算机神经网络基础学习
[TOC]
概述文章参考:https://www.cnblogs.com/gangle/p/11056640.html
神经网络是一种模拟人脑的神经网络以期能够实现类人工智能的机器学习技术。人脑中的神经网络是一个非常复杂的组织。成人的大脑中估计有1000亿个神经元之多。
Linux系统上常用软件集锦
[TOC]
文章参考:https://zhuanlan.zhihu.com/p/104358826
文章参考:https://bqgao.github.io/2017/07/10/CCD%E7%9F%A5%E8%AF%86%E7%82%B9/
概述Lens主要参数(1)焦距:镜头焦距的长短决定着拍摄的成像大小,视场角大小,景深大小和画面的透视强弱。一般来说对于单片镜头就是镜头中心到焦点的距离,而相机镜头是由多片透镜组合,就要复杂许多。这里焦距就指的是从镜头的中心点到感光元器件(CCD)上所形成的清晰影像之间的距离。
Focal length in pixels的计算方法文章参考:https://www.cnblogs.com/ywl925/p/3700145.html
一般来说,我们采用针孔相机模型,也就是认为它用到的是小孔成像原理。
在相机坐标系下,一般来说,我们用到的单位长度,不是“米”这样的国际单位,而是相邻像素的长度。而焦距在相机坐标系中的大小,是在图像处理领域的一个非常重要的物理量。
假设我们已经根据相机参数,得到镜头的物理焦距大小(focal length),和相机胶 ...
图像识别之目标检测算法
[TOC]
文章参考:https://github.com/scutan90/DeepLearning-500-questions/blob/master/ch08_%E7%9B%AE%E6%A0%87%E6%A3%80%E6%B5%8B/%E7%AC%AC%E5%85%AB%E7%AB%A0_%E7%9B%AE%E6%A0%87%E6%A3%80%E6%B5%8B.md
文章参考:https://blog.csdn.net/gaoyu1253401563/article/details/86485851
概述 目标检测(Object Detection)的任务是找出图像中所有感兴趣的目标(物体),确定它们的类别和位置,是计算机视觉领域的核心问题之一。由于各类物体有不同的外观、形状和姿态,加上成像时光照、遮挡等因素的干扰,目标检测一直是计算机视觉领域最具有挑战性的问题。
计算机视觉中关于图像识别有四大类任务:
分类-Classification:解决“是什么?”的问题,即给定一张图片或一段视频判断里面包含什么类别的目标。
定位-Location:解决“在哪里?”的问题,即定位出这个目 ...
RGB图像格式详解
[TOC]
概述
图像处理中的坐标系处理
[TOC]
概述参考:
图像坐标系
如图2.1所示,以图像左上角为原点建立以像素为单位的直接坐标系u-v。像素的横坐
标u与纵坐标v分别是在其图像数组中所在的列数与所在行数。(在OpenCV中u对应x,v对应y)
由于(u,v)只代表像素的列数与行数,而像素在图像中的位置并没有用物理单位表示出
来,所以,我们还要建立以物理单位(如毫米)表示的图像坐标系x-y。将相机光轴
与图像平面的交点(一般位于图像平面的中心处,也称为图像的主点(principal
point)定义为该坐标系的原点O1,且x轴与u轴平行,y轴与v轴平行,假设(u0,v0)代
表O1在u-v坐标系下的坐标,dx与dy分别表示每个像素在横轴x和纵轴y上的物理尺
寸,则图像中的每个像素在u-v坐标系中的坐标和在x-y坐标系中的坐标之间都存在如下的关系:
相机坐标系
图像处理中的坐标系处理
[TOC]
概述文章参考:https://blog.csdn.net/jaych/article/details/50631298
YUV图像标准协议
[TOC]
概述文章参考:https://www.p-chao.com/2021-02-06/yuv%E5%9B%BE%E5%83%8F%E6%A0%87%E5%87%86/
文章参考:https://cloud.tencent.com/developer/article/1652915
文章参考:https://juejin.cn/post/6920848468797816846
图像处理中的滤波介绍
[TOC]
概述文章参考:https://blog.csdn.net/hellocsz/article/details/80727972
深度神经网络模型的卷积网络的量化
[TOC]
文章参考:https://zhuanlan.zhihu.com/p/58182172
文章参考:https://github.com/Ewenwan/MVision/tree/master/CNN/Deep_Compression/quantization
文章参考:https://zhuanlan.zhihu.com/p/149659607
概述矩阵的量化由于卷积网络中的卷积层和全连接层本质上都是一堆矩阵乘法,因此我们先看如何将浮点运算上的矩阵转换为定点运算。
假设$r_1、r_2$是浮点实数上的两个$N*N$的矩阵,$r_3$是$r_1、r_2$相乘后的矩阵:
$$r_3^{i,k}=\sum_{j=1}^N r_1^{i,j}r_2^{j,k} \tag{1}$$假设 $S_1、Z_1$ 是$r_1$矩阵对应的$scale$ 和 zero point,$ S_2 、 Z_2 、 S_3 、 Z_3$ 同理,那么由 (1) 式可以推出:$$S_3(q_3^{i,k}-Z_3)=\sum_{j=1}^{N}S_1(q_{1}^{i, ...