美容院怎么建立自己的网站,网页设计网站搭建,爱用建站平台,浙江网络安全学院一、一维卷积
#xff08;一#xff09;定义
数学定义 给定一个输入序列 x [ x 1 , x 2 , ⋯ , x n ] x [x_1,x_2,\cdots,x_n] x[x1,x2,⋯,xn] 和一个卷积核#xff08;滤波器#xff09; k [ k 1 , k 2 , ⋯ , k m ] k [k_1,k_2,\cdots,k_m] k[k1,k2,⋯,…一、一维卷积
一定义
数学定义 给定一个输入序列 x [ x 1 , x 2 , ⋯ , x n ] x [x_1,x_2,\cdots,x_n] x[x1,x2,⋯,xn] 和一个卷积核滤波器 k [ k 1 , k 2 , ⋯ , k m ] k [k_1,k_2,\cdots,k_m] k[k1,k2,⋯,km]其中 m ≤ n m\leq n m≤n。一维卷积的计算过程是通过将卷积核在输入序列上滑动在每个位置计算它们的点积。设输出序列为 y [ y 1 , y 2 , ⋯ , y n − m 1 ] y [y_1,y_2,\cdots,y_{n - m1}] y[y1,y2,⋯,yn−m1]则 y i ∑ j 0 m − 1 k j x i j y_i\sum_{j 0}^{m - 1}k_jx_{i j} yi∑j0m−1kjxij。例如当 n 5 n 5 n5 m 3 m 3 m3 x [ 1 , 2 , 3 , 4 , 5 ] x[1,2,3,4,5] x[1,2,3,4,5] k [ 1 , 2 , 3 ] k [1,2,3] k[1,2,3]时 y 1 1 × 1 2 × 2 3 × 3 14 y_11\times1 2\times23\times3 14 y11×12×23×314。 在深度学习中的表示 在深度学习框架如PyTorch或TensorFlow中一维卷积层通常表示为Conv1d。它接受一个形状为 ( b a t c h _ s i z e , c h a n n e l s _ i n , s e q u e n c e _ l e n g t h ) (batch\_size, channels\_in, sequence\_length) (batch_size,channels_in,sequence_length)的输入张量并输出一个形状为 ( b a t c h _ s i z e , c h a n n e l s _ o u t , o u t p u t _ s e q u e n c e _ l e n g t h ) (batch\_size, channels\_out, output\_sequence\_length) (batch_size,channels_out,output_sequence_length)的张量。其中channels_in是输入通道数channels_out是输出通道数output_sequenc_length取决于输入序列长度、卷积核大小和步长等参数。
二作用
信号处理 滤波可以用于去除信号中的噪声。例如在音频信号处理中低通滤波器卷积核可以通过卷积操作滤除高频噪声。假设音频信号的采样点序列为输入通过设计一个合适的低通滤波器卷积核让其在信号序列上滑动进行卷积高频部分对应的系数会被削弱从而达到滤波的效果。特征提取从时间序列数据中提取特征。以股票价格数据为例将一段时间内的股票价格序列作为输入一维卷积可以提取价格波动的模式如短期的上涨或下跌趋势等特征。这些特征对于预测股票价格走势等后续任务非常有帮助。 自然语言处理NLP 词向量处理在处理文本的词向量序列时一维卷积可以捕捉局部的语义信息。例如对于一个句子的词向量序列卷积核可以提取出如名词短语、动词短语等局部语义单元的特征。文本分类通过对文本经过词嵌入后的序列进行一维卷积操作提取文本的特征然后将这些特征输入到分类器中用于判断文本的类别如情感分类积极、消极或中性等任务。
二、二维卷积
一定义
数学定义 对于一个二维输入矩阵 X ∈ R H × W X\in R^{H\times W} X∈RH×W H H H表示高度 W W W表示宽度和一个二维卷积核滤波器 K ∈ R h × w K\in R^{h\times w} K∈Rh×w h h h和 w w w分别是卷积核的高度和宽度。二维卷积的计算是将卷积核在输入矩阵上滑动在每个位置计算它们的对应元素乘积之和。设输出矩阵为 Y ∈ R H − h 1 × W − w 1 Y\in R^{H - h1\times W - w 1} Y∈RH−h1×W−w1对于输出矩阵中的元素 y i j y_{ij} yij其计算公式为 y i j ∑ m 0 h − 1 ∑ n 0 w − 1 k m n x i m , j n y_{ij}\sum_{m 0}^{h - 1}\sum_{n 0}^{w - 1}k_{mn}x_{i m,j n} yij∑m0h−1∑n0w−1kmnxim,jn。例如当 X [ 1 2 3 4 5 6 7 8 9 ] X\begin{bmatrix}123\\456\\789\end{bmatrix} X 147258369 K [ 1 1 1 1 ] K\begin{bmatrix}11\\11\end{bmatrix} K[1111]计算 y 11 y_{11} y11时 y 11 1 × 1 2 × 1 4 × 1 5 × 1 12 y_{11}1\times12\times14\times15\times1 12 y111×12×14×15×112。 在深度学习中的表示 在深度学习框架中二维卷积层通常表示为Conv2d。它接受一个形状为 ( b a t c h _ s i z e , c h a n n e l s _ i n , h e i g h t , w i d t h ) (batch\_size, channels\_in, height, width) (batch_size,channels_in,height,width)的输入张量并输出一个形状为 ( b a t c h _ s i z e , c h a n n e l s _ o u t , o u t p u t _ h e i g h t , o u t p u t _ w i d t h ) (batch\_size, channels\_out, output\_height, output\_width) (batch_size,channels_out,output_height,output_width)的张量。其中channels_in是输入通道数例如彩色图像的RGB通道数为3channels_out是输出通道数output_height和output_width取决于输入图像的高度、宽度、卷积核大小和步长等参数。
二作用
图像处理 边缘检测通过特定的卷积核可以检测图像的边缘。例如Sobel算子是一种常用的边缘检测卷积核。它可以计算图像中像素灰度值的变化率从而确定边缘的位置。对于一幅图像使用Sobel卷积核进行二维卷积操作后边缘部分会在输出图像中显示出较高的像素值而非边缘部分像素值较低。图像滤波类似于一维卷积在信号处理中的滤波作用二维卷积可以在图像中去除噪声或模糊图像。例如均值滤波卷积核可以通过计算像素周围邻域的平均值来模糊图像减少图像中的细节噪声。特征提取从图像中提取各种特征如纹理、形状等。在人脸识别中二维卷积可以提取面部的关键特征如眼睛、鼻子、嘴巴等部位的形状和位置特征这些特征对于后续的人脸识别任务至关重要。 计算机视觉中的其他应用 目标检测在目标检测算法中二维卷积用于提取图像中可能包含目标的区域特征。例如在基于深度学习的目标检测模型如Faster R - CNN中卷积层用于从输入图像中提取丰富的特征图然后通过后续的区域提议网络RPN和分类回归头来确定目标的位置和类别。图像分割用于将图像划分为不同的语义区域。通过二维卷积提取图像的特征然后根据这些特征将像素分类到不同的类别例如在医学图像分割中将医学图像中的器官、组织等不同部分分割出来为疾病诊断等任务提供帮助。