深度学习随笔

文章列表

深度学习随笔

一、SPP的作用

解决了训练CNN需要输入图像尺寸一致的问题。

一个CNN可看作由卷积、池化、全连接层组成，由于全连接层的权重矩阵是一个固定值，因此输入全连接层的特征图的维度也必须固定。

SPP利用多尺度思想解决了上述问题，使得神经网络的训练过程由图1变为图2，即输入图像的尺寸可以不一样，不再受到限制。

在这里插入图片描述

图1 原有神经网络训练过程

在这里插入图片描述

图2 带SPP的神经网络训练过程

SPP的思想就是利用多个不同尺度的池化层进行特征的提取，融合成一个21维的向量输入至全连接层。

在这里插入图片描述

图3 SPP网络结构

二、Attention原理

深度学习随笔

将 $S o u rce$ 中的构成元素想象成是由一系列的 $< Key, Va l u e >$ 数据对构成，此时给定 $T a r g e t$ 中的某个元素 $Q u ery$ ，通过计算 $Q u ery$ 和各个 $Key$ 的相似性或者相关性，得到每个 $Key$ 对应 $Va l u e$ 的权重系数，然后对 $Va l u e$ 进行加权求和，即得到了最终的 $A tt e n t i o n$ 数值。所以本质上 $A tt e n t i o n$ 机制是对 $S o u rce$ 中元素的 $Va l u e$ 值进行加权求和，而 $Q u ery$ 和 $Key$ 用来计算对应 $Va l u e$ 的权重系数。即可以将其本质思想改写为如下公式：

$Attention(Query,Source)=∑i=1LxSimilarity(Query,Keyi)∗ValueiAttention(Query,Source)=\\sum_{i=1}^{L_{x}}Similarity(Query,Key_{i})*Value_{i}$

三、向量内积

向量内积又叫向量点乘，公式如下：

$a⃗⋅c⃗=∥a⃗∥×∥c⃗∥×cosθ\\vec{a}\\cdot \\vec{c}=\\parallel\\vec{a}\\parallel\\times \\parallel\\vec{c}\\parallel \\times cos \\theta$

深度学习随笔

四、Transformer中的Scaled Dot-Product Attention

公式如下：

$Attention(Q,K,V)=softmax(QKTdk)VAttention(Q,K,V)=softmax(\\frac{QK^{T}}{\\sqrt{d_{k}}})V$

对一组key-value对和n个query,可以使用两次矩阵乘法，并行的计算里面的每个元素。

深度学习随笔

深度学习随笔

一、SPP的作用

二、Attention原理

三、向量内积

四、Transformer中的Scaled Dot-Product Attention

公告

DeepSeek全套部署资料免费下载

免费可商用字体批量下载

标签

深度学习随笔

一、SPP的作用

二、Attention原理

三、向量内积

四、Transformer中的Scaled Dot-Product Attention

相关问题

公告

DeepSeek全套部署资料免费下载

免费可商用字体批量下载

标签