• 2025年8月30日 星期六

4.2卷积神经网络

8 月 28, 2025

如果一个M*N的图像和一个m*n的卷积核进行操作,移动步长STRIDE=(P,Q)。即在长这个方向上每步移动P个像素,在宽这个方向上每步移动Q个像素,请问经过卷积操作后获得的特征图的长和宽分别是多少呢?

设:

  • 输入图像大小:M×N
  • 卷积核大小:m×n
  • 步长:stride=(P,Q),即纵向每次移动 P 个像素,横向每次移动 Q 个像素
  • (这里假设 valid 卷积,即不做 padding)

1. 沿高度(纵向)方向

卷积核在图像上可以放置的位置数为:

Hout=MmP+1

2. 沿宽度(水平方向)

卷积核在图像上可以放置的位置数为:

Wout=NnQ+1

3. 最终输出特征图尺寸

Output size=Hout×Wout

举例说明

  • 输入图像:32×32
  • 卷积核:5×5
  • 步长:(P,Q)=(1,1)

那么输出特征图大小:

Hout=(325)/1+1=28,Wout=(325)/1+1=28

→ 输出 28×28。

补0操作见第3页👇

Avatar photo

李星海

简介: 2025-今 浙江农林大学 | 2022-今 广州白蓝碗蛋科技有限公司 | 2022-2024 广州商学院 | 2019-2022 广东工贸职业技术学院 | 服务宗旨:心始至客,行亦致远。