Machine Learning 02 学习笔记卷积、感知机、神经网络

卷积

理解卷积公式（狭隘）

\[\int_{-\infty}^{\infty} f(\tau) g(x-\tau) \mathrm{d} \tau \]

一个人24小时不间断进食，且一直在消化，消化的速率和他吃的东西没有关系。问下午两点这个人胃里还剩多少食物。

用f函数表示进食，用\(g\)函数表示消化，就能把下午两点这个人胃里还剩多少食物求解出来。

假设我们不考虑消化问题，那么就是对f函数的简单积分。但是引入消化，只看f函数就不够了。

比如中午12点吃了一碗米饭。那么到下午两点米饭在胃里还剩余 \(f(12) \cdot g(14-12)\)，其他食物同理。

这是考虑特殊情况（单独食物），现在我们考虑一般情况（所有食物）。

关注 \(x 、t-x\) 两个变量，两个变量相加后会消掉其中一个。

\(x、t-x\) 对应的是f函数到g函数的一条连线。每一对连线都是 \(f(x)\) 和 \(g(t-x)\)，我们把它相加起来。

我们这里引入了时间，是具有物理意义的。所以不能负无穷，像距离就可以负无穷了。

卷积的物理意义

一个系统
输入不稳定
输出稳定
用卷积求系统存量

为什么叫卷积（狭隘）

把g函数翻转一下，所以叫卷积

图像的卷积操作

从前面的例子，卷积操作无非就是 f、g两个函数。所以我们要去找图像卷积操作两个f、g的函数。

f函数就是不稳定输入，g函数就是稳定输出。

电脑里的图片可以看做是一个个像素点组成的，具有灰度值，rgb值等信息。

卷积操作就是用 3*3 的点阵（卷积核）和图像进行一个操作，将卷积核扣在图像的点阵上。对应的两个格子相乘。将相乘的九个结果相加保存对应到一个新像素值。用卷积核把整个图像都扫一遍，图像外围加一层0像素边使边缘像素点也能被计算。

图像的卷积操作就是拿图片和卷积核先相乘再相加。直觉上看。图像和卷积核一个应该是f，一个应该是g。

图像里的像素点总在变化对应系统不稳定的输入，而卷积核不变对应的是稳定的输出。

这里的问题跟之前的吃饭问题不一样，这里是一个二维问题，f函数应该是一个平面波。

卷积核和g函数有什么关系呢？我们需要改变对卷积的理解。一个图像不是系统，没有稳定输入也没有稳定输出。

再回到原来吃饭的例子，我们把吃东西看成系统的输入，消化看成系统的输出，胃里的存量是系统的存量，仅靠这个例子很难跳出去对他有一个更广泛的理解。所以我们换一个例子。

假如在t时刻发生飓风，原因是很多蝴蝶煽动翅膀。在x时刻对飓风产生影响，产生的影响力会随时间变化逐渐衰减。

我们可以这样理解卷积，在某一个时刻发生一件事，而这件事会受到之前很多事的影响，比如x时刻发生的一件事，会对t时刻产生影响，具体怎么影响要看x到t时刻经历的时间，规定随时间影响力变化的函数是g函数。我们也可以把视野放宽一点，不仅仅是时间，而是发生事件的位置等等。

平滑卷积操作

平滑就是让周围的像素点和自己相差不要太大。

卷积核就是周围像素点对当前像素点产生的影响。卷积核理论上可以无限大，由于我们这是计算机问题，要考虑性价比，所以就用 3*3 的点阵。

红色公式是进行卷积操作，后面参数相加消掉其中一项可以拿来判断是不是卷积的典型标志。

前面的求和符号因为考虑的是像素点，所以不是连续的，需要连加表示。

求一个像素点对另一个像素点产生了什么影响，我们使用类比法，可以把两个像素点看成不同时刻的事件。我们要考虑的就是t时刻之前所有的时间对t时刻发生的事情产生的影响。现在我们就是相当于在考虑周围像素点对中心像素点产生的影响。那么g函数里的参数是 \(t-x\)，同样可以类比计算 \(x-(x-1) = 1\) 、\(y-(y-1) = 1\)