当前位置：首页 > 数码 > 深入理解自编码器附代码实现

深入理解自编码器附代码实现

数码
2024-11-03 06:49
0

导语：自编码器可以认为是一种数据压缩算法，或特征提取算法。本文作者NathanHubens介绍了autoencoders的基本体系结构。首先介绍了编码器和的概念，然后就“自编码器可以做什么？”进行讨论，最后分别讲解了四种不同类型的自编码器：普通自编码器，多层自编码器，卷积自编码器和正则化自编码器。

自编码器可以认为是一种数据压缩算法，或特征提取算法。本文作者NathanHubens介绍了autoencoders的基本体系结构。首先介绍了编码器和的概念，然后就“自编码器可以做什么？”进行讨论，最后分别讲解了四种不同类型的自编码器：普通自编码器，多层自编码器，卷积自编码器和正则化自编码器。

Deepinside:Autoencoders

自编码器指的是试图让输出和输入一样的神经网络。他们通过将输入压缩成一个隐藏空间表示来进行工作，然后通过这种表示重构输出。这种网络由两部分组成：

1.编码器：这是自编码网络的一部分，功能在于把输入变成一个隐藏的空间表示。它可以用一个编码函数h=f（x）表示。

2.：这部分旨在从隐藏空间的表示重构输入。它可以用解码函数r=g（h）表示。

作为一个整体的自编码器可以用函数g（f（x））=r来描述，其中r与原始输入x相近。

为什么要将输入复制到输出中？

如果autoencoders的唯一目的是将输入复制到输出中，那么它们将毫无用处。实际上，我们希望通过训练autoencoder将输入复制到输出中，隐藏表示h将具有有用的属性。

这可以通过在复制任务上添加一些限制条件进行实现。从自编码器获得有用特征的一种方法是将h限制为小于x的维度，在这种情况下，自编码器是不完整的。通过训练不完整的表示，我们强制自编码器学习训练数据的最显著特征。如果自编码器的容量过大，自编码器可以出色地完成赋值任务而没有从数据的分布抽取到任何有用的信息。如果隐藏表示的维度与输入相同，或者隐藏表示维度大于输入维度的情况下，也会发生这种情况。在这些情况下，即使线性编码器和线性也可以将输入复制到输出，而无需了解有关数据分配的任何有用信息。理想情况下，自编码器可以成功地训练任何体系结构，根据要分配的复杂度来选择编码器和的代码维数和容量。

自编码器可以用于干什么？

当前，数据去噪和数据可视化中的降维被认为是自编码器的两个主要的实际应用。通过适当的维度和稀疏性约束，自编码器可以学习比PCA或其他基本技术更有趣的数据投影。

自编码器通过数据样本自动学习。这意味着很容易训练特定的算法实例，该算法在特定类型的输入中表现良好，并且不需要任何新工程，只需要适当的训练数据。

但是，自编码器在图像压缩方面做得不好。由于自编码器是在给定的一组数据上进行训练的，因此它将对类似于所用训练集中的数据实现合理的压缩结果，但是作为图像压缩器效果是不好的。像JPEG这样的压缩技术效果比自编码器效果好很多。

自编码器经过训练，可以在输入通过编码器和后保留尽可能多的信息，但也会接受训练以使新的表示具有各种不错的属性。不同类型的自编码器旨在实现不同类型的属性。我们将关注四种类型的自编码器。

自编码器的类型：

在本文中，将介绍以下四种类型的自编码器：

1.普通自编码器

2.多层自编码器

3.卷积自编码器

4.正则化的自编码

为了演示不同类型的自编码器，我使用Keras框架和MNIST数据集创建了每个类型自编码器的示例。