计算机视觉课程

慕尼黑工大计算机视觉深度学习进阶课|L9高维数据深度学习

高维数据深度学习：讨论了在更高维度中进行深度学习的方法。在计算机视觉中，我们通常处理的是2D信号，如图像，但也存在一维领域的数据信号，如音频、点云等。作者提到了一维卷积网络在处理音频等一维信号上的应用，以及三维卷积网络在处理体素网格、流体模拟等三维信号上的应用。作者还介绍了一种基于自回归模型的方法——WaveNet，该模型可以在音频信号中逐个样本地生成音频。…

2024年3月22日

000320

计算机视觉

慕尼黑工大计算机视觉深度学习进阶课|L8神经网络图像与视频渲染

渲染概念与应用：讲解了渲染的概念以及它在计算机图形学中的应用。渲染是从3D场景描述生成2D图像的过程，包括场景描述、相机参数、光照、材质等要素。人们通过使用先进的图形方法和渲染方程来实现真实感的图像合成。理解和掌握这些参数和方法，可以生成高质量的图像，用于视频游戏和电影等娱乐目的。计算机视觉与图形学：讲述了计算机视觉和计算机图形学之间的差距。计算机图形学可…

2024年3月22日

000386

计算机视觉

慕尼黑工大计算机视觉深度学习进阶课|L7视频处理与回归建模

GANs与艺术风格生成器：介绍了最新的艺术风格生成器GANs，该生成器使用了逐渐增长的架构。通过利用潜在向量Z和风格输出，生成器可以在不同分辨率上控制图像的结构和细节。这种方法可以产生更好的结果，但需要调整许多超参数。图像合成的研究论文：讲述了一个关于图像合成的研究论文，通过使用多分辨率的样式向量控制生成器的特征向量，实现高质量图像的生成。作者对论文进行了…

2024年3月22日

000310

计算机视觉

慕尼黑工大计算机视觉深度学习进阶课|L6生成对抗网络（下）

深度卷积生成模型：讲解了生成模型的一种常见架构——深度卷积生成模型（DCGAN）。DCGAN通过在不同分辨率上进行生成和上采样，逐渐增加细节，生成高分辨率图像。同时，视频还介绍了渐进式生长甘斯（Progressive Growing GANs）的概念，该方法可以进一步提高生成图像的质量。虽然这个视频是五年前的内容，但这些概念仍然非常重要，并且已经被近期的研究…

2024年3月22日

000261

计算机视觉

慕尼黑工大计算机视觉深度学习进阶课|L5生成对抗网络（上）

生成神经网络概念和应用：介绍了生成神经网络的概念和应用。生成神经网络是一种通过训练集学习数据分布的模型，在计算机视觉领域可以用来生成图像和视频。讲座还提到了不同类型的生成模型，包括隐式密度和显式密度，以及生成网络的理论概念和应用。此外，还介绍了生成模型的分类和自回归网络的重要性。最后，还提到了条件GAN和无渲染技术的应用。转置卷积的概念和用途：讲解了转置卷…

2024年3月22日

000414

计算机视觉

慕尼黑工大计算机视觉深度学习进阶课|L4图像神经网络与注意力机制

图形领域的学习：介绍了图形领域的学习，与之前的图像领域相比，图形领域更加不规则。在图像中，像素的顺序和位置非常重要，而在图形中，点的顺序和位置并不相关。因此，为了在图形领域进行深度学习，需要使用新的工具。图形是由节点和边组成的，节点表示概念，边表示概念之间的连接。在图形领域中，我们需要解决可变大小输入和节点排列的问题。图形神经网络通过构建图形并进行信息传播来…

2024年3月22日

000545

计算机视觉

慕尼黑工大计算机视觉深度学习进阶课|L3自编码器.VAE和视觉风格迁移

自动编码器简介：介绍了无监督学习中的自动编码器。自动编码器由编码器和解码器组成，通过将输入图像压缩到低维空间，然后从压缩表示中重建图像。这种方法不需要标签，只需使用重建损失来训练模型。自动编码器可用于无监督学习任务，如聚类和降维。无监督训练和预训练：介绍了无监督训练和预训练的重要性。通过自我重建和编码器的训练，我们可以得到数据集中的模式和集群。在医疗应用中…

2024年3月22日

000573

计算机视觉

慕尼黑工大计算机视觉深度学习进阶课|L2孪生网络与相似度学习

神经网络可视化：介绍了如何使用可视化工具来理解和解释深度神经网络的工作原理。通过可视化激活值和梯度，我们可以观察神经网络在图像分类任务中的决策过程，并了解神经网络对不同特征的敏感程度。通过可视化卷积层的滤波器响应，我们可以观察神经网络对图像中不同几何形状的检测能力。这种可视化方法可以帮助我们理解神经网络在图像分类和目标跟踪等任务中的表现，并提供对神经网络决策…

2024年3月22日

000360

计算机视觉

慕尼黑工大计算机视觉深度学习进阶课|L1可视化与模型可解释性

可视化与模型可解释性：介绍了可视化和可解释性的讲座。可视化可以通过多种方式实际可视化大陆和所有，包括调试CNN、可视化特征、梯度和预测等。可视化工具可以帮助我们了解神经网络内部发生的事情，例如决策制定和分类。通过可视化图像空间中的图像块，我们可以观察到不同层次的特征，例如几何形状和边缘。这些可视化可以帮助我们更好地理解和解释神经网络的工作原理。边缘检测与模…

2024年3月21日

000296

计算机视觉

密歇根 ·深度学习与计算机视觉课程|L21强化学习

强化学习概述：介绍了机器学习的第三种主要范式——强化学习。强化学习是指建立可以与环境互动的代理，代理根据观察到的环境状态采取动作，并根据动作的好坏获得奖励信号，以最大化所获得的奖励。本课主要介绍了强化学习的一些基本概念和简单算法，如Q学习和策略梯度，以及如何将其与深度神经网络结合。需要注意的是，强化学习是一个庞大的话题，本课只是简要介绍，不能全面涵盖。通信…

2024年3月21日

000452

计算机视觉

密歇根 ·深度学习与计算机视觉课程|L20生成模型（下）

生成模型与判别模型的区别：介绍了生成模型和判别模型的区别。判别模型是通过学习一个函数来预测标签，需要大量带标签的数据。而生成模型是学习数据的概率分布，可以在没有标签的情况下生成新的数据。生成模型需要整合所有可能的图像的密度为一，所以比较困难。作者还介绍了一种生成模型的例子——自回归模型，可以通过循环神经网络或卷积神经网络来实现。变分自动编码器的工作原理：介…

2024年3月21日

000435

计算机视觉

密歇根 ·深度学习与计算机视觉课程|L19生成模型（上）

生成模型简介：介绍了生成模型的第一部分，并介绍了监督学习和无监督学习的区别。监督学习是通过人工标注来训练模型，而无监督学习则是通过大量未标注的数据来发现隐藏结构。虽然无监督学习是一个梦想，但目前还存在一些挑战。无监督学习和生成模型：讨论了无监督学习和生成模型。无监督学习任务的几个例子包括聚类和维度减少。聚类是将数据样本分解成集群的任务，而维度减少则是将高维…

2024年3月21日

000561

计算机视觉

密歇根 ·深度学习与计算机视觉课程|L18深度学习中的视频处理

视频分类任务：讲解了视频分类的任务。视频是一系列随时间展开的图像，我们需要找到一种方法将其转化为四维张量，其中包括时间维度、空间维度和通道维度。视频分类的目标是识别视频中的动作或活动，通常与图像分类中的对象识别不同。视频分类数据集通常包含不同类型的动作或活动的类别标签。深度学习处理视频数据：讲述了使用深度学习来分析视频的重要性以及处理视频数据时面临的挑战。…

2024年3月21日

000424

计算机视觉

密歇根 ·深度学习与计算机视觉课程|L173D计算机视觉

3D视觉的应用和挑战：讨论了3D视觉的应用和挑战。在计算机视觉中，我们经常需要识别和定位物体，但现实世界是三维的，所以我们需要将第三个维度引入神经网络模型。本节课的重点是如何将三维信息添加到神经网络模型中，以预测和分类3D形状。我们将介绍五种不同的3D形状表示方法，并讨论如何使用神经网络模型进行预测。这些方法包括深度图、点云、体素化、网格和隐函数表示。这节课…

2024年3月20日

000337

计算机视觉

密歇根 ·深度学习与计算机视觉课程|L16目标检测与图像分割

目标检测历程与重要性：介绍了非深度学习方法和深度学习方法的差异，并强调了深度学习在目标检测中的重要性。讲座还解释了我们如何使用区域建议方法和地面实况框来训练我们的CNN模型。最后，讲座指出了目标检测领域取得的巨大进展，并提到了一些挑战性数据集的研究。区域提案和标签分配：介绍了目标检测中的区域提案和标签分配。首先，通过检测算法得到一系列区域提案，然后根据与真…

2024年3月20日

000525