密歇根_Sora中文网

密歇根 ·深度学习与计算机视觉课程|L21强化学习

强化学习概述：介绍了机器学习的第三种主要范式——强化学习。强化学习是指建立可以与环境互动的代理，代理根据观察到的环境状态采取动作，并根据动作的好坏获得奖励信号，以最大化所获得的奖励。本课主要介绍了强化学习的一些基本概念和简单算法，如Q学习和策略梯度，以及如何将其与深度神经网络结合。需要注意的是，强化学习是一个庞大的话题，本课只是简要介绍，不能全面涵盖。通信…

2024年3月21日

000452

计算机视觉

密歇根 ·深度学习与计算机视觉课程|L20生成模型（下）

生成模型与判别模型的区别：介绍了生成模型和判别模型的区别。判别模型是通过学习一个函数来预测标签，需要大量带标签的数据。而生成模型是学习数据的概率分布，可以在没有标签的情况下生成新的数据。生成模型需要整合所有可能的图像的密度为一，所以比较困难。作者还介绍了一种生成模型的例子——自回归模型，可以通过循环神经网络或卷积神经网络来实现。变分自动编码器的工作原理：介…

2024年3月21日

000435

计算机视觉

密歇根 ·深度学习与计算机视觉课程|L19生成模型（上）

生成模型简介：介绍了生成模型的第一部分，并介绍了监督学习和无监督学习的区别。监督学习是通过人工标注来训练模型，而无监督学习则是通过大量未标注的数据来发现隐藏结构。虽然无监督学习是一个梦想，但目前还存在一些挑战。无监督学习和生成模型：讨论了无监督学习和生成模型。无监督学习任务的几个例子包括聚类和维度减少。聚类是将数据样本分解成集群的任务，而维度减少则是将高维…

2024年3月21日

000561

计算机视觉

密歇根 ·深度学习与计算机视觉课程|L18深度学习中的视频处理

视频分类任务：讲解了视频分类的任务。视频是一系列随时间展开的图像，我们需要找到一种方法将其转化为四维张量，其中包括时间维度、空间维度和通道维度。视频分类的目标是识别视频中的动作或活动，通常与图像分类中的对象识别不同。视频分类数据集通常包含不同类型的动作或活动的类别标签。深度学习处理视频数据：讲述了使用深度学习来分析视频的重要性以及处理视频数据时面临的挑战。…

2024年3月21日

000424

计算机视觉

密歇根 ·深度学习与计算机视觉课程|L173D计算机视觉

3D视觉的应用和挑战：讨论了3D视觉的应用和挑战。在计算机视觉中，我们经常需要识别和定位物体，但现实世界是三维的，所以我们需要将第三个维度引入神经网络模型。本节课的重点是如何将三维信息添加到神经网络模型中，以预测和分类3D形状。我们将介绍五种不同的3D形状表示方法，并讨论如何使用神经网络模型进行预测。这些方法包括深度图、点云、体素化、网格和隐函数表示。这节课…

2024年3月20日

000337

计算机视觉

密歇根 ·深度学习与计算机视觉课程|L16目标检测与图像分割

目标检测历程与重要性：介绍了非深度学习方法和深度学习方法的差异，并强调了深度学习在目标检测中的重要性。讲座还解释了我们如何使用区域建议方法和地面实况框来训练我们的CNN模型。最后，讲座指出了目标检测领域取得的巨大进展，并提到了一些挑战性数据集的研究。区域提案和标签分配：介绍了目标检测中的区域提案和标签分配。首先，通过检测算法得到一系列区域提案，然后根据与真…

2024年3月20日

000525

计算机视觉

密歇根 ·深度学习与计算机视觉课程|L15目标检测

物体检测介绍：介绍了物体检测的任务。物体检测是输入单个RGB图像，输出一组检测到的对象的任务。每个对象都有一个类别标签和一个边界框，用于表示对象的空间范围。与图像分类不同，物体检测需要输出多个对象，并且每个对象可能有不同数量的检测结果。此外，物体检测通常需要处理高分辨率的图像。对象检测问题：讲述了对象检测的问题，与图像分类不同，对象检测需要识别图像中多个物…

2024年3月20日

000294

计算机视觉

密歇根 ·深度学习与计算机视觉课程|L14可视化与模型理解

卷积神经网络内部可视化：讲解了卷积神经网络内部的可视化技术，以及如何理解网络学到的内容。首先介绍了卷积神经网络中的模板匹配机制，通过可视化网络第一层的卷积核，我们可以了解到网络最初层次所寻找的特征，比如边缘和颜色。然后讨论了如何将这种可视化技术应用到更高层次的网络中。总之，这些技术可以帮助我们更好地理解和解释神经网络的工作原理。权重理解神经网络运行：介绍了…

2024年3月20日

000499

计算机视觉

密歇根 ·深度学习与计算机视觉课程|L13注意力机制

循环神经网络的注意力机制：介绍了循环神经网络的注意力机制。他解释了序列到序列预测的问题，并介绍了编码器-解码器架构。编码器逐个处理输入向量并生成隐藏状态，解码器使用隐藏状态和上下文向量来生成输出序列。然而，对于较长的句子或文档，使用单个上下文向量可能成为瓶颈。解决短句子问题的方法：介绍了一种解决短句子问题的方法。通过引入注意力机制，可以让解码器网络在每个时…

2024年3月20日

000414

计算机视觉

密歇根 ·深度学习与计算机视觉课程|L12循环神经网络

循环神经网络介绍：介绍了一种新的神经网络模型——循环神经网络。循环神经网络与前馈神经网络不同，它可以处理多对一、一对多、多对多等不同类型的问题。例如，图像字幕生成、机器翻译等。讲师还提到了最新版本的PI torch 1.3，该版本提供了实验性的移动API和对Google TP使用的支持。这些新功能为解决更多类型的问题提供了可能性。循环神经网络的应用：循环神…

2024年3月20日

000420

计算机视觉

密歇根 ·深度学习与计算机视觉课程|L11训练神经网络（下）

训练神经网络技巧：讨论训练神经网络的小技巧和窍门，包括激活函数、数据预处理、权重初始化和正则化等。学习率计划是一个重要的超参数，我们可以先选择一个相对较高的学习率，使得在初始训练迭代中能够快速收敛到较低的损失值，然后逐渐降低学习率继续训练，以实现更好的性能。学习率计划：学习率计划是训练深度神经网络模型时常用的一种方法。步进学习率计划是其中一种常用的形式，即…

2024年3月20日

000330

计算机视觉

密歇根 ·深度学习与计算机视觉课程|L10训练神经网络（上）

训练神经网络技巧：讨论了训练神经网络的一些技巧和窍门。上次我们谈到了深度学习的硬件和软件，以及静态图和动态计算图的区别。今天，我们开始讨论激活函数，特别是经典的sigmoid函数。然而，sigmoid函数存在一些问题，例如在极端值时梯度接近零，导致学习速度变慢。 sigmoid激活函数问题：sigmoid激活函数的主要问题有三个：一是它的激活函数太平坦，导致…

2024年3月19日

000513

计算机视觉

密歇根 ·深度学习与计算机视觉课程|L9深度学习硬件与软件

深度学习硬件与软件介绍：介绍了深度学习的硬件和软件。讲座首先讨论了深度学习硬件，指出NVIDIA的GPU在深度学习中占据主导地位。然后，讲座介绍了计算成本的趋势，指出GPU的计算成本远低于CPU。最后，讲座讨论了深度学习训练规模的增加与计算成本的下降之间的关系。 GPU计算的进步与优势：从2012年至今，GPU计算取得了巨大的进步，使得计算变得非常廉价。消费…

2024年3月19日

000512

计算机视觉

密歇根 ·深度学习与计算机视觉课程|L8CNN典型结构

卷积神经网络的架构：讲述了卷积神经网络的架构。卷积神经网络由卷积层、池化层和全连接层组成，还包括一些激活函数和规范化层。在讲解卷积神经网络之前，还介绍了历史上一些重要的网络架构和比赛，例如imagenet分类挑战。其中，Alex net是一个非常有影响力的卷积神经网络，它在2012年的比赛中表现出色。这节课还提到了一些关于Alex net的特点，例如使用了局…

2024年3月19日

000467

计算机视觉

密歇根 ·深度学习与计算机视觉课程|L7卷积神经网络

卷积神经网络概述：讲解了卷积神经网络（CNN）的基本概念和原理。CNN是一种能够处理图像数据的模型，相比于全连接网络，它能够更好地保留图像的空间结构信息。在CNN中，我们引入了卷积层、池化层和归一化层这三个操作，以便处理具有空间结构的输入数据。卷积层通过权重矩阵对输入进行操作，池化层用于降采样，而归一化层则可以对输入进行标准化处理。通过使用这些操作，我们能够…

2024年3月19日

000445