<深度学习初识>——《深度学习笔记》

news/2024/4/27 19:18:09

深度学习笔记

一、人工智能简介

1.人工智能发展的重要时间节点

在这里插入图片描述

1.1人工智能孕育期

在这里插入图片描述

1.2人工智能诞生期

在这里插入图片描述

1.3人工智能第一次浪潮的发展

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

1.4人工智能的第一次寒冬

在这里插入图片描述

第一次寒冬主要面临的几个问题:
在这里插入图片描述

1.5人工智能第二次浪潮的发展

在这里插入图片描述

在这里插入图片描述

1.6人工智能的第二次寒冬

在这里插入图片描述

1.7人工智能第三次浪潮的发展

在这里插入图片描述
在这里插入图片描述在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

1.8人工智能技术发展的关键

在这里插入图片描述

2.人工智能应用领域

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

人工智能与就业:
在这里插入图片描述

3.人工智能研究方法

3.1人工智能概念相关

人工智能定义:
在这里插入图片描述

人工智能学习的目标:
在这里插入图片描述

人工智能涉及到的相关学科:
在这里插入图片描述

人工智能当前的关键技术:

在这里插入图片描述

3.2人工智能研究方法

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

二、深度学习崛起的背景

1.大数据时代来临

信息存储方式的演变:在这里插入图片描述

传统媒介时代:

在这里插入图片描述

数字媒介时代:
在这里插入图片描述

大数据时代的到来:

在这里插入图片描述
在这里插入图片描述

大数据与小数据对比:
在这里插入图片描述

数据集规模对比:
在这里插入图片描述

数据领域相关:
在这里插入图片描述

2.GPU计算平台发展

在这里插入图片描述

GPU发展历史:

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

人工智能相关芯片与应用场景:
在这里插入图片描述

3.算法的持续积累

什么是深度学习?

在这里插入图片描述

深度学习与神经网络:
在这里插入图片描述

反向传播机制:

在这里插入图片描述

无监督预训练:
在这里插入图片描述

激活函数:
在这里插入图片描述

正则化技术:
在这里插入图片描述

ImageNet比赛中的算法:
在这里插入图片描述

产业界中的深度学习发展:
在这里插入图片描述

三、深度学习典型应用与研究方向

1.深度学习应用之计算机视觉

在这里插入图片描述

图像分类:
在这里插入图片描述

图像分割:
在这里插入图片描述

目标检测:

在这里插入图片描述

目标识别(文本特征):

在这里插入图片描述

目标识别(生物特征):
在这里插入图片描述

目标跟踪:
在这里插入图片描述

图像质量分析与美学评估:
在这里插入图片描述

图像降噪与修复:
在这里插入图片描述

图像增强:

在这里插入图片描述

图像去模糊与超分辨:
在这里插入图片描述

图像翻译与风格化:

在这里插入图片描述

图像生成:

在这里插入图片描述

三维重建(人脸人体):

在这里插入图片描述

三维重建(通用场景):
在这里插入图片描述

图像编辑(人脸人体):
在这里插入图片描述

图像编辑(通用场景):
在这里插入图片描述

视频处理:
在这里插入图片描述

2.深度学习应用之语音处理

在这里插入图片描述

语音分类:

在这里插入图片描述

音频指纹识别:

在这里插入图片描述

语音检索与唤醒:
在这里插入图片描述

语音识别:
在这里插入图片描述

声纹/说话人识别:
在这里插入图片描述

语音质量评测:

在这里插入图片描述

语音增强:
在这里插入图片描述

语音合成:

在这里插入图片描述

语音生成:

在这里插入图片描述

语音合成综合应用:

在这里插入图片描述

3.深度学习应用之自然语言处理

在这里插入图片描述

文本基本任务:
在这里插入图片描述

文本分类与聚类:

在这里插入图片描述

文章标签与摘要提取:
在这里插入图片描述

文本审核与舆情分析:
在这里插入图片描述

机器翻译:
在这里插入图片描述

阅读理解:

在这里插入图片描述

问答系统与聊天机器人:

在这里插入图片描述

搜索引擎:

在这里插入图片描述

知识图谱:
在这里插入图片描述

自然语言生成/文本生成:

在这里插入图片描述

自然语言处理与其他方向的融合:

在这里插入图片描述

4.深度学习应用之推荐系统

在这里插入图片描述

推荐系统的重要性:

在这里插入图片描述

用户画像:

在这里插入图片描述

推荐类型:

在这里插入图片描述

具体应用之广告推荐:

在这里插入图片描述

四、深度学习之神经网络

1.生物学基础与感知器

1.1神经网络的生物学背景

细胞的工作机制:
在这里插入图片描述

神经细胞的工作机制:

在这里插入图片描述
在这里插入图片描述

神经元学说:

在这里插入图片描述

1.2人工神经元与感知器

MP模型:

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

单层感知器:
在这里插入图片描述

单层感知器与线性分类任务:

在这里插入图片描述

权重参数更新方法:
在这里插入图片描述

单层感知器求解:

在这里插入图片描述

单层感知器的缺陷:
在这里插入图片描述

2.多层感知器与神经网络

2.1多层感知器与反向传播

多层感知器:
在这里插入图片描述

多层感知器表达能力:
在这里插入图片描述

神经网络的优化:
在这里插入图片描述

BP神经网络前向与反向过程:

在这里插入图片描述

误差反向传播算法:
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

误差反向传播算法案例;

在这里插入图片描述

非前馈神经网络:

在这里插入图片描述

2.2神经网络的表达能力与局限性

表达能力:
在这里插入图片描述

局限性:
在这里插入图片描述
在这里插入图片描述

3.图神经网络基础

3.1图的应用

为什么需要研究图:
在这里插入图片描述

不同层级的图数据任务:

在这里插入图片描述

3.2图的表示

图的表示:

在这里插入图片描述

图的表示——矩阵表示:
在这里插入图片描述

图的表示——Laplacian矩阵表示:

在这里插入图片描述

3.3图神经网络

图傅里叶变换——频域:

在这里插入图片描述

图滤波器——空域:

在这里插入图片描述

图卷积:

在这里插入图片描述
在这里插入图片描述

什么是图神经网络(GCN):
在这里插入图片描述

图数据的特点:

在这里插入图片描述

图神经网络与CNN对比:
在这里插入图片描述

五、卷积神经网络

1.卷积神经网络发展背景与基本概念

1.1发展背景

视野机制——感受野(Receptive Field):
在这里插入图片描述

视觉机制——方向选择特性:

在这里插入图片描述

视觉机制总结:
在这里插入图片描述

计算机视觉学科诞生:

在这里插入图片描述

Neocognitron:

在这里插入图片描述

Cresceptron:

在这里插入图片描述

卷积神经网络与传统神经网络的学习原理对比:

在这里插入图片描述

1.2卷积神经网络的基本概念

什么是卷积:

在这里插入图片描述

(上面是卷积后的输出,下面是卷积前的输入)

基本概念——数字图像的表示:

RGBA是带透明度的通道表示。
在这里插入图片描述

基本概念——图片卷积:

在这里插入图片描述

基本概念——特征图:

在这里插入图片描述

基本概念——多通道卷积:
在这里插入图片描述

基本概念——填充:
在这里插入图片描述

基本概念——步长:
在这里插入图片描述

卷积结构单元——输入输出大小计算:

在这里插入图片描述

基本概念——池化:
在这里插入图片描述

基本概念——感受野:
在这里插入图片描述

卷积神经网络的重要思想——局部连接:

在这里插入图片描述

卷积神经网络的重要思想——权重共享:
在这里插入图片描述

典型卷积神经网络——LeNets5:

在这里插入图片描述

2.卷积神级网络的反向传播与典型卷积神经网络

2.1卷积神经网络的反向传播

误差反向传播算法(复习):
在这里插入图片描述

卷积神经网络误差反向传播:
在这里插入图片描述

卷积神经网络误差反向传播案例:

(注:这里是卷积,不是矩阵相乘的计算法则)
在这里插入图片描述

在这里插入图片描述

2.2典型卷积神经网络

LeNets系列:

在这里插入图片描述

LeNets5:
在这里插入图片描述

LeNets5工程技巧:

在这里插入图片描述
在这里插入图片描述

这些技巧与当时的背景和计算机结构有关系。

AlexNets:
在这里插入图片描述

AlexNets工程技巧:
在这里插入图片描述

六、循环神经网络(RNN)及其改进

1.循环神经网络(RNN)

卷积神经网络的局限性:

在这里插入图片描述

RNN模型:

在这里插入图片描述

RNN模型的表达:

在这里插入图片描述

RNN模型的优化:

在这里插入图片描述

2.门控时序网络

长短时记忆网络:
在这里插入图片描述

在这里插入图片描述

门控循环单元:
在这里插入图片描述

3.复杂循环神经网络

双向循环网络:

在这里插入图片描述

深度循环神经网络:
在这里插入图片描述

七、深度学习优化

1.深度学习优化之激活函数与参数初始化

1.1什么是激活函数

什么是激活(生物层面):

在这里插入图片描述

激活的简单案例:
在这里插入图片描述

神经网络中的激活函数:
在这里插入图片描述

1.2激活函数的发展

S激活函数(Sigmoid):
在这里插入图片描述

ReLU激活函数:
在这里插入图片描述

ReLU激活函数的改进:

在这里插入图片描述
在这里插入图片描述

近似ReLU激活函数:

在这里插入图片描述

Maxout激活函数:

在这里插入图片描述

自动搜索的激活函数:

在这里插入图片描述

1.3参数初始化

初始化与深度学习:

在这里插入图片描述

什么是好的参数初始化:

在这里插入图片描述

全零初始化与随机初始化:
在这里插入图片描述

标准初始化:
在这里插入图片描述

Xavier初始化:
在这里插入图片描述

MSRA初始化:

在这里插入图片描述

2.深度学习优化之标准化与池化

2.1标准化方法

什么是标准化/归一化:
在这里插入图片描述

归一化的作用:
在这里插入图片描述

Batch Normalization:

在这里插入图片描述

Batch Normalization的好处:

在这里插入图片描述

Batch Normalization的缺点与改进:

在这里插入图片描述

标准化方法的对比:
在这里插入图片描述

自动学习标准化方法:

在这里插入图片描述

2.2池化方法

什么是池化:
在这里插入图片描述

常见池化方法:
在这里插入图片描述

其他池化方法:
在这里插入图片描述

混合池化:

在这里插入图片描述

池化的必要性:

在这里插入图片描述

3.深度学习优化之泛化与正则化

3.1什么是泛化能力

在这里插入图片描述

泛化能力不好带来的问题:

在这里插入图片描述

3.2正则化方法:

在这里插入图片描述

3.2.1显式正则化方法:

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

参数正则化方法:
在这里插入图片描述

3.2.2隐式正则化方法:

在这里插入图片描述

4.深度学习优化之优化目标与评估指标

4.1优化目标

在这里插入图片描述

两类基础任务与常见优化目标:
在这里插入图片描述

4.1.1分类任务损失

分类任务损失——0-1损失:
在这里插入图片描述

分类任务损失——交叉熵损失与KL散度:
在这里插入图片描述
在这里插入图片描述

分类任务损失——softmax损失的理解与改进:

在这里插入图片描述

分类任务损失——Hinge损失:
在这里插入图片描述

4.1.2回归任务损失

回归任务损失——L1/L2距离:
在这里插入图片描述

L1/L2距离的改进:
在这里插入图片描述

4.2评估指标

常见评测指标:
在这里插入图片描述

准确率/召回率/精确度/PR曲线:

在这里插入图片描述

ROC曲线/AUC面积:

在这里插入图片描述

混淆矩阵:
在这里插入图片描述

IoU(Intersection-over-Union):
在这里插入图片描述

AP(Average Precision)/mAP:

在这里插入图片描述
在这里插入图片描述

峰值信噪比PSNR:
在这里插入图片描述

结构一致性相似SSIM:
在这里插入图片描述

5.深度学习优化之最优化

5.1优化概述

最优化概述:
在这里插入图片描述

最优化目标比较:
在这里插入图片描述

鞍点:
在这里插入图片描述

什么是学习率:
在这里插入图片描述

5.2最优化方法

常见深度学习模型优化方法:
在这里插入图片描述

随机梯度下降法:

在这里插入图片描述

动量法:
在这里插入图片描述

Nesterov accelerated gradient法:
在这里插入图片描述

Adagrad法:
在这里插入图片描述

Adadelta与Rmsprop法:
在这里插入图片描述

Adam法:
在这里插入图片描述

Adam算法的改进:
在这里插入图片描述

5.3最优化方法的思考

SGD的改进算法一定更好吗?
在这里插入图片描述

二阶优化方法为何不用?
在这里插入图片描述

6.深度学习优化之数据增强

6.1数据增强概述

什么是数据增强:
在这里插入图片描述

为什么要做数据增强:
在这里插入图片描述

6.2经典数据增强方法

单样本集合变换:
在这里插入图片描述

单样本像素内容变换:
在这里插入图片描述

多样本插值:
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

链接地址:https://github.com/aleju

6.3自动数据增强方法

生成模型:
在这里插入图片描述

Autoaugment:

在这里插入图片描述

八、深度学习开源框架

1.Caffe简介

什么是Caffe:
在这里插入图片描述

Caffe的特点:

在这里插入图片描述

1.1Caffe的安装

依赖库安装(以虚拟环境Ubuntu为例):
在这里插入图片描述

Caffe官网地址链接:http://caffe.berkeleyvision.org/installation.html

NVIDIA驱动安装:
在这里插入图片描述

NVIDIA官网显卡查询地址链接:https://www.nvidia.com/Download/index.aspx

CUDA环境配置:
在这里插入图片描述

NVIDIA官网CUDA环境地址链接https://developer.nvidia.com/cuda-downloads

Caffe编译:
在这里插入图片描述
在这里插入图片描述

caffe配置地址链接:https://github.com/BVLC/caffe
在这里插入图片描述

1.2Caffe的相关使用简介

Caffe的完整目录:
在这里插入图片描述

基础函数:

在这里插入图片描述

Caffe的数据层次与使用流程:

在这里插入图片描述

基本数据格式Blob:

在这里插入图片描述

基本数据格式Layer:

在这里插入图片描述

Caffe中的序列化:

在这里插入图片描述

网络结构定义与可视化:
在这里插入图片描述

netscope网页工具可视化地址链接:http://ethereon.github.io/netscope/#/editor

优化器定义:
在这里插入图片描述

2.Pytorch简介

什么是Pytorch:

在这里插入图片描述

2.1Pytorch的安装

在这里插入图片描述

Pytorch官网地址链接:https://pytorch.org/

2.2Pytorch的相关使用简介

Pytorch完整的API:
在这里插入图片描述

API地址链接:https://pytorch.org/docs/stable/index.html

基本数据格式Tensor:
在这里插入图片描述

Tensor的自动微分autograd:

在这里插入图片描述
在这里插入图片描述

网络结构定义与前向传播:
在这里插入图片描述

优化器定义与反向传播:
在这里插入图片描述

数据接口:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

3.TensorFlow简介

什么是TensorFlow:

在这里插入图片描述

3.1TensorFlow的安装

在这里插入图片描述

TensorFlow官网地址链接:https://www.tensorflow.org

TensorFlow的特点:
在这里插入图片描述

3.2TensorFlow的相关使用简介

TensorFlow的完整API:

TensorFlowAPI介绍(以1.15版本为例):
在这里插入图片描述

TensorFlow的API1.15版本地址链接:https://www.tensorflow.org/versions/r1.15/api_docs/python/tf
在这里插入图片描述

基本数据格式Tensor与算子op:
在这里插入图片描述

Tensor的数据流图:

在这里插入图片描述

Tensor的session会话:
在这里插入图片描述

基本数据格式常量与变量Variable:
在这里插入图片描述

基本数据格式占位符:

在这里插入图片描述

命名空间:
在这里插入图片描述

TensorFlow可视化工具:
在这里插入图片描述

网络结构单元:
在这里插入图片描述

数据接口:
在这里插入图片描述

数据预处理:
在这里插入图片描述

优化器定义:
在这里插入图片描述

九、深度学习模型设计

1.网络深度设计

1.1什么是网络深度

什么是网络深度:
在这里插入图片描述

为什么需要更深的模型:

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

1.2基于深度的模型设计

AlexNet:
在这里插入图片描述

AlexNet工程技巧:
在这里插入图片描述

VGGNet:
在这里插入图片描述

VGGNet特点:
在这里插入图片描述

加深容易出现的问题:

在这里插入图片描述

2.网络宽度设计

2.1什么是网络宽度

什么是网络宽度:
在这里插入图片描述

为什么需要足够的宽度:
在这里插入图片描述

2.2基于宽度的模型设计

经典模型的宽度变化:
在这里插入图片描述

网络宽度设计:
在这里插入图片描述
在这里插入图片描述

模型性能:

网络宽度与深度对比:
在这里插入图片描述

3.卷积核设计

3.1基于参数压缩的卷积设计

1*1卷积:
在这里插入图片描述

1*1卷积典型应用:
在这里插入图片描述

小卷积的使用:
在这里插入图片描述

3.2基于感受野的卷积设计

膨胀卷积(带孔卷积,atrous convolution):
在这里插入图片描述

膨胀卷积设计:

在这里插入图片描述

可变形卷积:
在这里插入图片描述

非局部卷积;
在这里插入图片描述

3.3基于卷积操作的优化

移位网络:
在这里插入图片描述
在这里插入图片描述

加法网络:
在这里插入图片描述
在这里插入图片描述

4.残差网络设计

4.1什么是残差结构

网络加深遇到的优化问题:
在这里插入图片描述

short connect技术:
在这里插入图片描述

short connect早起验证:

在这里插入图片描述

4.2残差网络及有效性理解

在这里插入图片描述

残差网络有效性理解:

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

4.3残差网络的发展

密集残差网络:
在这里插入图片描述

更宽的残差网络:
在这里插入图片描述

分组残差ResNext:
在这里插入图片描述

Dual Path Network:
在这里插入图片描述

加权残差网络:
在这里插入图片描述

预激活残差:
在这里插入图片描述

5.分组网络设计

5.1什么是卷积分组

卷积拆分的使用:
在这里插入图片描述

通道分离卷积的来源:
在这里插入图片描述

GoogLeNet/Inception:
在这里插入图片描述

从Inception到Xception(extreme inception):
在这里插入图片描述

通道分组卷积模型基准MobileNet:
在这里插入图片描述

5.2不同通道分组策略

打乱重组的分组:
在这里插入图片描述

多尺度卷积核分组:
在这里插入图片描述

多分辨率卷积分组:
在这里插入图片描述
在这里插入图片描述

分组+整数的分组卷积;
在这里插入图片描述
在这里插入图片描述

级连分组卷积:
在这里插入图片描述

5.3可学习的分组网络

卷积核配置的学习:

在这里插入图片描述

分组连接的学习:

在这里插入图片描述
在这里插入图片描述

6.动态网络设计

6.1什么是动态网络

什么是动态变化的网络:
在这里插入图片描述

为什么要研究动态网络:
在这里插入图片描述

6.2基于丢弃策略的动态网络

随机深度残差网络:

在这里插入图片描述

模块丢弃残差网络:
在这里插入图片描述

BranchyNet网络:
在这里插入图片描述

Spatially Adaptive Computing Time(SACT):
在这里插入图片描述

6.3基于注意力机制的动态网络

动态卷积(Dynamic Convolution):
在这里插入图片描述

动态空间模型(Dynamic RegionAware Model):

在这里插入图片描述

6.4基于合并策略的动态网络

DeepRebirth:
在这里插入图片描述

RepVGG:

在这里插入图片描述

7.注意力机制设计

7.1注意力机制及其应用

什么是注意力机制:
在这里插入图片描述

注意力机制的典型应用:
在这里插入图片描述
在这里插入图片描述

7.2注意力模型设计

(以计算机视觉方程为例)

空间注意力机制:
在这里插入图片描述

空间注意力模型:
在这里插入图片描述

空间变换网络(spatial transform network):
在这里插入图片描述

通道注意力机制:
在这里插入图片描述

空间与通道注意力机制:
在这里插入图片描述

自注意力机制:
在这里插入图片描述
在这里插入图片描述

级连Attention:
在这里插入图片描述

十、深度生成模型

1.生成模型基础

1.1监督学习与无监督学习
1.1.1监督学习

什么是监督学习:
在这里插入图片描述

监督学习——判别模型:

在这里插入图片描述

监督学习——生成模型:
在这里插入图片描述

生成模型与判别模型的对比:
在这里插入图片描述

1.1.2无监督学习

什么是无监督学习:
在这里插入图片描述

1.2无监督生成模型

什么是无监督学习模型:
在这里插入图片描述

生成模型隐藏空间:
在这里插入图片描述

无监督生成模型分类:
在这里插入图片描述

显式生成模型求解:
在这里插入图片描述

隐式密度模型求解:

在这里插入图片描述

2.自编码器与变分自编码器

2.1自编码器

自编码器(AE):
在这里插入图片描述

自编码器的应用:
在这里插入图片描述

2.2变分自编码器

变分自编码器(VAE):
在这里插入图片描述

变分自编码器理论求解:
在这里插入图片描述
在这里插入图片描述

变分自编码器模型求解:
在这里插入图片描述
在这里插入图片描述

变分自编码器优化目标:
在这里插入图片描述

再参数化策略:
在这里插入图片描述

变分自编码器与自编码器对比:

在这里插入图片描述

AE与VAE的主要局限性:

在这里插入图片描述

3.生成网络基础

3.1什么是生成对抗网络(GAN)

生成对抗网络(GAN)如何生成数据:
在这里插入图片描述

生成对抗原理:
在这里插入图片描述

GAN的核心优化目标:
在这里插入图片描述

D的优化:
在这里插入图片描述

G的优化:
在这里插入图片描述

GAN的理想状态:
在这里插入图片描述

3.2生成对抗网络的训练问题

GAN的训练:
在这里插入图片描述

梯度不稳定与模式崩塌(collapse model)问题:
在这里插入图片描述

梯度消失问题:

在这里插入图片描述

3.3GAN的优化目标设计与改进
3.3.1原始GAN的优化目标的问题

JS散度度量问题:
在这里插入图片描述
在这里插入图片描述

梯度问题:
在这里插入图片描述

3.3.2优化目标的设计与改进

最小二乘损失GAN:
在这里插入图片描述

Energy-based GAN(EBGAN):

在这里插入图片描述

Wasserstein GAN:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

WGAN-GP:
在这里插入图片描述

Boundary Equilibrium GAN(BEGAN):
在这里插入图片描述
在这里插入图片描述

Loss Sensitive GAN:

在这里插入图片描述
在这里插入图片描述
Relativeistic GAN:
在这里插入图片描述

3.4GAN的评估
3.4.1GAN的评估问题

评估指标的要求:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

其他评估指标的要求:
在这里插入图片描述

3.4.2定量评估指标

GAN train/GAN test:
在这里插入图片描述

Inception分数:

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

Inception分数的缺陷与改进:

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

Frechet Inception Distance:

在这里插入图片描述
在这里插入图片描述

Kernel MMD(Kernel Maximum Mean Discrepancy):

在这里插入图片描述

Wasserstein Distance:
在这里插入图片描述

1-最近邻分类器:

在这里插入图片描述

3.5数据生成GAN结构与应用
3.5.1数据生成的应用

图片设计创作:
在这里插入图片描述

数据增强:
在这里插入图片描述

数据仿真:

在这里插入图片描述

视频生成、预测、编辑:

在这里插入图片描述

语音生成:
在这里插入图片描述

文本生成:
在这里插入图片描述

3.5.2图像生成模型结构

基本卷积GAN:
在这里插入图片描述

3.5.2.1从提高分辨率方面:

多尺度与残差GAN模型:

在这里插入图片描述
在这里插入图片描述

3.5.2.2从条件生成方面

条件生成GAN:
在这里插入图片描述

条件GAN模型:
在这里插入图片描述

半监督条件GAN模型:
在这里插入图片描述

属性向量的学习:

在这里插入图片描述

分层属性模型StyleGAN:
在这里插入图片描述
在这里插入图片描述

StyleGAN的应用:

在这里插入图片描述

3.6图像翻译GAN结构与应用
3.6.1图像翻译的应用

风格迁移:
在这里插入图片描述

数据增强:
在这里插入图片描述

经典图像任务:
在这里插入图片描述

内容创作:
在这里插入图片描述

人体图像编辑:

在这里插入图片描述

人脸图像编辑:人脸表情,年龄,妆造,身份编辑,动漫风格化等

3.6.2图像翻译模型
3.6.2.1有监督图像翻译模型

在这里插入图片描述
在这里插入图片描述

3.6.2.2无监督图像翻译模型

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

CycleGAN工程技巧:

在这里插入图片描述
在这里插入图片描述

多域图像翻译模型:

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.cpky.cn/p/10942.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈,一经查实,立即删除!

相关文章

长安链智能合约标准协议第二草案——BNS与DID协议邀请社区用户评审

长安链智能合约标准协议 在智能合约编写过程中,不同的产品及开发人员对业务理解和编程习惯不同,即使同一业务所编写的合约在具体实现上也可能有很大差异,在运维或业务对接中面临较大的学习和理解成本,现有公链合约协议规范又不能完…

软件架构和基于架构的软件开发方法知识总结

一、软件架构定义 软件架构为软件系统提供了一个结构、行为和属性的高级抽象 软件架构是一种表达,使软件工程师能够: (1)分析设计在满足所规定的需求方面的有效性 (2)在设计变更相对容易的阶段,…

Go 1.22 - 更加强大的 Go 执行跟踪

原文:Michael Knyszek - 2024.03.14 runtime/trace 包含了一款强大的工具,用于理解和排查 Go 程序。这个功能可以生成一段时间内每个 goroutine 的执行追踪。然后,你可以使用 go tool trace 命令(或者优秀的开源工具 gotraceui&a…

使用Redis做缓存的小案例

如果不了解Redis,可以查看本人博客:Redis入门 Redis基于内存,因此查询速度快,常常可以用来作为缓存使用,缓存就是我们在内存中开辟一段区域来存储我们查询比较频繁的数据,这样,我们在下一次查询…

基于python+vue智慧社区家政服务系统的设计与实现flask-django-nodejs

论文主要是对智慧社区家政服务系统进行了介绍,包括研究的现状,还有涉及的开发背景,然后还对系统的设计目标进行了论述,还有系统的需求,以及整个的设计方案,对系统的设计以及实现,也都论述的比较…

公司内部局域网怎么适用飞书?

随着数字化办公的普及,企业对于内部沟通和文件传输的需求日益增长。飞书作为一款集成了即时通讯、云文档、日程管理、视频会议等多种功能的智能协作平台,已经成为许多企业提高工作效率的首选工具。本文将详细介绍如何在公司内部局域网中应用飞书&#xf…