Diffusion 模型
创始人
2025-05-30 09:54:41

 Diffusion是一种深度生成模型(无监督生成模型),其属于机器学习-无监督学习-概率模型-生成模型。

概率模型是为了求得数据的后验概率P(Y|X)或者联合概率P(X,Y)

对于监督学习而言,判别模型主要是求后验概率,即根据输入的特征X去确定标签信息Y。

生成模型主要是为了求得联合概率,对于X,求出X与不同标记之间的联合概率分布,取其中大的。

举个例子

假如我们需要解决一个分类问题,红色小三角使我们需要分类的对象。

对于判别模型来说,判别模型训练出来的是这条决策边界,根据这红色小三角离决策边界的距离判定红色小三角属于哪一个类别。

对于生成模型来说,学习到的是概率分布,图中我们有两个类,我们分别求红色小三角与这两个类的联合概率分布,红色小三角属于联合概率分布大的那个类别。

生成模型意味着对输入特征和标签信息的联合分布进行建模,无监督学习意味着不存在标签信息。

在无监督生成模型中,是对输入特征的概率密度函数建模,训练得到的概率模型应该接近于输入特征的概率密度函数。

我们可以从概率模型中采样来生成样本。

对于无监督生成模型来说,如何进行概率密度估计,训练出概率模型、如何采样生成样本,是需要解决的两个难点。

由此,我们引入隐空间和隐变量的概念

例如,在数学中,我们需要用a估计b,用a估计b很困难,但是用c估计b很简单,用a估计c很容易,所以我们可以通过a来估计c,再用c估计b,以此达到用a估计b的目的。

此处的c,类似我们深度学习中经常提到的隐变量。

假如我们的无监督生成模型需要对一张图像进行建模,对原始数据直接进行建模是非常困难的。所以我们可以把原始数据转换成另外一组好进行建模的数据,即把原始数据转为隐变量。

隐空间,顾名思义是隐变量所在的空间。

 以上图中的有两把椅子和一张桌子,是什么让椅子相似呢?

椅子有靠背,桌子没靠背,椅子没抽屉,桌子有等等这样的特征

这些特征可以让我们的模型学习出来,并表示在隐空间中。

我们将数据压缩、转换到隐空间中表示的过程,是剔除数据冗余信息的过程。

在这个实例中,椅子、桌子的颜色信息就是冗余信息,会被剔除,只有比较重要的特征会被存储在隐空间的表示中。

在机器学习中,数据被压缩为学习有关的数据点的重要信息。

 在隐空间中,相似的挨得近,不相似的挨得远。两个椅子挨得近,桌子和他们离的远。

除了判别数据的相似性,在隐空间中采样,还可以生成新的数据。我们可以通过在潜在空间上进行插值,并使用模型解码器将潜在空间表示重构为二维图像,并以与原始输入相同尺寸来生成不同的面部结构

 

以下为生成模型的基本结构。 

未完待续

视频链接

【简单易懂diffusion模型讲解 - 从前置知识深度生成模型 隐变量 VAE开始】 https://www.bilibili.com/video/BV1re4y1m7gb/?share_source=copy_web&vd_source=9ee2521627a11b87c06e3907e194e1ab

 【简单易懂Diffusion模型综述 - 基础算法详解】 https://www.bilibili.com/video/BV1TP4y1Q7qJ/?share_source=copy_web&vd_source=9ee2521627a11b87c06e3907e194e1ab

 【【10分钟】了解香农熵,交叉熵和KL散度】 https://www.bilibili.com/video/BV1JY411q72n/?share_source=copy_web&vd_source=9ee2521627a11b87c06e3907e194e1ab


事件信息量和事件发生的概率是成反比的,事件发生概率越小,信息量越大。

熵表述了一个概率分布的平均信息量。

交叉熵描述了从估计概率分布的角度,对真实概率分布的平均信息量的估计值。

KL散度定量描述了两个概率分布之间的区别,并且其是概率分布模型中的一个基础概念,对推导模型的损失函数,比如交叉熵损失函数,具有重要意义。

相关内容

热门资讯

【实验报告】实验一 图像的... 实验目的熟悉Matlab图像运算的基础——矩阵运算;熟悉图像矩阵的显示方法࿰...
MATLAB | 全网最详细网... 一篇超超超长,超超超全面网络图绘制教程,本篇基本能讲清楚所有绘制要点&#...
大模型落地比趋势更重要,NLP... 全球很多人都开始相信,以ChatGPT为代表的大模型,将带来一场NLP领...
Linux学习之端口、网络协议... 端口:设备与外界通讯交流的出口 网络协议:   网络协议是指计算机通信网...
kuernetes 资源对象分... 文章目录1. pod 状态1.1 容器启动错误类型1.2 ImagePullBackOff 错误1....
STM32实战项目-数码管 程序实现功能: 1、上电后,数码管间隔50ms计数; 2、...
TM1638和TM1639差异... TM1638和TM1639差异说明 ✨本文不涉及具体的单片机代码驱动内容,值针对芯...
Qt+MySql开发笔记:Qt... 若该文为原创文章,转载请注明原文出处 本文章博客地址:https://h...
Java内存模型中的happe... 第29讲 | Java内存模型中的happen-before是什么? Java 语言...
《扬帆优配》算力概念股大爆发,... 3月22日,9股封单金额超亿元,工业富联、鸿博股份、鹏鼎控股分别为3.0...
CF1763D Valid B... CF1763D Valid Bitonic Permutations 题目大意 拱形排列࿰...
SQL语法 DDL、DML、D... 文章目录1 SQL通用语法2 SQL分类3 DDL 数据定义语言3.1 数据库操作3.2 表操作3....
文心一言 VS ChatGPT... 3月16号,百度正式发布了『文心一言』,这是国内公司第一次发布类Chat...
CentOS8提高篇5:磁盘分...        首先需要在虚拟机中模拟添加一块新的硬盘设备,然后进行分区、格式化、挂载等...
Linux防火墙——SNAT、... 目录 NAT 一、SNAT策略及作用 1、概述 SNAT应用环境 SNAT原理 SNAT转换前提条...
部署+使用集群的算力跑CPU密... 我先在开头做一个总结,表达我最终要做的事情和最终环境是如何的,然后我会一...
Uploadifive 批量文... Uploadifive 批量文件上传_uploadifive 多个上传按钮_asing1elife的...
C++入门语法基础 文章目录:1. 什么是C++2. 命名空间2.1 域的概念2.2 命名...
2023年全国DAMA-CDG... DAMA认证为数据管理专业人士提供职业目标晋升规划,彰显了职业发展里程碑及发展阶梯定义...
php实现助记词转TRX,ET... TRX助记词转地址网上都是Java,js或其他语言开发的示例,一个简单的...
【分割数据集操作集锦】毕设记录 1. 按要求将CSV文件转成json文件 有时候一些网络模型的源码会有data.json这样的文件里...
Postman接口测试之断言 如果你看文字部分还是不太理解的话,可以看看这个视频,详细介绍postma...
前端学习第三阶段-第4章 jQ... 4-1 jQuery介绍及常用API导读 01-jQuery入门导读 02-JavaScri...
4、linux初级——Linu... 目录 一、用CRT连接开发板 1、安装CRT调试工具 2、连接开发板 3、开机后ctrl+c...
Urban Radiance ... Urban Radiance Fields:城市辐射场 摘要:这项工作的目标是根据扫描...
天干地支(Java) 题目描述 古代中国使用天干地支来记录当前的年份。 天干一共有十个,分别为:...
SpringBoot雪花ID长... Long类型精度丢失 最近项目中使用雪花ID作为主键,雪花ID是19位Long类型数...
对JSP文件的理解 JSP是java程序。(JSP本质还是一个Servlet) JSP是&#...
【03173】2021年4月高... 一、单向填空题1、大量应用软件开发工具,开始于A、20世纪70年代B、20世纪 80年...
LeetCode5.最长回文子... 目录题目链接题目分析解题思路暴力中心向两边拓展搜索 题目链接 链接 题目分析 简单来说࿰...