type
status
date
slug
summary
tags
category
icon
password
论文网站:arxiv.org
代码网站:
 
算法流程图:
notion image
图 1. 带有多形态的提议数据集压缩框架示意。在固定大小的压缩数据存储下,多形态合成用于训练模型的多份数据。我们通过使用可微分的多形态函数,以端到端的方式优化压缩数据。
 
算法框架:
notion image
 
Multi-Formation:提出“多形态合成数据”框架(关键创新)
传统 dataset condensation 直接优化少量高分辨率的合成数据,容易受“存储限制”困住。 本论文提出:Multi-Formation(多形态)方法:在固定存储预算下增加 synthetic data 数量。
方法: 对合成图像 S 做 deterministic 的分块 + 上采样(如 bilinear upsampling),从 S 生成更多的 synthetic data f(S)。 原始只有 n 张合成图 → 变成 n′ 张 (n′ > n),但存储大小不变。
效果:
能显著降低 gradient matching loss
regularize 图像,使其更自然
在相同存储下提高数据多样性
训练模型的效果提升 10–20%
这是本文的最大创新点。
Dataset Condensation with Differentiable Siamese AugmentationGeneralizing Dataset Distillation via Deep Generative Prior
Loading...