近日,来自纽约大学、麻省理工学院和谷歌的研究团队提出了一种创新框架,旨在解决扩散模型推理时间扩展的瓶颈问题。这一突破性研究不仅超越了单纯增加去噪步骤的传统方法,还为提升生成模型性能开辟了新途径。该框架主要从两个维度展开:一是利用验证者的反馈信息,二是采用算法发现更好的噪声候选者。研究团队基于一个预训练的SiT-XL模型,其分辨率为256×256,并保持了250个固定的去噪步骤。
近日,来自纽约大学、麻省理工学院和谷歌的研究团队提出了一种创新框架,旨在解决扩散模型推理时间扩展的瓶颈问题。这一突破性研究不仅超越了单纯增加去噪步骤的传统方法,还为提升生成模型性能开辟了新途径。该框架主要从两个维度展开:一是利用验证者的反馈信息,二是采用算法发现更好的噪声候选者。研究团队基于一个预训练的SiT-XL模型,其分辨率为256×256,并保持了250个固定的去噪步骤。