智象未来发布全新自回归图像编辑框架 VAREdit ，0.7 秒完成高保真图像编辑

近日，智象未来团队正式推出全新自回归图像编辑框架 VAREdit，作为全球首个纯自回归的图像编辑模型，这也是该领域的又一重大突破。该框架不仅能够精准执行用户指令，避免过度修改，还将编辑速度提升至0.7秒级，为实时交互与高效创作开辟新路径。

长期以来，扩散模型在图像编辑中虽能生成高质量画面，但存在局部修改牵动整体结构、编辑不够精准，以及多步迭代效率低等瓶颈。针对这一问题，VAREdit首次将视觉自回归（VAR）架构引入图像编辑任务。它将编辑定义为“下一尺度预测”，逐层生成多尺度残差特征，实现局部精准修改与整体结构保持的统一。同时，团队创新设计了尺度对齐参考（SAR）模块，有效解决尺度匹配难题，进一步提升编辑质量与效率。

在权威基准 EMU-Edit 与 PIE-Bench 测试中，VAREdit在CLIP与GPT等指标全面领先。其中，VAREdit-8.4B在GPT-Balance指标上较ICEdit和UltraEdit分别提升41.5%和30.8%；轻量版VAREdit-2.2B可在0.7秒内完成512×512图像高保真编辑，实现数倍提速。

目前，VAREdit已在 GitHub 和 Hugging Face 平台全面开源。智象未来团队表示，未来将持续探索视频编辑、多模态生成等应用场景，推动AI图像编辑迈入高效、可控、实时的新纪元。

申请创业报道，分享创业好点子。点击此处，共同探讨创业新机遇！

智象未来亮相 WAIC：多模态智能体，重塑创作的未来版图

2025世界人工智能大会（WAIC）期间，智象未来（HiDream.ai）联合创始人兼首席技术官姚霆发表主题演讲，系统阐释了多模态智能体在内容创作领域的技术突破与商业化实践。

标签：

智象未来
智象未来两项研究入选ICCV 2025，发布两项视觉生成突破性成果

近日，智象未来团队两项创新成果入选ICCV2025，分别聚焦于图像生成与视频增强两个方向，全面展示了其在生成式AI技术上的突破与领先。

标签：

智象未来

当前位置：首页 > 科技 > IT业界 > 正文

智象未来发布全新自回归图像编辑框架 VAREdit ，0.7 秒完成高保真图像编辑

相关文章

智象未来亮相 WAIC：多模态智能体，重塑创作的未来版图

智象未来两项研究入选ICCV 2025，发布两项视觉生成突破性成果

热门排行

信息推荐

编辑推荐

阿里一元店是新解“囊”杂货铺？

亿企联解答互联网广告的存在意义何在？

热门标签