
前沿资讯
1747650698更新
0
谷歌研究团队联合以色列特拉维夫大学等机构共同发布了一项名为LightLab的图像编辑技术。这项技术基于扩散模型,能够对图像中的光源进行精细的参数化控制,为摄影后期处理、动画制作等领域带来了全新的可能。
LightLab的核心能力在于实现对图像光源的多维度精准调控。它可以对光源的强度进行精确调整,既能将光源完全关闭,也能将其调至超现实的强光状态,同时确保阴影和反射效果符合物理规律。能够自由改变光源的色温或自定义RGB颜色,还可以独立控制场景的环境光照强度,模拟从阴天到黄昏等不同的整体氛围,并且支持与局部光源进行协同编辑。此外,该技术支持连续光影编辑,在同一场景中按顺序关闭环境光、开启局部光源并调整颜色,整个过程中反射和阴影的变化都能保持物理合理性。
在技术实现方面,研究团队构建了一个包含真实RAW照片和合成图像的混合数据集。其中真实照片有600对,由手机和三脚架拍摄,记录了开关光源前后的场景变化,这些照片包含了丰富的真实场景细节。同时,利用Blender等工具生成了60万张合成图像,涵盖20种室内场景,并对光源位置、强度和颜色进行随机化处理,增加了数据的多样性。这种真实数据与合成数据相结合的方式,既避免了模型训练的域偏移问题,又增强了物理真实性,为精确控制光源奠定了数据基础。
在此基础上,基于Stable Diffusion-XL架构,通过输入图像、深度图、光源掩码等空间条件环境光参数、色调映射策略等全局条件对扩散模型进行微调。在微调过程中,将不同类型的条件信息合理地融入模型,实现对光源参数的显式控制,使得模型能够准确地根据用户设定的参数对图像光源进行调整。
实验结果表明,在定量指标上,LightLab的PSNR(峰值信噪比)和SSIM(结构相似性指数)远超OmniGen、RGB↔X等基线方法,尤其在二进制光源开关任务中误差更低。在用户研究中,包含3200次判断的结果显示,LightLab的偏好率高达83%-89.3%,用户认为其光影变化更为自然,物理一致性更强。此外,LightLab不仅适用于室内场景,在户外图像、卡通风格图像等非真实感动画中也能实现可信的光影编辑,甚至支持插入虚拟光源。
LightLab具有广泛的应用场景。在摄影后期处理中,无需重新拍摄即可调整照片中的光源效果。在动画制作领域,能够在连续帧中保持光影一致性,支持动态光源移动,提升动画的真实感。在虚拟内容生成方面,可通过合成数据插入虚拟光源,为AR/VR场景快速生成定制化光照条件,减少3D渲染的复杂度。
不过,LightLab也存在一定的局限性。由于训练数据主要集中于室内场景,对于蜡烛火焰等特殊光源的编辑效果可能会受限于数据偏差。同时,基于消费级设备的拍摄流程,难以实现物理单位的精确重打光。未来,研究团队计划探索无配对数据的模型训练方法,并将技术拓展至室外复杂光照环境。
参考资料:https://arxiv.org/abs/2505.09608