(资料图片)
英特尔研究院于6月21日宣布,与Blockade Labs合作发布了一种名为LDM3D(Latent Diffusion Model for 3D)的全新扩散模型。这一模型利用生成式AI创建3D视觉内容,具有很高的实用性和逼真度。 LDM3D是业界领先的利用扩散过程(diffusion process)生成深度(depth)图的模型。通过该模型生成的、逼真的沉浸式360度全景图,有望彻底颠覆内容创作、元宇宙应用和数字体验等领域,改变包括娱乐、游戏、建筑和设计在内的众多行业。 据了解,LDM3D在LAION-400M数据集的一个包含一万个样本的子集上进行训练而成。LAION-400M是一个大型图文数据集,包含超过4亿个图文对。在对训练语料库进行标注时,研究团队使用了之前由英特尔研究院开发的稠密深度估计模型DPT-Large,为图像中的每个像素提供了高度准确的相对深度。LAION-400M数据集是为研究目的而创建的,以便广大研究人员和其他兴趣社群能在更大规模上测试模型训练。 LDM3D模型在一台英特尔AI超级计算机上完成了训练,该计算机由英特尔至强处理器和英特尔Habana Gaudi AI加速器驱动。最终的模型和处理流程整合了RGB图像和深度图,生成了360度全景图,实现了沉浸式体验。