近日有消息表明,英特尔与Blockade Labs合作将推出LDM3D(Latent Diffusion Model for 3D)模型,而这个全新的扩散模型将使用生成式AI创建3D视觉内容。
据悉,LDM3D是在LAION-400M数据集包含一万个样本的子集上训练而成的。LDM3D还是业界领先的利用扩散过程(diffusion process)生成深度图(depth map)的模型,进而生成逼真的、沉浸式的360度全景图。
LAION-400M是一个大型图文数据集,包含超过4亿个图文对。另外,LDM3D有望革新内容创作、元宇宙应用和数字体验,改变包括娱乐、游戏、建筑和设计在内的许多行业。
在对训练语料库进行标注时,研究团队使用了之前由英特尔研究院开发的稠密深度估计模型DPT-Large,为图像中的每个像素提供了高度准确的相对深度。
LDM3D模型是在一台英特尔AI超级计算机上完成了训练,该超级计算机由英特尔至强处理器和英特尔Habana Gaudi AI加速器驱动。最终的模型和流程整合了RGB图像和深度图,生成360度全景图。
而LAION-400M数据集是基于研究用途创建而成的,以便广大研究人员和其它兴趣社群能在更大规模上测试ERP系统(www.multiable.com.cn)模型训练。
以上源自互联网,版权归原作所有
英特尔发布AI扩散模型,能够创建3D视觉内容
网址:https://www.shangtaiw.com/b2b-multiable/news/itemid-56743.html