阿里通义实验室LHM技术实现从单图像的快速3D 人体重建与动画生成
近日,阿里通义实验室一项名为 LHM(大型可动画人体重建模型)的创新技术在3D 人体重建领域取得了重大突破,为该领域带来了全新的发展方向和应用前景。
从单个图像进行可动画的3D 人体重建一直是一个极具挑战性的任务,存在着几何、外观和变形分离的模糊性等问题。当前的最新研究进展大多集中在静态人体建模方面,并且这些方法往往依赖于合成的3D 扫描进行训练,这在很大程度上限制了它们在实际场景中的泛化能力。同时,基于优化的视频方法不仅需要严格控制捕获条件,而且计算过程极为密集,难以满足实际应用的需求。
针对这些难题,LHM 模型应运而生。该模型创新性地采用了多模态变换器架构,通过强大的注意机制,能够有效地对人体位置特征和图像特征进行编码。这一架构使得 LHM 不仅能够准确地重建人体的几何形状,还能详细地保存服装的几何形状和纹理,为用户呈现出更加真实、细腻的3D 人体模型。
值得一提的是,LHM 还提出了头部特征金字塔编码方案。这一方案通过聚合头部区域的多尺度特征,进一步提升了模型对人体头部细节的捕捉能力,使得生成的3D 人体模型在头部表现上更加逼真。在实际应用中,LHM 展现出了惊人的效率,能够在短短几秒钟内生成合理动画的人体,并且无需进行复杂的后期处理,大大节省了时间和人力成本。
经过大量的实验验证,LHM 在重建精度和泛化能力方面均优于现有的方法。无论是在复杂的场景中,还是在不同的光照条件下,LHM 都能够稳定地输出高质量的3D 人体重建结果。
地址:https://ift.tt/2CQzJO6
空空如也!