LLaMA-Mesh是将大型语言模型(LLMs)与3D网格生成统一起来的方法。
LLaMA-Mesh利用LLMs中的空间知识,从文本源中获取,并实现对话式3D生成和网格理解。
LLaMA-Mesh通过将3D网格表示为纯文本,实现了与LLMs的直接集成。
LLaMA-Mesh通过监督微调数据集,使LLMs能够从文本提示中生成3D网格,并理解和解释3D网格。
LLaMA-Mesh是首个证明LLMs可以通过微调获得复杂空间知识以进行基于文本的3D网格生成的工作。
LLaMA-Mesh在保持强大的文本生成性能的同时,实现了与从头开始训练的模型相当的网格生成质量。
参考链接:
https://arxiv.org/pdf/2411.09595
https://github.com/nv-tlabs/LLaMa-Mesh
https://huggingface.co/spaces/Zhengyi/LLaMA-Mesh