成果名称 完成单位 报告编号
  基于AIGC的高效低成本数字模型生成方法 中影年年(北京)科技有限公司 高科评字 [2025] 第8号
成果简介
1.多模态输入与语义理解
输入适配与语义对齐技术:专利《基于 AIGC 的机器人情感识别方法、系统及存储介质》(ZL202411110518)等相关技术,支持文本、语音、图像等多模态输入。通过预训练的语言模型(BERT、GPT)与视觉模型(CLIP)提取语义特征,构建 “文本 - 空间” 映射网络,将多模态输入转换为统一的语义向量,并与 3D 空间拓扑结构对齐,使模型能精准理解用户意图。在实际应用中,当用户输入语音指令创建一个奇幻风格的 3D 角色时,系统借助该技术准确识别语音内容,提取语义特征,将其转化为与 3D 空间对应的语义向量,为后续生成符合要求的 3D 模型奠定基础。
2.空间 - 语义联合建模
图神经网络(GNN)与扩散模型(Diffusion Model)协同技术:《基于 AIGC 生成 5D 数字人的训练方法、系统及介质》(ZL202411919435.6)等专利涉及的技术,将 3D 模型表示为图结构,通过 GNN 学习空间拓扑特征,Diffusion Model 采用 “去噪扩散” 机制生成 3D 网格 / 体素模型。以数字人模型生成为例,GNN 分析数字人身体各部分的几何关系和空间拓扑结构,Diffusion Model 依据这些特征和文本语义向量,逐步减少噪声,生成高精度、细节丰富且符合语义要求的数字人 3D 模型,有效解决传统 GAN 模式塌陷和生成质量不稳定的问题。
3.高质量数据驱动训练
数据增强与领域微调技术:基于公司自有百万级标准化 3D 数字资产库,运用专利技术通过几何变换、纹理迁移生成高精度训练数据。《基于 AIGC 的数字人与全息展示方法、系统及存储介质》(ZL202510001615.4)等相关技术在数据增强方面发挥作用,如对 3D 模型进行旋转、缩放、平移等几何变换,以及替换不同纹理,增加数据多样性。针对影视、工业、教育等细分场景,采用迁移学习技术对预训练模型进行微调,确保生成模型满足专业精度要求。在工业领域,对机械产品 3D 模型训练时,利用数据增强技术扩充数据,再通过领域微调使模型生成符合工业级精度标准的产品模型。
4.轻量化与高效推理
模型压缩与分布式训练技术:采用知识蒸馏与量化技术,将大模型压缩至轻量化版本,相关技术在专利中有所体现。通过知识蒸馏将大模型知识传递给小模型,量化技术降低模型参数精度,减少计算量和存储需求,适配国产算力平台。同时,基于 “东数西算” 战略,利用分布式算力资源优化训练效率。《基于 AIGC 的机器人情感识别方法、系统及存储介质》(ZL202411110518)等专利技术保障了分布式训练的高效进行,如将训练任务分配到多个计算节点并行计算,缩短单次训练周期,提高模型训练和推理效率。
5.合规与安全技术
数据脱敏、加密传输与安全评估技术:嵌入数据脱敏、加密传输与访问控制模块,依据相关专利技术实现对训练数据的匿名化处理。采用国密算法对 3D 模型与用户输入进行加密存储与传输,确保数据安全。嵌入合规性检测模块,满足《生成式人工智能服务管理暂行办法》的安全评估要求。在处理用户上传的包含个人信息的 3D 扫描数据时,利用数据脱敏技术对敏感信息进行模糊化或替换处理,通过加密传输技术保障数据在网络传输过程中的安全,同时借助合规性检测模块确保整个处理过程符合法规要求。
合作完成单位
1.中影年年(北京)科技有限公司  
成果完成人
1.郭勇  2.苑朋飞  3.庄麒达  4.彭德淑  5.周浩  6.赵宏伟  7.张旭  
成果评价情况
  评价单位: 报告编号: 高科评字 [2025] 第8号 评价日期: 2025-04-21
评价意见
该项目在3D数字模型生成方面达到国际先进水平
WeChat 微信公众号
WeChat
Hotline 服务热线
Hotline