智元发布全国首个通用具身基座模型ViLLA，开启具身智能新纪元

发布时间：2025-03-10 13:36:33

2025年3月10日，国内人工智能领军企业智元科技在北京国家会议中心正式发布"智元启元大模型（Genie Operator-1）"，这是我国首个面向复杂物理世界的通用具身智能基座模型。该成果突破性地提出"Vision-Language-Latent-Action（ViLLA）"融合架构，标志着中国在通用人工智能领域取得重大技术跃迁。

图片来源：智元机器人

重构人机交互范式 ViLLA架构实现多模态深度融合

区别于传统单模态大模型，启元模型通过三层异构神经网络构建感知决策闭环：视觉模块采用动态注意力机制处理环境信息，语言引擎集成多轮对话上下文记忆，而独创的Latent Action空间则将抽象指令转化为可执行的动作序列。在测试中，模型展现出跨场景任务迁移能力——面对"整理杂乱书桌"指令时，系统能自主规划路径、识别物品类别并完成精准抓取摆放，全程无需人工干预。

全场景落地加速智能终端迎来革命性升级

基于启元基座开发的具身智能终端已进入规模化测试阶段。在工业质检领域，搭载该模型的机械臂可将零件缺陷识别准确率提升至99.7%，同时将操作效率提高3倍；智能家居系统中，家庭服务机器人可通过三维语义理解实现"擦桌子时避开装饰品"等精细化动作。更值得关注的是医疗护理场景，经过专业数据训练的机器人已能协助完成导诊分诊、康复器械操作等专业任务，为老龄化社会提供解决方案。

产学研联动构建生态壁垒

智元科技联合清华大学、中科院自动化所等机构成立"具身智能联合实验室"，计划年内开放百万级参数级的开源训练框架。公司CEO李峰透露："我们将持续投入超20亿元研发资金，年内推出支持多国语言、适配主流硬件的开发者套件，与合作伙伴共建具身智能产业生态。"随着国家"新一代人工智能发展规划"的深入推进，智元科技此次突破或将加速我国在通用人工智能赛道上的国际竞争力。

（责编： admin）

免责声明：本文为转载，非本网原创内容，不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

如有疑问请发送邮件至：goldenhorseconnect@gmail.com

智元发布全国首个通用具身基座模型ViLLA，开启具身智能新纪元

相关阅读

最新文章

百科问答推荐