卓驭的端到端世界模型训练方式同样令人瞩目。他们采用大模型典型的预训练+后训练模式,实现了“硬件无关”的平台化训练。这意味着,针对不同传感器构型和芯片类型,只需训练一个模型,即可轻松部署到不同的硬件构型上,大大提高了效率和灵活性。
IT之家 3 月 19 日消息,卓驭 AI 首席陈晓智昨日在 NVIDIA GTC 2025 发表主题演讲《基于端到端世界模型的生成式智驾体验》,分享了卓驭在端到端智能驾驶技术上的近期进展,并公布了卓驭基于端到端世界模型的全新一代智能驾驶功能 —— 可支持自然语言交互的个性化生成式智驾方案 GenDrive 。
原始"Attention Is All You Need"论文中提出的标准Transformer架构最初设计用于处理离散输入和输出序列标记 ...
阿里妹导读本文希望围绕“Transformer到底是解决什么问题的”这个角度,阐述NLP发展以来遇到的关键问题和解法,通过这些问题引出Transformer实现原理,帮助初学者理解。近期小组内发起AI技术的学习分享,单看 ...
鞭牛士 3月4日消息,智谱官方刚刚宣布推出「智谱2025开源年」的第一个模型:首个支持生成汉字的开源文生图模型——CogView4。据介绍,CogView4 在 DPG-Bench 基准测试中的综合评分排名第一,在开源文生图模型中达到 ...
在长视频内容检索的研究领域中,用户常面临时间线导航效率低下的困境。传统的视频检索方法采用逐帧分析的线性处理策略,如同逐帧查字典,效率低下且泛化能力差。而现有的多模态大模型,虽然泛化能力更强,但是效果仍然差强人意。
回顾宇树G1机器人的发布历程,这款人形机器人于2024年5月正式亮相,定价9.9万元起。宇树科技将其定位为“人形智能体、AI化身”,并强调其支持模仿和强化学习驱动。从外观设计上看,宇树G1机器人身高约127厘米,体重约35公斤,拥有23至43个关节电 ...
在 ICLR 2025 中,来自南洋理工大学 S-Lab、上海 AI Lab、北京大学以及香港大学的研究者提出的 基于 Flow Matching 技术的全新 3D 生成框架 GaussianAnything ...
新京报贝壳财经讯(记者罗亦丹)3月4日,智谱发布了“2025开源年”的第一个模型:首个支持生成汉字的开源文生图模型——CogView4,其在DPG-Bench基准测试中的综合评分排名第一,该模型也是首个遵循Apache ...
由于中国AI企业DeepSeek开发出了高性能的低成本大语言模型,2025年1月下旬,英伟达(NVIDIA)等美国高科技公司的股价暴跌。“DeepSeek冲击”这一说法,可能模仿了前苏联在1957年成功发射全世界第一颗人造卫星“斯普特尼克1号(Spu ...