迷车网
当前位置: 首页 > 新车 > 内容

德赛西威:NativeAI开发新范式

时间:2026-07-04 03:08
来源:盖世汽车
阅读量:7930   
摘要:6月29日,央行在公开市场操作中首次开展了3000亿元人民币隔夜逆回购操作,这是该工具的首次实际运用。 值得注意的是,隔夜逆回购操作采用固定利率、数量招标的模式,是典型的价格型工具,但央行此次隔夜逆回购操作最终仅公布了操作量,未披露利率,...

硬件能力的升级与电子电气架构的集中化演进,正在为AI在车端的规模化落地提供坚实土壤。2026年6月25日,德赛西威AI实验室负责人刘怡初在第八届AI智能座舱大会上表示,随着单算力成本快速下降、多模态感知能力日趋成熟,模型与硬件正进入“双向奔赴”的阶段。与此同时,用户对智能座舱的期待已从“可用”向“好用”和“更懂我”跃迁,可持续学习、自我进化、从被动响应走向主动服务,成为Native AI的核心特征。

在他看来,端云协同是这一轮变革的关键路径。云端模型聚焦复杂任务的通用规划能力,端侧则通过场景感知与Skill化封装,成为云端能力的延伸与补充。随着Agent形态从单点功能向持久化、主动化演进,算力架构也从座舱域控走向中央域控与AI Box的柔性扩展,一个三位一体的技术底座正在成型。从“AI Ready”到“AI Native”的范式转变,最显著的区别在于动作空间从封闭集走向开放集,系统具备了自适应与自进化的能力。

围绕这一方向,德赛西威重点推进Agent运行时底座、端侧推理框架与交互仿真平台三大模块的构建。推理框架聚焦多平台适配、上下文压缩与解码加速,在带宽与算力受限的端侧环境中提升推理效率与稳定性;交互仿真平台则通过因果推理与生成式模型,模拟真实座舱交互与长尾场景,为Agent的快速验证与迭代提供支撑。刘怡初表示,德赛西威将持续以开放全栈、快速落地的价值主张,推动AI座舱从炫酷场景走向可规模化交付的工程实践。

德赛西威AI实验室负责人

以下为演讲内容整理:

技术驱动力与需求侧变革:智能座舱为何需要原生AI

从技术驱动力来看,硬件能力的升级使得模型能够从云端逐渐走向端侧。架构从分布式向集中式的演进,以及硬件单算力成本的快速下降,为AI在端侧上车提供了丰厚的技术土壤。与此同时,多模态感知能力的成熟、端云协同能力的增强,以及模型知识密度的不断增加,使得模型能力与硬件能力形成了双向奔赴的趋势。技术拐点已然成熟。

从需求侧来看,汽车被当作移动的智能终端,用户体验的需求被重构。传统座舱对“可用”的要求,已进化到“好用”乃至“更懂用户”的更深层次。德赛西威认为,原生AI的特性主要体现在两点:一是可持续学习,能够自我优化迭代进化,这需要通过底层的记忆模块来实现;二是从被动的单点功能执行,进化到主动的服务。

Agent运行时底座:构建安全高效的端侧中枢

在原生AI开发的技术层面,德赛西威认为有三个重要模块,首先是Agent运行时底座。考虑到新一代智能体拥有更强的权限范围和操作能力,若直接部署在域控或云端均存在一定限制,因此将其部署在AI Box上具备三大优势。第一,能够将座舱域控的关键信号、车控服务等能力进行Skill化集成,但其权限受到编排、审核与审计,不会对整车安全造成威胁。第二,将端侧模型以及舱外感知的能力进行Skill化。第三,AI Box通常仅利用其GPU或NPU进行模型推理,将Agent运行时部署其中,也能充分利用其CPU资源。此外,它还能连接云端大模型进行复杂的任务规划,并将云端生态服务进行Skill化定制,从而起到整体中枢的作用。

在车端,Skill化与PC端存在显著区别,车端有更强烈的安全审核需求。因此,Skill Contract需要具备至少八个层面的协议能力,包括描述前置条件、执行策略以及日志审计,以确保权限审计管理协议在车端执行的安全性。以一个样板场景为例,当用户输入“洒水车过来后关窗”的指令时,云端规划会复用哨兵感知链路的摄像头和AVM输入链路,通过Prompt重配更改端侧感知模型的目标调整和触发条件配置,最终完成自动关窗的任务。整个过程涉及从HMI到HAI的授权与策略,并在确认权限审计与流程状态后,在车端完整执行。用户只需输出指令,系统便复用了哨兵链路和端侧模型的感知能力,实现了端侧模型作为云端模型触手和端侧模态感知补充的功能,同时规避了模型数据出舱的问题。

端侧模型推理框架:突破硬件限制的关键技术

第二个重要模块是端侧模型的推理框架。该框架旨在让模型在不同硬件平台和异构算力架构上稳定运行,并具备多平台多模型调度、上下文压缩编译、资源占用分段式服务化、高优先级任务打断等增强特性。模型层面支持LLM和VLM。对于端侧模型而言,30B参数量的模型是一个较为可用的门槛,其通常采用MoE架构,单次推理激活的参数可能在3B左右。

在一次完整的大模型推理流程中,从Query输入、Encoder编码、Prefill及KV Cache更新,到最终的Decode逐Token循环输出,德赛西威会进行PD计算图分离、KV Cache全生命周期管理,以及在Decode层面采用投机采样等加速技术,以突破硬件带宽限制。该推理框架将大语言模型主干与其他多模态进行了解耦,多种模态实现Token统一后输入主干进行推理,这使得适配不同模态模型时,能够更快地使模型上车。在工程端,该框架能节省首响速度,提升受带宽限制影响的Decode速率,并降低内存占用。

在KV Cache层面,德赛西威主要进行了压缩和复用。压缩通过低比特量化减少RAM占用,这对于控制AI Box的BOM成本至关重要。KV Cache的复用则主要在多轮对话及Agent编排的特定提示词场景下,对大量缓存进行复用和压缩。在多模态流式编码与填充方面,为了减少首响延迟,采用了分块输入的方式,有效降低了TTFT。在上下文压缩方面,结合Agent开发链路,通过微调模型时使用DSL等技术,压缩输出长度和词表,使端侧模型构建Agent时的上下文长度得以精简。在大模型推理的解码阶段,德赛西威主要通过SSD自推理、传统投机解码和块级扩散解码三种方式来突破显存带宽限制。自推理对显存友好,落地成本较低;投机解码需训练好小模型以提高命中率,理论上限更高;块级扩散解码的理论提升范围更大,有望进一步提升吞吐量。

座舱世界模型:交互仿真的新范式

第三个重要模块是Agent开发完成后的交互仿真平台。类比智能辅助驾驶领域从分段式到端到端的技术演进,座舱的交互仿真也需要一种新的测试方法。对于一段式模型,无法像分段式那样在ASR后或TTS前进行文本校准和监测,因此需要一个“座舱世界模型”来模拟用户与座舱之间的交互。它的作用是进行闭环仿真座舱、生成长尾稀有数据以及自动化验证待测模型或Agent。

展望与挑战

德赛西威目前在智能座舱领域的产品矩阵较为全栈和丰富,通过AI大模型、用户交互设计以及EEA架构方案,依托座舱融合的计算方案,融合生态组合形成丰富的产品线。其价值主张是开放全栈、快速实现,旨在与业界同仁共同推动下一代AI座舱的发展。未来,如何在保证安全的前提下,进一步优化端侧模型的性能与效率,以及如何构建更逼真、更全面的座舱世界模型以应对日益复杂的交互场景,将是行业共同面对的挑战。

声明:免责声明:此文内容为本网站转载企业宣传资讯,仅代表作者个人观点,与本网无关。仅供读者参考,并请自行核实相关内容。

江西汽车行业网 | 网站地图 | RSS订阅

江西汽车行业网-未经本站允许,禁止镜像及复制本站。投诉及建议联系邮箱:linghunposhui@sina.com

Copyright © 2018 All Rights Reserved 江西汽车行业网 jx.qchnet.com版权所有

备案号:沪ICP备2022017705号