德赛西威：NativeAI开发新范式

时间：2026-07-04 03:08

来源：盖世汽车

阅读量：7930

摘要：6月29日，央行在公开市场操作中首次开展了3000亿元人民币隔夜逆回购操作，这是该工具的首次实际运用。值得注意的是，隔夜逆回购操作采用固定利率、数量招标的模式，是典型的价格型工具，但央行此次隔夜逆回购操作最终仅公布了操作量，未披露利率，...

硬件能力的升级与电子电气架构的集中化演进，正在为AI在车端的规模化落地提供坚实土壤。2026年6月25日，德赛西威AI实验室负责人刘怡初在第八届AI智能座舱大会上表示，随着单算力成本快速下降、多模态感知能力日趋成熟，模型与硬件正进入“双向奔赴”的阶段。与此同时，用户对智能座舱的期待已从“可用”向“好用”和“更懂我”跃迁，可持续学习、自我进化、从被动响应走向主动服务，成为Native AI的核心特征。

在他看来，端云协同是这一轮变革的关键路径。云端模型聚焦复杂任务的通用规划能力，端侧则通过场景感知与Skill化封装，成为云端能力的延伸与补充。随着Agent形态从单点功能向持久化、主动化演进，算力架构也从座舱域控走向中央域控与AI Box的柔性扩展，一个三位一体的技术底座正在成型。从“AI Ready”到“AI Native”的范式转变，最显著的区别在于动作空间从封闭集走向开放集，系统具备了自适应与自进化的能力。

围绕这一方向，德赛西威重点推进Agent运行时底座、端侧推理框架与交互仿真平台三大模块的构建。推理框架聚焦多平台适配、上下文压缩与解码加速，在带宽与算力受限的端侧环境中提升推理效率与稳定性；交互仿真平台则通过因果推理与生成式模型，模拟真实座舱交互与长尾场景，为Agent的快速验证与迭代提供支撑。刘怡初表示，德赛西威将持续以开放全栈、快速落地的价值主张，推动AI座舱从炫酷场景走向可规模化交付的工程实践。

德赛西威AI实验室负责人

以下为演讲内容整理:

技术驱动力与需求侧变革:智能座舱为何需要原生AI

从技术驱动力来看，硬件能力的升级使得模型能够从云端逐渐走向端侧。架构从分布式向集中式的演进，以及硬件单算力成本的快速下降，为AI在端侧上车提供了丰厚的技术土壤。与此同时，多模态感知能力的成熟、端云协同能力的增强，以及模型知识密度的不断增加，使得模型能力与硬件能力形成了双向奔赴的趋势。技术拐点已然成熟。

从需求侧来看，汽车被当作移动的智能终端，用户体验的需求被重构。传统座舱对“可用”的要求，已进化到“好用”乃至“更懂用户”的更深层次。德赛西威认为，原生AI的特性主要体现在两点:一是可持续学习，能够自我优化迭代进化，这需要通过底层的记忆模块来实现；二是从被动的单点功能执行，进化到主动的服务。

Agent运行时底座:构建安全高效的端侧中枢

在原生AI开发的技术层面，德赛西威认为有三个重要模块，首先是Agent运行时底座。考虑到新一代智能体拥有更强的权限范围和操作能力，若直接部署在域控或云端均存在一定限制，因此将其部署在AI Box上具备三大优势。第一，能够将座舱域控的关键信号、车控服务等能力进行Skill化集成，但其权限受到编排、审核与审计，不会对整车安全造成威胁。第二，将端侧模型以及舱外感知的能力进行Skill化。第三，AI Box通常仅利用其GPU或NPU进行模型推理，将Agent运行时部署其中，也能充分利用其CPU资源。此外，它还能连接云端大模型进行复杂的任务规划，并将云端生态服务进行Skill化定制，从而起到整体中枢的作用。

在车端，Skill化与PC端存在显著区别，车端有更强烈的安全审核需求。因此，Skill Contract需要具备至少八个层面的协议能力，包括描述前置条件、执行策略以及日志审计，以确保权限审计管理协议在车端执行的安全性。以一个样板场景为例，当用户输入“洒水车过来后关窗”的指令时，云端规划会复用哨兵感知链路的摄像头和AVM输入链路，通过Prompt重配更改端侧感知模型的目标调整和触发条件配置，最终完成自动关窗的任务。整个过程涉及从HMI到HAI的授权与策略，并在确认权限审计与流程状态后，在车端完整执行。用户只需输出指令，系统便复用了哨兵链路和端侧模型的感知能力，实现了端侧模型作为云端模型触手和端侧模态感知补充的功能，同时规避了模型数据出舱的问题。

端侧模型推理框架:突破硬件限制的关键技术

第二个重要模块是端侧模型的推理框架。该框架旨在让模型在不同硬件平台和异构算力架构上稳定运行，并具备多平台多模型调度、上下文压缩编译、资源占用分段式服务化、高优先级任务打断等增强特性。模型层面支持LLM和VLM。对于端侧模型而言，30B参数量的模型是一个较为可用的门槛，其通常采用MoE架构，单次推理激活的参数可能在3B左右。

在一次完整的大模型推理流程中，从Query输入、Encoder编码、Prefill及KV Cache更新，到最终的Decode逐Token循环输出，德赛西威会进行PD计算图分离、KV Cache全生命周期管理，以及在Decode层面采用投机采样等加速技术，以突破硬件带宽限制。该推理框架将大语言模型主干与其他多模态进行了解耦，多种模态实现Token统一后输入主干进行推理，这使得适配不同模态模型时，能够更快地使模型上车。在工程端，该框架能节省首响速度，提升受带宽限制影响的Decode速率，并降低内存占用。

在KV Cache层面，德赛西威主要进行了压缩和复用。压缩通过低比特量化减少RAM占用，这对于控制AI Box的BOM成本至关重要。KV Cache的复用则主要在多轮对话及Agent编排的特定提示词场景下，对大量缓存进行复用和压缩。在多模态流式编码与填充方面，为了减少首响延迟，采用了分块输入的方式，有效降低了TTFT。在上下文压缩方面，结合Agent开发链路，通过微调模型时使用DSL等技术，压缩输出长度和词表，使端侧模型构建Agent时的上下文长度得以精简。在大模型推理的解码阶段，德赛西威主要通过SSD自推理、传统投机解码和块级扩散解码三种方式来突破显存带宽限制。自推理对显存友好，落地成本较低；投机解码需训练好小模型以提高命中率，理论上限更高；块级扩散解码的理论提升范围更大，有望进一步提升吞吐量。

座舱世界模型:交互仿真的新范式

第三个重要模块是Agent开发完成后的交互仿真平台。类比智能辅助驾驶领域从分段式到端到端的技术演进，座舱的交互仿真也需要一种新的测试方法。对于一段式模型，无法像分段式那样在ASR后或TTS前进行文本校准和监测，因此需要一个“座舱世界模型”来模拟用户与座舱之间的交互。它的作用是进行闭环仿真座舱、生成长尾稀有数据以及自动化验证待测模型或Agent。

展望与挑战

德赛西威目前在智能座舱领域的产品矩阵较为全栈和丰富，通过AI大模型、用户交互设计以及EEA架构方案，依托座舱融合的计算方案，融合生态组合形成丰富的产品线。其价值主张是开放全栈、快速实现，旨在与业界同仁共同推动下一代AI座舱的发展。未来，如何在保证安全的前提下，进一步优化端侧模型的性能与效率，以及如何构建更逼真、更全面的座舱世界模型以应对日益复杂的交互场景，将是行业共同面对的挑战。

声明：免责声明：此文内容为本网站转载企业宣传资讯，仅代表作者个人观点，与本网无关。仅供读者参考，并请自行核实相关内容。

报价36.4亿欧元！舍弗勒要约收

最强混动荣威D7DMH摘得混动挑

1-8月空气悬架配套排名：自主份

德赛西威：NativeAI开发新范式