隐私正在硬件化:NVIDIA 机密计算进入 Apple Private Cloud Compute

Apple 把 PCC 的服务端推理交给 NVIDIA Blackwell 机密计算 GPU,还放到了 Google Cloud 上。这一步把隐私从一句政策承诺,变成可被密码学验证的芯片状态。

隐私正在硬件化:NVIDIA 机密计算进入 Apple Private Cloud Compute
图 / Unsplash

概述

6 月 9 日,NVIDIA 官方博客确认:带机密计算的 NVIDIA GPU 已经在 Apple Private Cloud Compute(PCC)里承担机密推理,而且 PCC 正从 Apple 自己的数据中心扩展到 Google Cloud。这步棋的表层是一桩三方算力合作,Apple、NVIDIA、Google 一起支撑下一代 Apple Intelligence 的服务端推理;但真正值得记下的,是它改变了隐私的兑现方式。

过去十年,云端 AI 的隐私基本靠两样东西支撑:一份隐私政策,加上你对厂商内部流程的信任。这次合作把支点换了。Apple 把 PCC 的推理放到 NVIDIA Blackwell GPU 的机密计算环境里,意味着隐私保证开始从”我们承诺不看你的数据”,变成”在密码学上,任何人都没法看你的数据,包括我们自己”。隐私正在从政策层下沉到芯片层。这是 builder 看待敏感数据处理时,该重新校准的一条基线。

这步棋

按博客的事实:在 Apple 的 WWDC 上揭晓,NVIDIA 正与 Apple 和 Google 合作,用集成进 PCC 硬件安全架构的 NVIDIA Blackwell GPU,支撑部分下一代 Apple Intelligence 功能,并跑在 Google Cloud 上。被这些 GPU 服务的是 Apple Foundation Models,由 Apple 和 Google 共同定制,底层用的是 Gemini 系列模型背后的技术。

技术上,NVIDIA 机密计算给加速 AI 负载提供一层基于硬件的安全保护。它的做法是把负载隔离在可信执行环境(TEE)里,在数据被处理的过程中保护数据;并且让系统能在敏感数据被送到服务器之前,用密码学手段验证这套基础设施没有被篡改。博客把能力拆成四条:硬件根信任(确认系统跑在货真价实、未被篡改的 NVIDIA GPU 上)、加密的通信通道(数据在组件之间流动时受保护)、远程证明(软件在释放敏感数据前先核验平台的安全状态)、以及对加速推理与训练的支持(让隐私敏感的负载不必离开 GPU 性能)。

对用户那一端,NVIDIA 给出的描述很直白:没有任何人,哪怕是系统的构建者,能看到他们的数据、聊天或对话。

真实动机

表面理由是 Apple Intelligence 要扩容。端侧模型跑不动的活,得有高性能的服务端推理接住,这是任何把 AI 塞进十亿级设备的厂商都绕不开的算力账。

但更深的动机是,Apple 必须解决一个看似矛盾的命题:既要把推理外包到自己控制不了的硬件和别人的云上,又不能让隐私招牌掉价。PCC 原本是 Apple 自家数据中心里的隐私堡垒;一旦扩展到 Google Cloud,推理就跑在了别人的机房里。如果隐私还只靠”信任 Apple 的管控”,这条扩展路径根本走不通,因为管控已经不完全在 Apple 手里了。机密计算正好补上这块:把信任从”信任某家公司的流程”,换成”信任一段可被远程证明核验的硬件状态”。这样 Apple 才敢把推理放到 Google Cloud,同时还能对外说隐私没有缩水。

NVIDIA 自己也在博客里点明了更大的图景:这种规模的机密计算被采用,反映了 AI 基础设施的一个更广转向。当 AI 体验把端侧和云端处理混着用,就需要高性能的服务端推理,同时还要维持强隐私和安全保证。换句话说,机密计算是 NVIDIA 想卖给所有云端 AI 玩家的下一层底座,Apple 这单则是它最有说服力的招牌案例。对 NVIDIA 来说,这一步的价值还不止卖硬件:它把 GPU 从”算得快”的部件,升级成”可被信任、可被验证”的部件。在一个所有人都在抢 Blackwell 产能的市场里,NVIDIA 想确立的不只是性能领先,而是连隐私底座都绕不开它。

值得拆开看的是这套机制的因果链。远程证明是其中的关键齿轮:在敏感数据被释放之前,软件先核验平台的安全状态,确认它跑在货真价实、未被篡改的 NVIDIA GPU 上,数据才进得去。这意味着信任不再是一次性的、靠合同维系的承诺,而是每次推理前都重新核验一遍的实时检查。Apple 之所以敢把 PCC 的边界从自家机房推到 Google Cloud,正是因为这条链让”在谁的机房里跑”这个问题,在隐私层面变得不再决定性。

谁被威胁

第一类被动到的,是把隐私当成软件层承诺、靠政策和品牌信任来兜底的服务端 AI 做法。当一个头部玩家开始用硬件可验证的隐私,“我们承诺不看”这种说法的分量就被稀释了。下一个问题自然变成:你能不能拿出远程证明,而不是只给我看一份隐私政策。基线被抬高,跟不上的会显得落后。

第二类是把”隐私护城河”建在数据中心物理管控上的厂商。Apple 这步证明了:不必把推理锁死在自家机房,也能维持隐私主张,关键在芯片层的可验证性而不在机房归谁。这松动了一个旧假设,即强隐私必须配自建数据中心。对那些用”我们的服务器我们说了算”作为差异点的家,这是一记敲打;它们的护城河从”别人进不来我的机房”,被换成了”别人能不能拿出和你一样的硬件证明”。

还有一类容易被忽略的输家,是把隐私当合规成本、能拖就拖的团队。一旦头部产品把硬件可验证隐私做成默认,监管和大客户的预期就会顺势抬高。今天还能用一份隐私政策搪塞过去的采购评审,明年可能就要你出示远程证明凭据。被威胁的不是某个产品,而是”隐私可以晚点再做”这个判断本身。

要说清楚:这不是说所有没上机密计算的产品立刻就不安全。机密计算守的是一类具体威胁,即处理过程中数据被基础设施层(包括运营者自己)窥探或篡改。它不替你解决模型本身泄露、prompt 注入、或下游滥用。被威胁的是”靠承诺维持的隐私叙事”,不是所有别的安全工作。

该忽略什么

别把它读成”Apple 转投 NVIDIA、抛弃自研芯片”。博客说的只是:服务端推理用 NVIDIA Blackwell GPU,跑在 Google Cloud 上,服务的是 Apple 与 Google 共同定制的 Apple Foundation Models。这是 PCC 在特定场景下的算力扩展,不是 Apple 端侧战略或自研路线的转向,原文也完全没有这层意思。

也别把”没人能看你的数据”当成绝对的、覆盖一切的安全保证。机密计算守的是数据在被处理时不被基础设施层窥探,这很实在;但它管不到模型记住并吐出训练数据、管不到应用层的逻辑漏洞、也管不到用户自己授权出去的数据流向。把它当成隐私拼图里关键的一块,而不是终局。

最后,别急着把它当成你明天就能照搬的方案。博客没有给任何性能损耗、成本或可用性的数字,Apple+Google+NVIDIA 这种量级的部署也不是大多数团队的现实。对今天的 builder,正确的动作是把”我的服务端推理能不能做到硬件可验证的隐私”列进选型问题,并去问你的 GPU 云有没有机密计算实例和可交付的远程证明,而不是误以为这条路已经平坦好走。

常见问题

Apple 把推理交给 NVIDIA 和 Google 云,隐私还能信吗?

信任的依据变了,但不是变弱。原来 PCC 把推理放在 Apple 自己的数据中心,你信任的是 Apple 的管控。现在推理扩展到 Google Cloud 的 NVIDIA Blackwell GPU 上,Apple 用机密计算把信任锚定在硬件:数据只在可信执行环境里处理,放数据进去之前先靠远程证明验证平台没被篡改。按官方说法,连系统的构建者都看不到用户数据、聊天或对话。换句话说,你不再需要单方面信任三家公司的内部流程,而是信任一个可被密码学核对的芯片状态。

机密推理会不会拖慢性能?

NVIDIA 的卖点正是不必在隐私和 GPU 性能之间二选一。它把机密计算直接做进 Blackwell GPU,声称支持加速 AI 推理与训练,让隐私敏感的负载留在 GPU 上跑而非退回到更慢的方案。官方博客没有给出具体的性能损耗数字,所以确切代价待实测,但产品定位明确就是冲着把损耗压到可接受去的。

处理敏感数据的应用现在该不该上 TEE?

如果你的服务端推理碰用户的私密内容,这次合作把行业基线抬高了一档:头部玩家已经在用硬件可验证的隐私,而不只是一份隐私政策。短期内自建一套机密计算栈仍然重,但方向清楚。务实做法是先确认你的 GPU 云是否提供机密计算实例、以及能否拿到远程证明凭据交给客户核对,把它列进选型清单,而不是等监管或大客户来逼。

来源

  1. NVIDIA 机密计算助力扩展 Apple Private Cloud Compute / official