1.AI 的瓶颈不是模型能力是电力基础设施2.模型不是产品Orchestration才是关键3.30人团队可以创造高盈利公司4.AI Agent 带来的收入最终会超过广告收入一、为什么进攻才是正确答案1.1 “赢的渴望胜于失败的恐惧”Aravind 被问及你更被失败的恐惧驱动还是被胜利的渴望驱动时他的回答是后者原因是“我一无所有。我从未想象过自己能做成这些事情。我的人生已经超越了任何想象。”1.2 永远保持进攻姿态信奉的原则永远不要防守全力以赴持续进攻当被问到今天你在哪些方面不够激进时他承认早期在社交媒体上对 Google 的批评过于高调但那是刻意的策略——因为Google 根本不在乎一个小公司的批评这反而帮助 Perplexity 获得了关注1.3 AI 领域没有舒适区“在 AI 领域没有人能坐享其成。即使是 Anthropic如果他们认为 Claude Code 已经赢了6-12 个月后他们可能就不存在了”这是这个领域令人不舒服的事实——没有谁能放松。二、Perplexity 如何改变了 GoogleAravind 表示“Perplexity 改变 Google.com 的程度超过了 Google 历史上任何产品经理所做的。”他指出现在 Google 的 AI Mode看起来和 Perplexity 一模一样字体引用格式行内文本和超链接建议的后续问题整个体验都在模仿 Perplexity但质量仍然不如2.2 为什么这是好事他并不为此感到不快原因在于2024年底早就预料到这会发生答案引擎只是起点不是终点前沿在转移——从回答问题到替你工作“AI 的前沿不再是回答问题而是真正出去为你完成任务。”用户订阅 Perplexity Pro 或 Max不是为了获取答案而是为了获得复杂的研究报告使用能代替他们执行任务的 Agent三、真正的瓶颈电力与基础设施3.1 电力是第一瓶颈Aravind 反复强调当今最大的问题是电力短缺。建设一个数据中心不仅仅是购买芯片需要购置或租赁土地与电力供应商/电网合作处理冷却系统获得各种许可所有这些都比购买芯片慢得多。3.2 数据中心建设的物理限制他提到40% 的数据中心项目因为公众阻力而无法推进Blackwell架构的模型如 Llama已经很可怕Rubin 架构明年会更强大模型训练需要百万级 GPU“物理基础设施的建设时间总是限制前沿能力。”3.3 公众阻力来自哪里他认为数据中心的阻力被误导了人们错误地认为数据中心消耗大量水资源电费上涨归咎于数据中心建设实际原因是多方面的就业担忧、财富不平等恐惧、环境问题等这导致电力成为持续的瓶颈。3.4 未来的瓶颈预测当被问及三年后我们没讨论的瓶颈是什么时他的回答是电力将继续是瓶颈。除非数据中心的建设方式发生根本性变化否则这种情况不会改变。四、编排问题AI 的真正价值所在4.1 模型不再是产品Greg Brockman 最近发推说模型不再是产品Aravind 完全同意这个观点“如果你只是一个模型 Token 的转售商你没有业务。因为模型会被商品化。”即使你是模型构建者如果你只是转售原始模型输出也没有业务。4.2 Agent Harness以 Codex 或 Perplexity Computer 为例它们是编排系统将模型与 Agent 工具结合定义 Agent 循环如何运行管理技能、子 Agent 和连接器决定访问哪些工具没有 Harness模型的内置智能无法被有效转化为有价值的输出 Token。4.3 Perplexity 的差异化编排策略跨模型编排Anthropic 和 OpenAI 不能声称做到这一点——你不会在 Claude Code 的 Harness 里找到 GPT-5也不会有 Claude Opus 4.7/8 在 Codex 里但会在 Perplexity Computer 里找到两者跨工具和连接器编排4.4 指标每瓦每用户的 Token 价值“谁用最少的电力生产最有价值的输出 Token谁就创造最大价值。”这是一个编排问题4.5 24/7 AI 如何实现大多数人担心 AI 会做疯狂的事情但真正的担忧是成本——没有人能负担得起一直运行前沿 AI。解决方案本地模型处理日常任务服务端模型处理复杂任务编排层协调两者“构建一个持续学习的本地模型在必要时才调用服务端前沿模型”五、Agent 的使用与价值创造5.1 权力用户的行为Perplexity Computer 上有用户每月花费超过10,000 美元。这不是浪费钱他们的业务就是靠这些 Agent 循环运转的。这些用户创建的多 Agent 层级和 Agent 循环看起来像是自己的软件架构。5.2 区分高价值用户的关键使用 Agent 做重复性 cron 任务 vs 一次性任务一次性任务委托一个任务完成即止持续任务AI 持续监控触发事件时自动执行例子每次收到入站邮件自动分类检测到延迟尖峰时自动进行根因分析识别并通知相关工程师5.3 规模预测这些产品不会拥有 1 亿用户。但它们产生的收入将超过 Google 或 Meta 的广告收入。5.4 Token 支出占工资比例的演变Marc Benioff 提到 Salesforce 在 Anthropic 上花费 3 亿美元约占开发者工资的 3.8%Aravind 预测如果保持在 3.8%Anthropic/OpenAI 不会是 5 万亿美元公司如果达到 100%如 Brandon McCarthy 预测他们将成为 10 万亿美元公司但成本可能下降因为开源模型性能提升价格更低更好的 Harness 弥补模型差距永远会为前沿付费但前沿在不断变化六、基础设施层的价值6.1 为什么 Micron 可能比 Meta 更有价值Aravind 认为Micron内存供应商在未来 6-12 个月可能比 Meta 更有价值HBM 内存价格已经涨了 5 倍瓶颈定价内存是当前最稀缺的资源之一6.2 CPU 的回归由于 Agent 大量使用 CPUAgent 生成代码后在 CPU 上执行下载文件、处理数据、生成图表、托管网站——全部在 CPU 上运行“Agent 使用 CPU 的比例比人类还高。”这让Intel 和 AMD 重新成为受益者。6.3 数据中心供应商的可持续性CoreWeave 等公司可以持续但不能只是服务器租赁商需要在软件层进行编排需要获得 100,000 GPU 的容量保证需要创新发电层AWS 的名字是Amazon Web Services不是Amazon Servers——软件编排才是价值所在6.4 推理层能否独立存在可以但有条件假设需要 100 亿美元收入约 10 亿美元利润开源模型必须持续强大如果开源与前沿差距超过 12-15 个月这些公司就会失去商业模式七、出口管制7.1 短期效应出口管制帮助美国保持领先创造了开源与前沿之间 12 个月的差距让中国公司无法获得最新的 GPU 和 HBM7.2 长期风险原因中国被迫在硬件层垂直整合他们在华为栈上构建架构更加内存高效KV Cache 创新——可以放在 SSD 上不需要 HBM训练算法不依赖高带宽互联建立完全不同的推理架构和存储架构7.3 AI 的物理维度Aravind 认为美国低估了中国的能力因为 AI 不只是数字的还包括电力 许可证 劳动力 专业知识 建设速度晶圆厂机器人芯片能源利用…中国在这些领域都有优势7.4 TSMC 在美国的角色TSMC 正在亚利桑那州建设工厂投资 1500 亿美元已经投入 400-600 亿美元美国政府持有 Intel 10% 股份八、小团队创造大价值8.1 Perplexity 的示范效应400 人创造 200 亿美元公司理论上40 人可以创造 10-20 亿美元公司4000 人可能创造 2000 亿美元8.2 创业门槛的改变“如果你曾经无法创业的原因是’需要雇佣很多人、需要租办公室’——这种情况在历史上第一次改变了。”现在你可以和一两个朋友开始真正有机会创建一个 10 亿美元的公司Perplexity 自己起步时获得了约 100 万美元的云计算积分。8.3 Perplexity 的Billion Dollar Build计划他们正在向任何有可信路径创建 10 亿美元公司的团队提供100 万美元云计算积分。8.4 未来企业结构最佳公司会更加精简高效员工数量大幅减少但每个团队价值更高“我宁愿有 100 万人分成 1000 个团队每个团队值几亿美元。”九、广告模式的未来9.1 为什么聊天界面不适合广告发现模式不同旅行/购物需要探索而非对话用户意图不同浏览 Instagram vs 问 ChatGPT 问题信任问题当你需要准确答案时广告会破坏信任9.2客观 vs 主观判断类型决策特点商业模式客观决策基于事实和数据Agent 颠覆主观决策基于审美和感受广告支撑旅行、购物、时尚——大多数仍然是主观的。任何基于客观判断的交易都会被 Agent 颠覆。9.3 对 Meta 的影响Meta 正在推出 $200/月的 Agent 产品这说明他们意识到订阅模式才是出路。十、Agent 流量时代的互联网10.1 Cloudflare 的数据Agent 流量已经超过人类流量这个变化来得比预期更快。10.2 网站不会消失Aravind 认为网站不会消失设计仍然重要广告模式不会完全死亡因为主观内容时尚、家具仍然需要人类浏览Agent 流量会替代客观搜索但不会替代所有互联网活动十一、OpenAI 的 IPO 问题11.1 为什么 OpenAI 没准备好 IPO他明确表示OpenAI 没有为 IPO 做好准备原因虽然是主导消费产品但没有钱ChatGPT 已经被商品化收入来源用户订阅 Codex代码执行11.2 消费 AI 没有钱“在非广告领域——订阅或使用量计费——钱在前沿。今天的前沿是替你完成任务。”11.3 Perplexity 的 IPO 时间表目标2028 年或更早收入增长比盈利能力更重要公开市场目前更看重收入增长而非利润十二、Perplexity 的技术路线12.1 自训练模型Perplexity 正在基于顶级开源模型进行后训练目标是减少对前沿模型 Token 的依赖保持前沿模型用于新能力探索“今天产品中已有的功能我们期望完全依赖自己拥有和服务的模型。这将是降低成本和增加利润的最佳方式。”12.2 收入与成本自今年年初以来收入增长超过3 倍成本消耗减少超过50%Anthropic 模型进步对他们是好事OpenAI 竞争降低同等能力成本也是好事12.3 开源模型的持续改进“如果开源模型停止变得强大如果它们与前沿的差距超过 15-18 个月那这些推理公司就没有商业模式。”十三、对竞争对手的看法13.1 Google 的 AI 问题Google 具备所有成为最低成本 Token 生产者的条件自有 TPU自有数据中心自有网络自有电力采购但他们严重低估了代码模型的重要性目前在前沿之外。13.2 Anthropic 的生存危机“如果 Anthropic 认为 Claude Code 已经赢了——6-12 个月后他们可能就不存在了。”**前沿模型提供商只有在前沿时才有价值。**如果 6 个月没有新能力就是危险的信号。13.3 对 Cursor 的评价当被问及 San Francisco 的 AI 聚会上有人说 Perplexity 是最容易失败的公司时“Cursor 可能会被收购。xAI 是我的孩子。”而 Perplexity收入增长 3 倍成本消耗减少 50%“大多数参加这些聚会的人实际上不构建任何有用的东西。”十四、关于财富与公平14.1 财富分配的思考他承认对财富不平等的担忧但认为解决之道是**广泛分配利益**。他分享了一个真实故事一位 Uber 司机看了他的 YouTube 采访学会了如何用 AI 从零开始构建 Web 应用现在做 App 获得的被动收入比开 Uber 还多他减少了开车时间因为更喜欢编程14.2信念“如果你持续只报道负面消息——AI 和不平等——人们只会想到坏事。所以如果你认为自己做得不错就应该多谈谈积极的可能性。”“普通人更需要的是看到可能性然后受到激励去行动。”14.3 财富观“财富不会激励我。影响力才会。”十五、学到的15.1 Elon Musk 的特质极度专注——Twitter 上的表现可能具有误导性每次只关注一个限制性问题忽略其他一切“这种能力——只关注当下的限制因素忽略其他一切——非常难学。”15.2 Jensen Huang 的特质对真相极度渴求每天醒来告诉自己我很糟糕公司值 5 万亿美元却用公司 30 天内可能倒闭的思维经营“这就是成为 Jensen Huang 所需的。”15.3 共同点两人都有宏大的长期愿景Musk 的太空计划火星殖民地百万居民财富只是副产品“如果你的成功定义是’赢得比赛然后卖掉公司’然后就待在家里——你的孩子不会受到激励去行动。”十六、AI 时代最重要的技能16.1 问更好的问题Aravind 在毕业典礼演讲中提到AI 时代定义的技能是问更好的问题。16.2 没人问的核心问题“假设你有大量 Agent 可用你会做什么”这不是技术问题而是目的问题。16.3 框架10 年 vs 10 个月“如果有人告诉你一件事需要 10 年问‘什么能让它 10 个月完成’”十七、对垂直 AI 实验室的看法17.1 不相信大多数新实验室太多只是为了建实验室而建实验室没有差异化。17.2 什么才是值得的值得投资的垂直模型质疑 Transformer 架构本身质疑是否需要基于 Nvidia GPU针对机器人等特定领域的模型DeepSeek 是一个例外——他们是水平模型不是垂直模型不是从大实验室分拆出来的但他们提出了非常不同的技术赌注十八、Perplexity 如何成为 3 万亿美元公司18.1 路径“编排层。准确性和编排——这是自公司成立以来一直坚持的两个目标。”编排层将涵盖设备芯片模型工具文件连接器18.2 他自己被问到的终极问题问你会拿 SpaceX、Anthropic 还是 OpenAI答SpaceX。“Anthropic 和 OpenAI 做的事情其他公司也在做。但 SpaceX 是唯一建造太空基础设施的公司。”十九、对毕业生的建议保持好奇心具体而言不要被 FOMO错失恐惧驱动试图在短期内最大化收益不要因为看到前沿实验室赚大钱而觉得自己是失败者还有很多可以构建的东西附录术语解释Agent HarnessAgent 编排系统定义 Agent 循环如何运行、管理工具和连接器Token Value Per Watt每瓦电力产生的 Token 价值关键效率指标Orchestration编排跨模型、工具、设备协调任务的能力HBM (High Bandwidth Memory)高带宽内存GPU 训练的关键组件KV CacheTransformer 中的键值缓存优化推理效率Agent LoopAgent 循环AI 持续监控和响应事件的机制Cron Jobs定时任务Agent 自动执行重复性工作总结十个核心takeaways电力是真正的瓶颈——比模型能力更重要模型是商品编排是差异化——Perplexity 能在同一个产品中使用 Claude 和 GPT前沿在移动——从回答问题到替你工作小型团队可以做大公司——400 人可以创造 200 亿美元出口管制短期帮美国长期帮中国——迫使中国垂直整合内存和 CPU 是新瓶颈——Micron 可能比 Meta 更有价值广告不适合聊天界面——信任和用户意图模式不匹配自训练模型降低成本——Perplexity 的策略问问题是核心技能——不是技术能力而是提出正确问题的能力永远不要防守——这是 Aravind 的信条也是 AI 时代生存的关键