你好,我是王煜全,这里是王煜全要闻评论。
2025年即将收官,AI浪潮已经启动了整整3年。如果今天你还在为AI能写诗作画而惊叹,那抱歉,说明你的认知已经落伍了。12月1日,字节跳动和中兴通讯联手推出了内含豆包手机助手的工程样机,供开发者和极客体验。从已曝光的演示来看,这款手机不再满足于内容生成,而是要直接动手行动了。它能跨App自动执行各类复杂任务,包括从微信找文件、分类打包群聊资料,还能实时比价三大电商并自动加入购物车。要知道,过去完成这类操作,往往费时费力,现在一句话就能完成。当然,目前预览版的豆包手机助手也存在一些不足。受限于大模型推理速度和跨App调用的复杂性,在一些任务中,豆包助手未必比人手操作更快。比如一次完整的跨平台比价下单,可能耗时五到八分钟。而且助手也会出现操作错误的情况,需要人工干预。但无论如何,外界整体反馈非常积极,仿佛手机真的长出了能替你跑腿干活的大脑和双手。相比之下,苹果虽然去年就高调发布了Apple Intelligence,但至今也没能在iPhone上实现所演示的功能。我们认为,字节跳动与中兴的豆包助手无疑打响了AI从“内容智能”转向“行为智能”的第一枪。未来要观察的是手机厂商能否从AI大厂手中重夺入口,开源与闭源模型谁将更受青睐,以及中国企业能否在“行为智能”时代实现弯道超车。
首先,我们想指出的是,表面看,豆包助手只是一个集成于操作系统的AI功能,却是一个重要转折点,标志着AI正在迈向“行为智能”。以ChatGPT为代表的大语言模型(LLM)掀起了“内容智能”的革命,展现出强大的知识整合与对话能力。但三年过去了,AI能做的大多在内容生成的层面,生成文本、总结知识,以及作画和做视频,最具生产力的也就是编程了。正如大家对AI的普遍吐槽,为什么现在是AI写诗作画,而我去洗衣做饭。当前的AI只能坐而论道,却不会起而行之。它最擅长当顾问或秘书,能回答疑问、做出安排,但具体的事还得你自己去做。所以,别说洗衣做饭了,就连帮你在网上选个衣服、点个外卖,AI都无法代劳。而豆包手机助手的出现,表明中国企业开始闯入AI浪潮的无人区——也就是“行为智能”,开始要让AI真正帮人做事。这不只是技术的提升,还意味着商业维度的升级。过去AI一直难以变现,连OpenAI都每年巨亏数十亿美元,这是因为用户想要的从来不是答案本身,而是要把事情办成。用户不仅想要AI来告诉自己什么衣服适合自己,更希望AI直接帮自己以最高性价比买到心仪的衣服。用户需要的不只是一堆旅游攻略,更是希望AI自动规划最优路线并且直接叫好车、买好票、订好房。豆包助手就在实现“把事情办成”这个关键一步,通过与操作系统深度融合,AI拿到了手机的底层权限。从此,它可以全局读屏,理解当前界面内容;还能模拟触控,像手指一样对手机实现点按、滑动和输入等操作;还能自主打开和切换App,实现跨应用操作。在银行办业务时,由于不熟悉App里的选项,你有可能会把手机交给大堂经理,让他们在自己的监督下代为操作。而豆包助手就如同一位站在你身旁、值得信赖的私人助理,你需要干什么,只要把手机交给它去执行就好。虽然现在这个私人助理还不是很熟练,但它的出现就已经是一个值得称赞的飞跃。
那么,我们不妨继续推演,往后AI手机的产业格局又会如何演变。在移动互联网时代,手机厂商常被看做是应用的通道,只是赚了卖硬件的钱,真正的持续收益则流向抖音、微信、美团、淘宝等超级App。然而,在AI时代,硬件入口的价值可能重新得到凸显。因为用户是为手机买单,手机厂商就理应要为融合在手机系统里的AI助手服务兜底。但反过来看,当AI能力被深度集成到操作系统,手机厂商也就实现了对系统权限的掌控,实质上重新掌控了用户入口的主导权。这也意味着,头部厂商未来有可能效仿苹果App Store的抽成模式,通过自家大模型为各类App提供系统级AI服务,并从中收取相应的AI服务费。而且,这个费用看起来可比苹果税要合理得多。在这一背景下,中立的开源模型反而更会受手机厂商的青睐。毕竟,手机厂商大概率不会愿意将系统的灵魂交给不受掌控的大模型公司。设想一下,小米应该很难放心使用腾讯的模型,因为后者有可能会在用户要打车时优先推荐自己投资的滴滴,在买东西时优先推荐视频号里的产品。但此时,开源模型公司的商业模式也将发生转变,可以通过提供企业级支持、定制化优化实现盈利,并推动开源生态的繁荣。当然,最关键的是,我们希望中国有更多厂商踊跃参与到“行为智能”的大浪潮之中,把握这个重要的中国机遇。在“内容智能”时代,我们始终处于追赶状态,但在“行为智能”时代,中国在移动互联网上积累的生态优势将能为弯道超车提供基础。“行为智能”的核心是大行为模型(LBM),其本质是通过学习真实行为数据,掌握在特定条件约束下、为达成特定目标、应采取什么动作。简而言之,它需要的数据不只是内容,而是流程和决策。国外的应用生态相对割裂,Facebook擅长社交但不做支付,谷歌能搜索但电商由亚马逊主导,谁都没有覆盖完整的行为闭环。中国的超级应用往往会在其内部形成高度集成的生态,用户会在单一应用中完成各种行为,从而产生了全球最丰富的连续行为数据。比如,微信月活用户超13亿,持续记录了用户社交、购物、支付的行为数据;抖音有9亿用户,拥有从内容到兴趣再到购买的行为数据。理论上,这些多维度的行为数据无疑是训练大行为模型的绝佳原料,也为中国企业率先实现“行为智能”提供了独一无二的先天优势。当然,这也形成了一定意义上的垄断,而植根于手机操作系统层面上的大行为模型,将可以跨App操作,有望打破垄断,给用户更好的体验。