苹果也发布了自己的大模型，这是一件影响深远的大事

刚刚过去的周末，苹果发表了一篇论文，公布了自己研发的MM1多态大语言模型(Multimodal LLM)。这注定是人工智能发展史上的又一个标志性事件！很遗憾，我不是技术研发人员，对这篇论文只能粗略看懂一些基本信息。我的一些从事大模型研发的朋友，昨天已经彻夜不眠地进行深度研究了。

苹果这次公布的MM1大模型分为三个参数规模，其中最大的拥有300亿参数，与市面上的主流竞品相比，好像不是很大——要知道，谷歌PaLM大模型拥有5400亿参数，OpenAI的GPT-4更是拥有1.7万亿参数（注：OpenAI官方并未披露参数数量，仅有外界猜测）。科技博客Daily Dev的评测显示，MM1在GLUE-Score等多项评测指标上要略优于GPT-4V和Gemini Pro；不过众所周知，这种评测的参考价值有限。MM1目前还没有公测，官方也没有公布上线时间表，要评估其具体的技术水平可能还需要很长一段时间。

苹果发表的MM1大模型论文的标题和作者列表

对于人工智能行业乃至全球科技行业而言，MM1大模型本身可能是一件小事，苹果由此表现出的姿态则是一件大事。具体而言：

苹果今后肯定会依赖自研大模型，而不是OpenAI等第三方的大模型或者开源大模型。大模型是一项基础设施，没有哪个科技巨头愿意受制于人，都会投入尽可能多的资源实现自主。今后大模型赛道的竞争会更激烈。
根据苹果一贯的作风，它肯定想实现“软件-算法-芯片”三位一体的统一，今后肯定会建立自己的AI开发社区，甚至在芯片领域挑战一下英伟达。AMD和英特尔都没有这个实力，但苹果确实有一定希望。
在长期，最值得关注的话题是：苹果会不会走边缘计算、本地化推理的路线？这将直接决定“AI手机”有没有市场。不过这个问题不是一两年内能解决的。

先说第一条。在ChatGPT刚刚发布时，业界的主流观点是：世界上不需要那么多大模型，可能只需要3-5个，包括1-2个最先进的闭源大模型，再加上几个开源大模型。现在的情况却是人人都想做自己的大模型。此前很长一段时间，大家都觉得苹果是一家消费电子厂商，没有必要押注于自研大模型，只需要租用市面上最先进的大模型就可以了。现实告诉我们，苹果不是这么想的。就像我的一位从事大模型研发的朋友所说：“AGI时代，自己有控制权的大模型才是最好的。OpenAI不可能将模型参数开放给苹果，苹果也不会乐意受制于微软生态。不管它做不做得好，它只能自己做！”

如果苹果是这么想的，其他科技巨头就更会这么想了。谷歌和亚马逊都投资了Anthropic（除了OpenAI之外最炙手可热的AI创业公司），Salesforce投资了Mistral；各家大厂收购的小型研发团队就更是数不胜数了。无论这个世界究竟需要多少大模型，每个科技巨头都会做自己的大模型，而且肯定不止做一个——内部孵化几个、外部投资或并购几个，才是常态。

- 金钱报
免责声明：投资有风险，入市须谨慎。本资讯不作为投资建议。

相关推荐