1. 首页
  2. 新闻

苹果也发布了自己的大模型,这是一件影响深远的大事

刚刚过去的周末,苹果发表了一篇论文,公布了自己研发的MM1多态大语言模型(Multimodal LLM)。这注定是人工智能发展史上的又一个标志性事件!很遗憾,我不是技术研发人员,对这篇论文只能粗略看懂一些基本信息。我的一些从事大模型研发的朋友,昨天已经彻夜不眠地进行深度研究了。

苹果这次公布的MM1大模型分为三个参数规模,其中最大的拥有300亿参数,与市面上的主流竞品相比,好像不是很大——要知道,谷歌PaLM大模型拥有5400亿参数,OpenAI的GPT-4更是拥有1.7万亿参数(注:OpenAI官方并未披露参数数量,仅有外界猜测)。科技博客Daily Dev的评测显示,MM1在GLUE-Score等多项评测指标上要略优于GPT-4V和Gemini Pro;不过众所周知,这种评测的参考价值有限。MM1目前还没有公测,官方也没有公布上线时间表,要评估其具体的技术水平可能还需要很长一段时间。

苹果发表的MM1大模型论文的标题和作者列表

对于人工智能行业乃至全球科技行业而言,MM1大模型本身可能是一件小事,苹果由此表现出的姿态则是一件大事。具体而言:

  1. 苹果今后肯定会依赖自研大模型,而不是OpenAI等第三方的大模型或者开源大模型。大模型是一项基础设施,没有哪个科技巨头愿意受制于人,都会投入尽可能多的资源实现自主。今后大模型赛道的竞争会更激烈。
  2. 根据苹果一贯的作风,它肯定想实现“软件-算法-芯片”三位一体的统一,今后肯定会建立自己的AI开发社区,甚至在芯片领域挑战一下英伟达。AMD和英特尔都没有这个实力,但苹果确实有一定希望。
  3. 在长期,最值得关注的话题是:苹果会不会走边缘计算、本地化推理的路线?这将直接决定“AI手机”有没有市场。不过这个问题不是一两年内能解决的。

先说第一条。在ChatGPT刚刚发布时,业界的主流观点是:世界上不需要那么多大模型,可能只需要3-5个,包括1-2个最先进的闭源大模型,再加上几个开源大模型。现在的情况却是人人都想做自己的大模型。此前很长一段时间,大家都觉得苹果是一家消费电子厂商,没有必要押注于自研大模型,只需要租用市面上最先进的大模型就可以了。现实告诉我们,苹果不是这么想的。就像我的一位从事大模型研发的朋友所说:“AGI时代,自己有控制权的大模型才是最好的。OpenAI不可能将模型参数开放给苹果,苹果也不会乐意受制于微软生态。不管它做不做得好,它只能自己做!”

如果苹果是这么想的,其他科技巨头就更会这么想了。谷歌和亚马逊都投资了Anthropic(除了OpenAI之外最炙手可热的AI创业公司),Salesforce投资了Mistral;各家大厂收购的小型研发团队就更是数不胜数了。无论这个世界究竟需要多少大模型,每个科技巨头都会做自己的大模型,而且肯定不止做一个——内部孵化几个、外部投资或并购几个,才是常态。

- 金钱报
免责声明:投资有风险,入市须谨慎。本资讯不作为投资建议。

相关推荐