环球速看：小扎 All in AIGC，连夜成立顶级产品团队

2023-02-28 15:20:45 来源：量子位

ChatGPT 的火爆，终究是让 Meta 坐不住了。

这不，小扎（扎克伯格）连夜对外宣布了公司的大动作：

(资料图片)

成立顶级产品团队，专注 AIGC。

这个团队可以说是整合了全公司搞 AIGC 的人才，并且小扎称要把相关技术注入到 Meta 所有的产品中。

例如要把 AIGC 中的文本生成、对话能力，用到自家的 WhatsApp、Messenger 等；图像生成能力要用到 Instagram；以及还要探索视频和多模态的玩法。

小扎还为这个大动作设定了2 个目标：

短期目标：打造具有创造性和表现力的工具。

长期目标：开发能够用各种方式帮助人们的 AI 角色。

而就在前几天，Meta 还刚刚；技术、产品团队均已就绪，Meta 这波俨然一副 All in AIGC 的节奏。

对此，也有网友表示 " 比投入元宇宙靠谱多了 "：

新建的团队有多 " 顶级 "？

" 顶级产品团队 "，这无疑成为了 Meta 最新动作中的最大亮点之一。

据外媒 AXIOS 称，Meta 新团队将由人工智能和机器学习副总裁Ahmad Al-Dahle领导。

Ahmad Al-Dahle 于 2020 年 4 月加入 Meta，主要负责 AI、机器感知和 XR 等方面的领导工作。

而在此之前近 17 年的时间里，Ahmad Al-Dahle 则是一直在苹果的特殊项目小组（Special Project Group）就职。

至于 " 顶级产品团队 " 其它成员的信息，目前 Meta 官方还未做更多的透露。

但根据小扎 " 将多个生成式 AI 团队整合到一个小组 " 的说法，其背后大语言模型 LLaMA 团队很有可能会加入进来。

而 Meta AI 的首席科学家、图灵奖得主 Yann LeCun 在社交平台上表示，几乎所有 LLaMA 的研究人员都是来自 FAIR 在巴黎的分支。

若是这个 " 顶级产品团队 " 真将 LLaMA 核心骨干吸纳进来，那么 Meta 这次的团队整合将跨全球的一次大动作。

一口发布四种规模大语言模型

最后，我们再来看下小扎 All in AIGC 背后的技术实力。

在此前的发布中，Meta 的开源大语言模型 LLaMA 包含四个 size：

7B（小杯）、13B（中杯）、33B（大杯）和 65B（超大杯）。

并且官方还声称效果要好过 GPT，甚至 13B 的 LLaMA 在单个 GPU 上就能运行。

其主要原理和以往的大模型类似，都是将一系列单词作为输入，并预测下一个单词以递归生成文本。

至于为何要发布不同尺寸的大模型，Meta 对此的解释是：

近来的研究表明，对于给定的计算预算，最佳性能不是由最大的模型实现的，而是由基于更多数据训练的更小的模型实现的。

也就是说，较小的模型规模加上比较大的数据集，获得的性能可能会比更大规模模型的要好很多。

一方面，小规模模型需要的计算能力和资源相对来说都会少很多，另一方面，它还能基于更多数据集训练更多 token，更容易针对特定的潜在产品用例进行重新训练和微调。

在效果方面，小扎更是在放出豪言，这是 AI 大语言模型里的新 SOTA：

生成文本、进行对话、总结书面材料以及解决数学定理或预测蛋白质结构等它都能干。

而相较于有 1750 亿参数的 GPT-3，最多只有 650 亿参数 LLaMA 在大多数基准上都要优于 GPT-3。比如说常识推理：……

不过有一说一，相比其他科技巨头来说，Meta 这波 All in 的时间节点是相对滞后了一些。

那么你觉得 Meta 这张迟来的船票，能否坐稳 AIGC 的巨轮呢？

参考链接：

[ 1 ] https://www.facebook.com/zuck/posts/pfbid02zHwANqWrZLMimhq7U97i3xaHkMEHu8CLsa9TGRj1QeejwDxRFChxSK1zY6yPak5Kl

[ 2 ] https://www.theverge.com/2023/2/27/23617477/mark-zuckerberg-meta-ai-tools-personas

[ 3 ] https://www.cnbc.com/2023/02/27/mark-zuckerberg-announces-new-team-at-meta-working-on-ai-products.html

[ 4 ] https://www.linkedin.com/in/ahmad-al-dahle-63a963a0/

标签：语言模型有一说一研究人员