环球速看:小扎 All in AIGC,连夜成立顶级产品团队
ChatGPT 的火爆,终究是让 Meta 坐不住了。
这不,小扎(扎克伯格)连夜对外宣布了公司的大动作:
(资料图片)
成立顶级产品团队,专注 AIGC。
这个团队可以说是整合了全公司搞 AIGC 的人才,并且小扎称要把相关技术注入到 Meta 所有的产品中。例如要把 AIGC 中的文本生成、对话能力,用到自家的 WhatsApp、Messenger 等;图像生成能力要用到 Instagram;以及还要探索视频和多模态的玩法。
小扎还为这个大动作设定了2 个目标:短期目标:打造具有创造性和表现力的工具。
长期目标:开发能够用各种方式帮助人们的 AI 角色。
而就在前几天,Meta 还刚刚;技术、产品团队均已就绪,Meta 这波俨然一副 All in AIGC 的节奏。
对此,也有网友表示 " 比投入元宇宙靠谱多了 ":
新建的团队有多 " 顶级 "?" 顶级产品团队 ",这无疑成为了 Meta 最新动作中的最大亮点之一。
据外媒 AXIOS 称,Meta 新团队将由人工智能和机器学习副总裁Ahmad Al-Dahle领导。
Ahmad Al-Dahle 于 2020 年 4 月加入 Meta,主要负责 AI、机器感知和 XR 等方面的领导工作。而在此之前近 17 年的时间里,Ahmad Al-Dahle 则是一直在苹果的特殊项目小组(Special Project Group)就职。
至于 " 顶级产品团队 " 其它成员的信息,目前 Meta 官方还未做更多的透露。但根据小扎 " 将多个生成式 AI 团队整合到一个小组 " 的说法,其背后大语言模型 LLaMA 团队很有可能会加入进来。
而 Meta AI 的首席科学家、图灵奖得主 Yann LeCun 在社交平台上表示,几乎所有 LLaMA 的研究人员都是来自 FAIR 在巴黎的分支。
若是这个 " 顶级产品团队 " 真将 LLaMA 核心骨干吸纳进来,那么 Meta 这次的团队整合将跨全球的一次大动作。一口发布四种规模大语言模型
最后,我们再来看下小扎 All in AIGC 背后的技术实力。
在此前的发布中,Meta 的开源大语言模型 LLaMA 包含四个 size:
7B(小杯)、13B(中杯)、33B(大杯)和 65B(超大杯)。
并且官方还声称效果要好过 GPT,甚至 13B 的 LLaMA 在单个 GPU 上就能运行。其主要原理和以往的大模型类似,都是将一系列单词作为输入,并预测下一个单词以递归生成文本。
至于为何要发布不同尺寸的大模型,Meta 对此的解释是:
近来的研究表明,对于给定的计算预算,最佳性能不是由最大的模型实现的,而是由基于更多数据训练的更小的模型实现的。
也就是说,较小的模型规模加上比较大的数据集,获得的性能可能会比更大规模模型的要好很多。
一方面,小规模模型需要的计算能力和资源相对来说都会少很多,另一方面,它还能基于更多数据集训练更多 token,更容易针对特定的潜在产品用例进行重新训练和微调。
在效果方面,小扎更是在放出豪言,这是 AI 大语言模型里的新 SOTA:
生成文本、进行对话、总结书面材料以及解决数学定理或预测蛋白质结构等它都能干。
而相较于有 1750 亿参数的 GPT-3,最多只有 650 亿参数 LLaMA 在大多数基准上都要优于 GPT-3。比如说常识推理:……不过有一说一,相比其他科技巨头来说,Meta 这波 All in 的时间节点是相对滞后了一些。
那么你觉得 Meta 这张迟来的船票,能否坐稳 AIGC 的巨轮呢?
参考链接:
[ 1 ] https://www.facebook.com/zuck/posts/pfbid02zHwANqWrZLMimhq7U97i3xaHkMEHu8CLsa9TGRj1QeejwDxRFChxSK1zY6yPak5Kl
[ 2 ] https://www.theverge.com/2023/2/27/23617477/mark-zuckerberg-meta-ai-tools-personas
[ 3 ] https://www.cnbc.com/2023/02/27/mark-zuckerberg-announces-new-team-at-meta-working-on-ai-products.html
[ 4 ] https://www.linkedin.com/in/ahmad-al-dahle-63a963a0/