欢迎来到故城县恺恒网络科技有限公司!
  • 手机APP
  • 关注微信公众号

Stable Diffusion背后公司开源大语言模型,很火,但很烂

2023-04-20 26

万万没想到,以文生图著名的Stable Diffusion,也入局了大语言模型(LLM)之战。它背后的公司Stability AI,正式推出类ChatGPT产品——StableLM。

据了解,这个模型目前处于Alpha版本,拥有的参数量分别为30亿和70亿;后续还将推出150亿到650亿参数模型。

而且不到一天时间,在GitHub上开源的项目便已经揽获了超4K颗星,火爆程度可见一斑。

原本大语言模型之战再添玩家应当是一件令人兴奋的事情。但结果竟也是一个万万没想到的大反转。网友们在体验了StableLM之后,毫不留情地给出这样的评价:非常糟糕。

StableLM真的有那么不堪吗?能对话,也能生成代码,我们先来看下StableLM所展示出来的能力。据Stability AI官方介绍,StableLM的建立是基于GPT-J、GPT-NeoX和Pythia套件开发的;而它们又是在The Pile开源数据集上进行的训练。

但StableLM与上述模型有所不同,它采用了The Pile的新数据集,与此前相比,足足大了三倍,并且包含1.5万亿个token。除了基本情况的介绍之外,Stabliity AI也给出了几个demo。

文本对话、创作内容、编写代码,从官方亮出的例子上来看,似乎StableLM的能力还是可以的。但为什么会出现刚才有人评价的“非常糟糕”呢?货比三家,实力便可一较高下。

感兴趣的小伙伴们可以去体验一下喽~