[#]: subject: "Open-Source Model 'Dolly' Claims to be a Cheaper Alternative to ChatGPT" [#]: via: "https://news.itsfoss.com/open-source-model-dolly/" [#]: author: "Sourav Rudra https://news.itsfoss.com/author/sourav/" [#]: collector: "lkxed" [#]: translator: "lxbwolf" [#]: reviewer: "wxy" [#]: publisher: "wxy" [#]: url: "https://linux.cn/article-15678-1.html" 号称可以成为 ChatGPT 平替的开源模型 “Dolly” ====== > 你需要一款 ChatGPT 的平替?还得是开源的?看起来我们已经被卷入了与 ChatGPT 的开源大战。 ![open source model dolly][1] Databricks 这家软件公司,在各个领域都有所建树,尤其是在数据仓库和基于人工智能的解决方案方面。 最近,随着 ChatGPT 横空出世,Meta、谷歌甚至 Mozilla 都开始效仿 ChatGPT。 而现在,Databricks 开源了其 [大型语言模型][3]large language model(LLM)“Dolly”,也正在以自己的方式进行尝试。 我们一起来看看它。 **发生了什么?** 在最近的公告中,Databricks 介绍了他们号称 “**廉价构建**” 的 LLM,使用 [EleutherAI][5] 的已经开源的参数 [模型][4] 提供功能。 他们在该模型基础上稍作调整,赋予了 Dolly 指令诸如头脑风暴和文本生成的能力。 当你拿它与 GPT-3 中的 **1750 亿个参数** 比较时,Dolly 的 **60 亿个参数** 就可能显得微不足道。 但是,当 Databricks 的人看到即使数据量与 GPT-3 相差这么多,Dolly 也能 **展示很多与 ChatGPT 相同的能力** 时,他们感到非常震惊。 下面是他们展示的其中一个例子: ![a screenshot of how dolly performs in an open question and answer scenario][6] 原始模型使用了 [Alpaca][7] 的数据,该模型由斯坦福大学以 Meta 的 [LLaMA][8] LLM 为基础建立。 但是,正如你所看到的,原始模型产生了一个非常杂乱无章的结果,而 Dolly,通过不同的模型和调整,能够产生一个更为可用的答案。 > 📝 有趣的事实:“多莉Dolly” 名字取自世界上第一只克隆羊。 **为什么是现在?** 根据 Databricks 的说法,他们认为 **许多公司更愿意建立自己的模型,**而不是将数据发送给某个紧紧掌握模型只对外提供 API 的集中式供应商。 许多公司可能不愿意将他们最敏感的数据交给第三方,然后在模型质量、成本和所需行为方面进行各种权衡。 **你想看看吗?** 当然,但有一个问题。 你必须 **使用他们的平台来使用 Dolly**,他们已经开源了一个 [Databricks 笔记本][9],可以帮助你在 Databricks 上构建它。 此外,如果你想获得训练好的权重,你必须联系他们。不过我不确定他们是否会免费提供使用权。 总而言之,这种开源其模型的举动应该对其他公司有好处,可以保护他们的数据、节省运营成本,其他公司也能使用它创建自己的模型。 你可以查看其 [公告博客][10],以了解更多技术细节和其他计划。 -------------------------------------------------------------------------------- via: https://news.itsfoss.com/open-source-model-dolly/ 作者:[Sourav Rudra][a] 选题:[lkxed][b] 译者:[lxbwolf](https://github.com/lxbwolf) 校对:[wxy](https://github.com/wxy) 本文由 [LCTT](https://github.com/LCTT/TranslateProject) 原创编译,[Linux中国](https://linux.cn/) 荣誉推出 [a]: https://news.itsfoss.com/author/sourav/ [b]: https://github.com/lkxed/ [1]: https://news.itsfoss.com/content/images/size/w1304/2023/03/opensource-ai-model-dolly.png [2]: https://news.itsfoss.com/content/images/2023/03/linux-mega-packt.webp [3]: https://en.wikipedia.org/wiki/Large_language_model?ref=its-foss-news [4]: https://huggingface.co/EleutherAI/gpt-j-6B?ref=its-foss-news [5]: https://www.eleuther.ai/?ref=its-foss-news [6]: https://news.itsfoss.com/content/images/2023/03/Dolly_AI.jpg [7]: https://crfm.stanford.edu/2023/03/13/alpaca.html?ref=its-foss-news [8]: https://ai.facebook.com/blog/large-language-model-llama-meta-ai/?ref=its-foss-news [9]: https://github.com/databrickslabs/dolly?ref=its-foss-news [10]: https://www.databricks.com/blog/2023/03/24/hello-dolly-democratizing-magic-chatgpt-open-models.html?ref=its-foss-news