Enable javascript in your browser for better experience. Need to know to enable it? Go here.

开源编程大语言模型

Published : Sep 27, 2023
NOT ON THE CURRENT EDITION
This blip is not on the current edition of the Radar. If it was on one of the last few editions, it is likely that it is still relevant. If the blip is older, it might no longer be relevant and our assessment might be different today. Unfortunately, we simply don't have the bandwidth to continuously review blips from previous editions of the Radar. Understand more
Sep 2023
Assess ?

GitHub Copilot 是软件开发时有价值的辅助编程工具。而在工具背后,大语言模型(LLMs)通过赋能内联代码助手、代码微调和 IDE 中的对话支持等方式,无缝提升开发人员的体验。 大多数这些模型都是专有的,只能通过订阅服务使用。好消息是,您可以使用几种开源的 LLMs 进行编码。如果您需要构建自己的编码辅助服务(比如受到高度监管的行业),可以考虑 StarCoderWizardCoder。StarCoder 使用由 BigCode 维护的大型数据集 进行训练,而 Wizardcoder 是 Evol-Instruct 调整后的 StarCoder 模型。

我们在实验中使用了 StarCoder,发现它对于生成诸如代码、YAML、SQL 和 JSON 等 结构化软件工程元素十分有用。根据我们的实验,我们发现这两个模型都可以使用提示词中的 小样本示例 进行上下文学习 。尽管如此,对于特定的下游任务(例如为 Postgres 等特定数据库生成 SQL),模型仍需要微调。最近,Meta 推出了 Code Llama,一款专用于编程的 Llama 2。使用这些开源模型时务必要小心谨慎。在选择任何这些编码 LLMs 供您的组织使用之前,请考虑它们的许可,包括代码的许可和用于训练模型的数据集的许可,仔细评估这些方面后再做决定。

Download the PDF

 

 

 

English | Português 

Sign up for the Technology Radar newsletter

 

 

Subscribe now

Visit our archive to read previous volumes