Enable javascript in your browser for better experience. Need to know to enable it? Go here.
radar blip
radar blip

开源编程大语言模型

发布于 : Sep 27, 2023
不在本期内容中
这一条目不在当前版本的技术雷达中。如果它出现在最近几期中,那么它很有可能仍然具有相关参考价值。如果这一条目出现在更早的雷达中,那么它很有可能已经不再具有相关性,我们的评估将不再适用于当下。很遗憾我们没有足够的带宽来持续评估以往的雷达内容。 了解更多
Sep 2023
Assess ? 在了解它将对你的企业产生什么影响的前提下值得探索

GitHub Copilot 是软件开发时有价值的辅助编程工具。而在工具背后,大语言模型(LLMs)通过赋能内联代码助手、代码微调和 IDE 中的对话支持等方式,无缝提升开发人员的体验。 大多数这些模型都是专有的,只能通过订阅服务使用。好消息是,您可以使用几种开源的 LLMs 进行编码。如果您需要构建自己的编码辅助服务(比如受到高度监管的行业),可以考虑 StarCoderWizardCoder。StarCoder 使用由 BigCode 维护的大型数据集 进行训练,而 Wizardcoder 是 Evol-Instruct 调整后的 StarCoder 模型。

我们在实验中使用了 StarCoder,发现它对于生成诸如代码、YAML、SQL 和 JSON 等 结构化软件工程元素十分有用。根据我们的实验,我们发现这两个模型都可以使用提示词中的 小样本示例 进行上下文学习 。尽管如此,对于特定的下游任务(例如为 Postgres 等特定数据库生成 SQL),模型仍需要微调。最近,Meta 推出了 Code Llama,一款专用于编程的 Llama 2。使用这些开源模型时务必要小心谨慎。在选择任何这些编码 LLMs 供您的组织使用之前,请考虑它们的许可,包括代码的许可和用于训练模型的数据集的许可,仔细评估这些方面后再做决定。

下载 PDF

 

English | Español | Português | 中文

订阅技术雷达简报

 

立即订阅

查看存档并阅读往期内容