AI 创业公司 Hugging Face 和 ServiceNow 发布了免费的代码生成模型 StarCoder。类似 DeepMind 的AlphaCode、亚马逊的 CodeWhisperer 和 GitHub 的 Copilot(基于 OpenAI 的 Codex),StarCoder 使用 Apache License 2.0 许可证,允许任何人免费使用,但严格意义上不是开源模型,它禁止用户使用该模型生成或传播恶意代码。StarCoder 使用了开源代码数据集 The Stack 训练,有 150 亿参数。其数据集包括了逾 80 种不同语言和来自 github issues 和 commits 的文本。
https://github.com/bigcode-project/starcoder