自动代码生成是一个令人着迷的问题。如果机器能根据人的意图直接生成代码,是否可以替代大量重复性(甚至部分创造性)的编程工作?近年来,预训练语言模型的飞速发展给这一方向带来了突破:OpenAI 和 GitHub 共同开发了 Copilot 插件,展现了强大的代码生成能力;但由于完全闭源,该领域的进一步发展受到了限制。在本项目中,我们在国产框架和硬件上实现了 CodeGeeX 多语言代码生成模型,使用二十多种编程语言的海量开源代码数据进行训练。CodeGeeX 开源开放,支持多个平台,基于其开发的 VS Code 插件支持代码生成、补全、翻译等功能。
本次报告将分享以下内容:
活动信息: