北大开源aiXcoder-7B代码大模型,专为企业级软件开发设计
来源: | 作者:DE.News | 发布时间: 2024-04-28 | 712 次浏览 | 分享到:

    北京大学软件工程研究所孵化的aiXcoder团队宣布开源其最新代码大模型——aiXcoder-7B Base版。这一模型专为企业软件开发场景设计,以其70亿参数的规模,在多个主流评测集上展现出超越340亿参数Codellama模型的性能,标志着AI代码生成技术在企业级应用中迈出了重要一步。

aiXcoder-7B Base版的特点包括:

  1. 企业级应用优化:模型针对企业级软件项目,在真实开发场景下效果卓越,尤其在代码生成补全能力和跨文件能力方面表现优异。

  2. 高效性能:在HumanEval、MBPP和MultiPL-E三大评测集上平均得分超过业界领先的Codellama模型。

  3. 易于私有化部署:考虑到企业代码数据的私密性,aiXcoder-7B Base版轻便且易于部署,适合企业私有化部署和个性化训练。

  4. 个性化定制:模型易于定制,能够学习企业的软件开发框架、API库以及业务逻辑和代码架构规范。

  5. 智能化补全:aiXcoder-7B Base版在补全时倾向于使用较短的代码,提高代码的可读性和减少Bug。

  6. 开源合作:aiXcoder团队希望通过开源,促进社区合作,提高模型的泛用性和创新性。

  7. 全自研模型:aiXcoder-7B Base版是全自研的成果,拥有1.2T Unique Tokens的训练数据量,并针对数十种主流语言进行了深入的语法分析和静态分析。

  8. 持续创新:aiXcoder团队在国际顶会上发表了100余篇相关论文,并获得了多次ACM杰出论文奖。

  9. 企业服务:未来,aiXcoder计划推出企业版本,聚焦B端市场,为企业提供私有化部署和个性化训练服务。

  10. 开源链接:aiXcoder-7B Base版的开源代码可在GitHub、Gitee和GitLink等平台上获取。

aiXcoder-7B Base版的发布,不仅展示了北京大学在AI编程领域的研究实力,也为软件开发自动化的未来发展提供了新的动力和方向。

主要关键字:aiXcoder,北京大学,代码大模型,企业级应用,软件开发,私有化部署,个性化定制,智能化补全,全自研,开源合作,GitHub,Gitee,GitLink。


返回
深度元素科技,您的信赖之选