当前位置: 首页 > 软件库 > 神经网络/人工智能 > >

Project CodeNet

AI 代码翻译
授权协议 Apache-2.0
开发语言 Java C/C++
所属分类 神经网络/人工智能
软件类型 开源软件
地区 不详
投 递 者 凤经国
操作系统 跨平台
开源组织 IBM
适用人群 未知
 软件概览

Project CodeNet 是由 IBM 推出的一个用于推进 AI 对代码的理解和翻译的开源数据集。旨在为 AI-for-Code 研究界提供一个大规模、多样化和高质量的数据集,以推动 AI 技术的创新。

Project CodeNet 有很多特点(大规模、多样性等),与 ImageNet 相似(ImageNet 是一个巨大的图像数据集,对计算机视觉研究领域产生了巨大的影响)。Project CodeNet 是一个大规模的数据集,有大约 1400 万个代码样本,每个样本都是 4000 个编码问题中的一个预期解决方案。Project CodeNet 的目标是为代码的人工智能做一些 ImageNet 为计算机视觉所做的事情。

Project CodeNet 有几个不一样的特点。除了数据集的规模之外,代码样本是用 50 多种编程语言编写的,主要语言是 C++、C、Python 和 Java。Project CodeNet 中的代码样本都有丰富的注释信息,如代码大小、内存占用、CPU 运行时间和状态,表示接受或错误类型。

90% 以上的问题都有相应的问题描述,其中包含了简洁的问题陈述、输入格式和输出格式的说明。如果可用,官方还从问题描述中提取了输入和输出的样本,并将其作为数据集的一部分。用户可以执行被接受的代码样本(超过 50% 的提交被接受),以提取额外的元数据,并验证生成性人工智能模型的输出是否正确。

此外,Project CodeNet 还解决了数据样本的质量的问题。

丰富的元数据和多样性为 Project CodeNet 提供了大量的使用案例。Project CodeNet 中的 problem-submission 关系对应于 Type-4 相似性,可用于代码搜索和克隆检测。Project CodeNet 中的代码样本被标记为接受状态,因此可以探索 AI 技术来区分正确的代码和有问题的代码。

Project CodeNet 的元数据还可以跟踪一个提交的代码如何从有问题到被接受的演变过程,这可以用来探索自动代码纠正。每个代码样本都标有 CPU 运行时间和内存足迹,可用于回归研究和预测。鉴于其丰富的以多种语言编写的程序,Project CodeNet 可以作为源到源翻译的宝贵基准数据集。

 相关资料
  • 我有某种短代码,如。 我想从中提取这个短代码,然后将这两个属性:和发送到SDL World Server进行翻译。 从SDL得到响应后,我想相应地替换那个短代码。 有什么建议或帮助吗?

  • 本文向大家介绍C#实现谷歌翻译API示例代码,包括了C#实现谷歌翻译API示例代码的使用技巧和注意事项,需要的朋友参考一下 由于谷歌翻译官方API是付费版本,本着免费和开源的精神,分享一下用C#实现谷歌翻译API的代码。这个代码非常简单,主要分两块:通过WebRequest的方式请求内容;获取Get方式的请求参数(难点在于tk的获取)。 一、WebRequest代码 二、谷歌翻译接口的实现 1、抓

  • 我需要围绕WordPress的短代码翻译的内容。这些是问题的先决条件: 我必须围绕“短代码”,而不是短代码的内容。例如

  • 我已经将本文中的主要测试代码(此处是原始代码的链接)转换为处理。在测试它时,我发现它适用于低于10,000,000的数字,但它跳过了一些高于该数字的素数。 这是我的翻译(除了表格是相同的)。 编辑:我发现了问题。处理的int(long)转换为浮点数,然后转换为int,这会导致舍入错误。使用(int)long修复了问题。这是代码的工作(并且稍微优化)版本。 此版本仅适用于有符号整数。由于某种原因简单

  • 本文向大家介绍用python实现百度翻译的示例代码,包括了用python实现百度翻译的示例代码的使用技巧和注意事项,需要的朋友参考一下 用python实现百度翻译,分享给大家,具体如下: 首先,需要简单的了解一下爬虫,尽可能简单快速的上手,其次,需要了解的是百度的API的接口,搞定这个之后,最后,按照官方给出的demo,然后写自己的一个小程序 打开浏览器 F12 打开百度翻译网页源代码: 我们可以

  • 所有编程语言都被翻译成机器代码,然后由硬件解释器执行。但是什么翻译译码器的代码,例如编译器代码和解释器代码?编译器翻译源代码,但编译器也用某种语言编写,那么什么翻译编译器代码/代码呢? 谢谢

  • 下面的groovy代码在脚本构建中运行良好。格拉德尔: 我不能成功地将它的语法翻译成kotlin build.gradle.kts。有人能给我正确的翻译吗?

  • 我们完全是socket.io和表达的新手。我们遵循这个教程来学习socket.iohttps://www.valentinog.com/blog/socket-react/ 现在我们要翻译这行代码(旧样式): const index = require("。/routes/index”)。系统默认值 到 ES6,如下所示: 从“./routes/index”导入路由器 app.use('/',路由