MIT微软为AI量身打造了一套leetcode编程题

云烟 • 2024年 9月 20日下午6:45 • 编程

MIT微软为AI量身打造了一套leetcode编程题这是来自MIT、Allen AI和微软的研究人员提出的一种全新的编程题目描述方法:每个题目都由一个简短的Python函数f定义，目标是找到一个输

欢迎大家来到IT世界,在知识的湖畔探索吧!

丰色发自凹非寺
量子位报道 | 公众号 QbitAI

你见过这种编程题目描述方式吗？

MIT微软为AI量身打造了一套leetcode编程题

不用自然语言描述，也没有输入输出示例，你所看到的就只有一个Python函数。

这是来自MIT、Allen AI和微软的研究人员提出的一种全新的编程题目描述方法：

每个题目都由一个简短的Python函数f定义，目标是找到一个输入x，使f输出true。

这样的题目形式可以让AI审题更容易，人类程序员的理解也不会受到影响。

AI编程，道路真是越来越平了啊。

接下来就来详细看看这个研究吧。

MIT微软为AI量身打造了一套leetcode编程题

没有自然语言描述的编程题目

再来解释一下这种描述方法：

题目采用Python函数的形式，参数为答案。

解题的目标是找到使函数输出为真的输入x，即满足f（x）= true的正确答案。

现在请你举一反三：求解一个有1000个不连续“o”的字符串，用这种新形式如何描述呢？

MIT微软为AI量身打造了一套leetcode编程题

正确答案：

MIT微软为AI量身打造了一套leetcode编程题

下面是另外两道题目的描述示例。

动态规划—最长单调递增子序列问题：

MIT微软为AI量身打造了一套leetcode编程题

经典的汉诺塔 （Towers of Hanoi ）：

MIT微软为AI量身打造了一套leetcode编程题

研究人员按此种出题形式囊括了各种编程题，提出来一个开源数据集：叫做P3。

该数据集题型非常全面：涉及不同难度、不同领域和不同算法工具等方面的题目。

有简单的字符串操作问题；

有经典如汉诺塔和国际象棋（例如，骑士游历算法和N皇后问题变体）等难题；

也有两人挑战寻找最佳策略的题型，如井字棋（Tic-Tac-Toe）、石头剪刀布、珠玑妙算Mastermind等；

还包括来自国际数学奥林匹克竞赛（IMO）和国际大学生程序设计竞赛（ICPC）的题目，如各种图论和数论难题。

MIT微软为AI量身打造了一套leetcode编程题

一共包含208种题型、14万+的题目，并且还在不断更新中。

每个题目都提供了至少一种答案。

MIT微软为AI量身打造了一套leetcode编程题

这套新颖的编程挑战题库数据集，抓住了编程题目的本质，可用于教AI编程并评估AI的编程能力。

研究人员表示，这套题可以对AI的编程能力进行客观评估。因为不用查看答案，就能直接验证解答的正确性。因此，这种题目不会增加AI学习任何答案偏差的负担。

希望这个数据集可以开发出新的AI编程解决方案

不同AI求解器根据这些题目编程的效果如何呢？

研究人员做了一些深入的实验，开发了基于随机森林、Transformer和不同类型GPT-3 prompts的AI求解器，它们采用不同参数枚举、自顶向下的方法，使用这个P3数据集来评估性能。

首先，测试这些求解器在这个数据集上利用此前解决题目的方法来解决新题目的自举效率（bootstrapping efficacy）。

结果发现，增加尝试次数可以解决新题目。但它们也能通过学习过去的经验，更快地解决新的难题。

下图为这些AI求解器在不同尝试次数下的已解决题目数量：

MIT微软为AI量身打造了一套leetcode编程题

而在一项小的用户研究中，21名在Python编程方面有不同经验年限的程序员完成了不同难度的30个题目。每个题目最多分配6分钟的时间来解决。

用这个数据集评估AI与人类程序员对编程题难度的感知发现：

人类觉得难的题对AI来说也更难，现阶段情况下，AI求解器能解决的大多数题都是对人类来说比较简单的。

MIT微软为AI量身打造了一套leetcode编程题

上图表示人类和AI对各种题目的难度打分，按人类分数排序。人类的难度分数通过超出允许的最大解题时间的平均分数来衡量，AI的则是根据解题所需的尝试次数。

另外，AI用这种形式的题目可以解决了60% 的难题，初学者和有经验的程序员平均分别解决了 76% 和 87% 的难题。

总的来说，利用这个新颖的数据集，通过精心设计的AI求解器，可以大大减少AI编程求解所需的尝试次数、并解出更多的题目。

因此，研究人员希望，这个新的编程题库数据集能支持大家研究和开发新的AI编程解决方案，提高AI编程的效率和性能。

此前，UC伯克利曾训练AI刷LeetCode，总共5000道题的测试中，AI能做出15%。

不知道使用这个数据集训练，AI编程的能力又会达到什么水平呢？

论文地址：https://arxiv.org/abs/2106.05784

开源数据集链接：https://github.com/microsoft/PythonProgrammingPuzzles

— 完 —

量子位 QbitAI · 头条号签约

关注我们，第一时间获知前沿科技动态

免责声明：本站所有文章内容,图片，视频等均是来源于用户投稿和互联网及文摘转载整编而成，不代表本站观点，不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益，请在线联系站长,一经查实,本站将立刻删除。本文来自网络,若有侵权，请联系删除，如若转载，请注明出处：https://itzsg.com/73679.html

赞 (0)

0

上一篇 2024年 9月 17日上午6:24

Linux命令行与shell脚本编程大全（第三版）（一）

下一篇 2024年 9月 21日上午8:05

发表回复

多款 Chrome 浏览器扩展程序被植入恶意代码，以窃取用户数据
2天前
分享到:

多款 Chrome 浏览器扩展程序被植入恶意代码，以窃取用户数据p data vmark 43a2 a class s tag href https www ithome com target blank IT 之家 a 12 月 29 日消息据 BleepingComp 报道近期至少五款 Chrome 扩展程序遭受协同攻击攻击者通过注入恶意代码窃取用户敏感信息数据丢失防护公司 Cyberhaven 于 12 月 24 日率先披露了其扩展程序遭到入侵的消息原因是其在 Google Chrome 商店的管理账户遭遇了成功的网络钓鱼攻击 p p style text align center data vmark 4186 img src https img ithome com newsuploadfi 2024 12 f0c8a330 7fb4 45ee 88f7 3ce9c1b99d30 jpg x bce process image format f auto w 1440 h 810 data weibo 0 class lazy title 多款 Chrome 浏览器扩展程序被植入恶意代码以窃取用户数据 data original https img ithome com newsuploadfi 2024 12 f0c8a330 7fb4 45ee 88f7 3ce9c1b99d30 jpg x bce process image format f auto width 1440 height 461 p p data vmark 6336 据 IT 之家了解 Cyberhaven 的客户包括 Snowflake 摩托罗拉佳能 Reddit AmeriHealth Cooley IVP Navan 星展银行 Upstart 和 Kirkland amp Ellis 等知名企业攻击者劫持了 Cyberhaven 员工的账户并发布了恶意版本的 Cyberhaven 扩展程序版本号 24 10 4 strong 该版本包含可将已验证的会话和 Cookie 数据泄露到攻击者控制的域名 cyberhavenex pro 的代码 strong p p data vmark 5ae7 Cyberhaven 在发送给客户的邮件中表示其内部安全团队在检测到恶意程序后一小时内就将其下架干净版本的扩展程序版本号 24 10 5 已于 12 月 26 日发布除了升级到最新版本外 Cyberhaven Chrome 扩展程序的用户还被建议撤销所有非 FIDOv2 的密码轮换所有 API 令牌并检查浏览器日志以评估是否存在恶意活动 p p data vmark 947b 在 Cyberhaven 披露事件后 Nudge Security 的研究员 Jaime Blasco 根据攻击者的 IP 地址和注册域名进行了深入调查 Blasco 发现 strong 用于让扩展程序接收攻击者指令的恶意代码片段也在同一时间段被注入到其他四款 Chrome 扩展程序中 strong 包括 Uvoice ParrotTalks 等 Blasco 还发现了指向其他潜在受害者的更多域名但只有以上四款扩展程序被确认为携带了恶意代码片段 p p data vmark d4a7 建议用户将这些扩展程序从浏览器中移除或升级到 12 月 26 日之后发布的确认已修复安全问题的安全版本如果不确定扩展程序的发布者是否已获悉并修复了安全问题最好卸载该扩展程序重置重要的账户密码清除浏览器数据并将浏览器设置恢复到原始默认设置 p p class ad tips 广告声明文内含有的对外跳转链接包括不限于超链接二维码口令等形式用于传递更多信息节省甄选时间结果仅供参考 IT 之家所有文章均包含本声明 p
Linux 挥别 WinXP 时代协议，USB RNDIS 即将退场
2天前
分享到:

Linux 挥别 WinXP 时代协议，USB RNDIS 即将退场p data vmark 0d9f a class s tag href https www ithome com target blank IT 之家 a 1 月 2 日消息 Linux 基金会研究员 Greg Kroah Hartman 计划在 Linux 内核中 strong 彻底移除 USB RNDIS 协议驱动 strong p p data vmark ab76 IT 之家查询公开资料 USB RNDIS 是一种远程网络驱动接口规范将 USB 设备模拟成网卡从而在计算机和设备之间建立网络连接简单来说就是通过 USB 线缆实现 TCP IP over USB 的功能 p p data vmark db2b 该协议源于微软 Windows XP 时代存在诸多安全漏洞 Hartman 早在 2022 年 11 月就提出移除它的提议 p p data vmark 5637 Hartman 于 2024 年 12 月 23 日再次推送提案认为这个古老的协议已经不再必要反而会让系统存在诸多安全隐患容易受到网络威胁 p p data vmark 42e8 他明确指出任何使用 RNDIS 协议连接不受信任主机或设备的系统都存在安全风险最佳方案就是尽快移除 p p data vmark c04c style text align center img src https img ithome com newsuploadfi 2025 1 c0cd037d e6dc 4e9b b4ab ac3b4ba698e4 jpg x bce process image format f auto w 800 h 1119 data weibo 0 class lazy title Linux 挥别 WinXP 时代协议 USB RNDIS 即将退场 data original https img ithome com newsuploadfi 2025 1 c0cd037d e6dc 4e9b b4ab ac3b4ba698e4 jpg x bce process image format f auto width 800 height 1119 p p class ad tips 广告声明文内含有的对外跳转链接包括不限于超链接二维码口令等形式用于传递更多信息节省甄选时间结果仅供参考 IT 之家所有文章均包含本声明 p
微软 Edge 浏览器新特性前瞻：融入 Win11 系统托盘、AI 增强自动填充和收藏夹
2天前
分享到:

微软 Edge 浏览器新特性前瞻：融入 Win11 系统托盘、AI 增强自动填充和收藏夹p data vmark 27d5 a class s tag href https www ithome com target blank IT 之家 a 1 月 2 日消息科技媒体 Windows Latest 昨日 2025 年 1 月 1 日发布博文报道称在 Canary 频道最新 Microsoft Edge 浏览器中微软正测试 msTaskbarXUs 实验性 Flag strong 暗示 Windows 11 将更深度整合 Edge 功能 strong p h3 data vmark 15bd Windows 11 nbsp 系统托盘将添加 nbsp Edge nbsp 图标 h3 p data vmark 0820 该媒体反馈在启用该实验性 Flag 后相关特性暂未生效不过从名称判断应该是 Windows 11 系统托盘中会显示 Edge 浏览器的图标显示下载进度网页相关通知甚至可能还有关闭后台运行等操作 p h3 data vmark b2ee AI nbsp 自动填充 h3 p data vmark 6d5e IT 之家援引该媒体报道 Microsoft Edge 浏览器还进一步整合 AI 功能发现了 span class link text start with http msEdgeAutofi span 和 msEdgeAutofi 两个实验性 Flag 目前尚不清楚 Levo 的含义可能是某个小语言 AI 模型 p p data vmark aa98 style text align center img src https img ithome com newsuploadfi 2025 1 231b8fbe b432 4c30 b9ab 9be10f1e5f3f jpg x bce process image format f auto w 1219 h 849 data weibo 0 class lazy title 微软 Edge 浏览器新特性前瞻融入 Win11 系统托盘 AI 增强自动填充和收藏夹 data original https img ithome com newsuploadfi 2025 1 231b8fbe b432 4c30 b9ab 9be10f1e5f3f jpg x bce process image format f auto width 1219 height 571 p p data vmark 5048 该媒体推测 Edge 浏览器在启用上述实验性 Flag 后可以更智能地建议登录信息信用卡或地址等特别是对于经常填写送货表单的用户 Edge 能够学习用户习惯更快地提供所需信息 p h3 data vmark a8b0 增强收藏夹 h3 p data vmark ad4c 此外还发现了 msFavoritesR 和 msFavoritesL 两个实验性 Flag 预示着微软将升级 Edge 浏览器的收藏夹功能这些嵌入技术可能基于 AI 或索引方法让用户能够通过上下文而非仅仅标题或 URL 搜索书签实现更精准的查找 p p class ad tips 广告声明文内含有的对外跳转链接包括不限于超链接二维码口令等形式用于传递更多信息节省甄选时间结果仅供参考 IT 之家所有文章均包含本声明 p
微软 Edge 浏览器将迎来 Fluent Design 视觉更新，性能优化同步进行
4天前
分享到:

微软 Edge 浏览器将迎来 Fluent Design 视觉更新，性能优化同步进行p data vmark 44cd a class s tag href https www ithome com target blank IT 之家 a 1 月 1 日消息微软 Edge 浏览器即将迎来一次新的 Fluent Design 设计更新虽然备受期待的由 Mustafa Suleyman 领导的 AI 驱动的 Edge 重大更新暂时不会到来但根据 Windows Latest 的最新发现微软正计划为 Edge 添加更多 Fluent Design 元素 p p style text align center data vmark 68e7 img src https img ithome com newsuploadfi 2025 1 15e14c8e 947b 4f82 8c88 d5496db2c2d1 jpg x bce process image format f auto w 696 h 365 data weibo 0 class lazy title 微软 Edge 浏览器将迎来 Fluent Design 视觉更新性能优化同步进行 data original https img ithome com newsuploadfi 2025 1 15e14c8e 947b 4f82 8c88 d5496db2c2d1 jpg x bce process image format f auto width 696 height 365 p p data vmark 967f 据 IT 之家了解 Fluent Design 的亚克力 Acrylic 效果是一种模糊效果 strong 可以使基于亚克力的元素背后的内容或网页隐约可见 strong 例如在 Windows 11 上的 Edge 中右键单击任何位置菜单都会呈现出模糊效果这就是亚克力效果也是 Fluent Design 系统的一部分 p p data vmark fe90 微软正在开发一个名为 msEdgeVisual 的更新旨在为 Microsoft Edge 的某些功能和元素带来亚克力效果 Windows Latest 发现了两个与 msEdgeVisual 相关的新线索第一个是 span class link text start with http msEdgeVisual span 虽然具体含义尚不明确但推测这可能是一个与原生界面上的亚克力效果相关的内部标记或功能标识符亚克力效果本身并非新事物最近已添加到 Edge 的菜单中如上文所述在 Edge 的各种菜单中均有应用 p p data vmark 8d94 第二个线索是 span class link text start with http msEdgeVisual span 这个线索的含义相对容易理解 strong 显然指的是位于浏览器左上角的个人资料菜单 strong 该菜单允许用户在不同配置文件之间切换并显示 Microsoft Rewards 以及其他与微软帐户相关的信息目前个人资料菜单尚未应用 Fluent Design 的亚克力或云母 Mica 效果 p p style text align center data vmark a354 img src https img ithome com newsuploadfi 2025 1 6d65158f 812e 4806 b620 7b024874f541 jpg x bce process image format f auto w 626 h 572 data weibo 1 class lazy title 微软 Edge 浏览器将迎来 Fluent Design 视觉更新性能优化同步进行 data original https img ithome com newsuploadfi 2025 1 6d65158f 812e 4806 b620 7b024874f541 jpg x bce process image format f auto width 626 height 572 p p data vmark b5d1 除了视觉更新之外 Edge 还在进行性能优化 a href https www ithome com 0 816 001 htm target blank Edge 正在通过使用 WebUI 2 0 重写部分功能 a 以实现更快的性能和更高的响应速度 WebUI 2 0 是一个新的框架旨在加快 Edge 的加载速度微软过去使用 JavaScript 来处理许多 Edge 功能但该公司意识到 JavaScript 会导致性能下降因此他们开始将这些功能迁移到 WebUI 2 0 并观察到了显著的改进例如 Microsoft Edge 的一项功能 Browser Essentials 现在的加载速度提高了 42 收藏夹栏的速度提高了 40 Copilot 撰写框也将获得类似的性能提升并且微软还计划使用 WebUI 2 0 重写 PDF 阅读器以提高其速度 p p style text align center data vmark 3915 img src https img ithome com newsuploadfi 2025 1 5518f2fd 2db1 407d 9346 bf47bc3f3ba6 gif w 800 h 450 data weibo 2 data preview https img ithome com newsuploadfi 2025 1 5518f2fd 2db1 407d 9346 bf47bc3f3ba6 gif x bce process image format f png class lazy title 微软 Edge 浏览器将迎来 Fluent Design 视觉更新性能优化同步进行 data original https img ithome com newsuploadfi 2025 1 5518f2fd 2db1 407d 9346 bf47bc3f3ba6 gif width 800 height 450 p p class ad tips 广告声明文内含有的对外跳转链接包括不限于超链接二维码口令等形式用于传递更多信息节省甄选时间结果仅供参考 IT 之家所有文章均包含本声明 p
编程语言 Ruby 3.4 正式发布：引入“it”块参数引用方式、模块化垃圾回收机制
2024年 12月 29日
分享到:

编程语言 Ruby 3.4 正式发布：引入“it”块参数引用方式、模块化垃圾回收机制p data vmark 616d a class s tag href https www ithome com target blank IT 之家 a 12 月 27 日消息 Ruby 3 4 nbsp 正式版现已发布 IT 之家参考更新说明获悉该版本主要在性能和开发效率方面进行优化 strong 引入 it 作为不带变量名的块参数的引用方式扩展了模块化垃圾回收机制并将默认解析器从 span class link text start with http parse y span 改为 Prism strong p p style text align center data vmark 48f3 img src https img ithome com newsuploadfi 2024 12 5741feb3 797e 4611 9c01 b41a5691497c png x bce process image watermark image aW1nL3dhdGVy t 100 g 3 y 0 x 0 a 0 format f auto w 1440 h 541 data weibo 0 class lazy title 编程语言 Ruby 3 4 正式发布引入 it 块参数引用方式模块化垃圾回收机制 data original https img ithome com newsuploadfi 2024 12 5741feb3 797e 4611 9c01 b41a5691497c png x bce process image watermark image aW1nL3dhdGVy t 100 g 3 y 0 x 0 a 0 format f auto width 1440 height 308 p p data vmark 6365 官方介绍了 Ruby 3 4 引入的 it 块参数引用方式官方使用 span class link text start with http ary map span span class link text start with http it upcase span 作为例子声称相对现有的 1 2 等数字参数更简洁更具可读性 p p style text align center data vmark ec06 img src https img ithome com newsuploadfi 2024 12 cc73d364 a5a9 45cf b04e 9b3c54305ddd png x bce process image watermark image aW1nL3dhdGVy t 100 g 3 y 0 x 0 a 0 format f auto w 1258 h 670 data weibo 1 class lazy title 编程语言 Ruby 3 4 正式发布引入 it 块参数引用方式模块化垃圾回收机制 data original https img ithome com newsuploadfi 2024 12 cc73d364 a5a9 45cf b04e 9b3c54305ddd png x bce process image watermark image aW1nL3dhdGVy t 100 g 3 y 0 x 0 a 0 format f auto width 1258 height 437 p p data vmark f57a 此外 Ruby 3 4 对垃圾回收机制进行模块化处理 Modular GC 将 Ruby 原先内置的垃圾回收器分拆为独立的模块文件从而增强灵活性 p p style text align center data vmark 04a4 img src https img ithome com newsuploadfi 2024 12 22214619 d524 43b1 b90f 5d9e3c5bade8 png x bce process image watermark image aW1nL3dhdGVy t 100 g 3 y 0 x 0 a 0 format f auto w 1362 h 876 data weibo 2 class lazy title 编程语言 Ruby 3 4 正式发布引入 it 块参数引用方式模块化垃圾回收机制 data original https img ithome com newsuploadfi 2024 12 22214619 d524 43b1 b90f 5d9e3c5bade8 png x bce process image watermark image aW1nL3dhdGVy t 100 g 3 y 0 x 0 a 0 format f auto width 1362 height 527 p p data vmark be10 在性能方面 Ruby 3 4 对 YJIT 即时编译器进行了多项优化改进了内存压缩和字符串处理能力同时为套接字库带来了 nbsp RFC 8305 Happy Eyeballs V2 支持号称显著提升了 Ruby 程序在现代网络环境中的连接效率相关技术支持 IPv6 与 IPv4 的并行解析与连接通过 250 毫秒的间隔进行并行尝试以便于应用快速建立最佳连接确保在各种网络环境中保证稳定可靠性 p p style text align center data vmark 2955 img src https img ithome com newsuploadfi 2024 12 80cf60b8 d637 4ab7 aa08 b54a549f22c8 png x bce process image watermark image aW1nL3dhdGVy t 100 g 3 y 0 x 0 a 0 format f auto w 1320 h 1034 data weibo 3 class lazy title 编程语言 Ruby 3 4 正式发布引入 it 块参数引用方式模块化垃圾回收机制 data original https img ithome com newsuploadfi 2024 12 80cf60b8 d637 4ab7 aa08 b54a549f22c8 png x bce process image watermark image aW1nL3dhdGVy t 100 g 3 y 0 x 0 a 0 format f auto width 1320 height 642 p p class ad tips 广告声明文内含有的对外跳转链接包括不限于超链接二维码口令等形式用于传递更多信息节省甄选时间结果仅供参考 IT 之家所有文章均包含本声明 p
工信部通报 2024 年第 10 批共 22 款侵害用户权益行为的 App 及 SDK
2024年 12月 29日
分享到:

工信部通报 2024 年第 10 批共 22 款侵害用户权益行为的 App 及 SDKp data vmark 0f00 a class s tag href https www ithome com target blank IT 之家 a 12 月 27 日消息工业和信息化部信息通信管理局今日发布关于侵害用户权益行为的 App SDK 通报 2024 年第 10 批总第 45 批 p p data vmark 5b20 style text align left 工业和信息化部高度重视用户权益保护工作依据个人信息保护法网络安全法电信条例电信和互联网用户个人信息保护规定等法律法规持续整治 App 侵害用户权益的违规行为 p p data vmark 06ce style text align left 工信部近期组织第三方检测机构进行抽查 strong 共发现 22 款 App 及 SDK 存在侵害用户权益行为 strong 现予以通报 p p data vmark 8195 style text align left IT 之家附工业和信息化部通报存在问题的 App SDK 名单如下 p p data vmark 52de style text align center p p data vmark fe24 style text align center p p data vmark c563 style text align center p p data vmark 3285 style text align center p p data vmark 8c94 style text align left 上述 App 及 SDK 应按有关规定进行整改整改落实不到位的工信部将依法依规组织开展相关处置工作 p p class ad tips 广告声明文内含有的对外跳转链接包括不限于超链接二维码口令等形式用于传递更多信息节省甄选时间结果仅供参考 IT 之家所有文章均包含本声明 p

云烟 2023年 4月 25日

你这文采，堪称现代李白

评论于 Servlet 数据库访问[通俗易懂]
样 2023年 4月 25日

博主有大厦之将倾而面不改色，狂澜于既倒而稳如泰山只能。

评论于 Servlet 数据库访问[通俗易懂]
样 2023年 4月 25日

博主好文采

评论于古天乐拍戏误伤眼球缝八针！而他第一时间却只想给粉丝道歉[通俗易懂]
样 2023年 4月 25日

干货干货

评论于 UG编程，钻孔攻丝，铣螺纹，干货知识[亲测有效]
云烟 2023年 4月 25日

人家是chatGPT 不是GBT

评论于程序开发中MySql、SQLServer、SQLite数据库的使用场景及性能评测

联系我们YX

mu99908888

在线咨询：微信交谈

邮件：itzsgw@126.com

工作时间：时刻准备着!

关注微信