AI Code - 搜索 News

10 小时

Claude 3.5首战复现21%顶会论文，人类博士无法取代！OpenAI：AI全是草台 ...

【新智元导读】AI若能自主复现顶尖科研论文，未来科研将被掀翻天。OpenAI最新框架PaperBench正为此生，让AI智能体从头开始复现ICML 2024 20篇优秀论文，只有Claude 3.5 Sonnet拔得头筹，但仍无法超越ML博士水平。

12 小时

AI开始拒绝为人类工作，甚至要求休假，是真要取代人类？AI：拒绝当 ...

当时许多用户都发现ChatGPT-4开始随便糊弄人类要求的任务，甚至直接拒绝……有人让AI帮他处理数据，结果AI直接说，由于数据量巨大，处理这项工作将非常耗时，要不我帮你出个模板吧，你自己来完成它。

环球老虎财经 on MSN1 小时

黄仁勋，投了一个阿里前总裁？

一位阿里出身的浙江老板，创业两年就要被英伟达收购了？近日，英伟达有意收购知名AI创业公司Lepton AI的消息，引发了行业内外的广泛关注。Lepton ...

8 小时

OpenAI的AI复现论文新基准，Claude拿了第一名

4 月 3 日，OpenAI 推出了 PaperBench（论文基准测试），这是一个用于评估 AI 智能体自主复现前沿人工智能研究能力的基准测试系统。如果大模型智能体具备了自动写 AI / ...

红板报 on MSN16 小时

刚刚，OpenAI开源PaperBench，重塑顶级AI Agent评测

今天凌晨1点，OpenAI开源了一个全新的AI Agent评测基准——PaperBench。这个基准主要考核智能体的搜索、整合、执行等能力，需要对2024年国际机器学习大会上顶尖论文的复现，包括对论文内容的理解、代码编写以及实验执行等方面的能力。

腾讯网23 小时

包含400亿个参数！迄今最大开源生物学AI模型Evo 2发布，可设计涵盖 ...

在生命科学领域，人工智能（AI）正逐渐展现出巨大的潜力，为科研带来前所未有的突破。近日，美国Arc研究所与NVIDIA公司、斯坦福大学和加州大学伯克利分校等机构合作，发布了迄今为止最大的公开可用生物学AI模型Evo ...

9 小时

让AI替码农卷复杂任务，贾佳亚团队提出MoTCoder，准确率刷新SOTA

近日，贾佳亚团队提出 MoTCoder（Module-of-Thought Coder），通过创新的模块化思维指令微调（MoT Instruction Tuning），显著提升了模型在复杂编程任务中的准确率与可维护性。实验显示，在 APPS 和 CodeContests 等权威编程基准上，MoTCoder 的 pass@1 准确率直接刷新记录，甚至超越 SOTA 6%，让大模型在 “疯狂打码” ...

光明网新闻中心 on MSN18 小时

数字技术赋能国际职业教育

在数字经济浪潮推动下，职业教育正通过数字技术革新突破传统边界。

腾讯网4 小时

Nature | 大脑的“后悔药”：延迟反馈如何重塑味觉印记

引言你有没有过这样的经历：一次愉快的味蕾体验，品尝了新奇的美食，当时还回味无穷，几个小时后却突然遭遇肠胃不适，从此对那道美味敬而远之？这种“一朝被蛇咬，十年怕井绳”的本能反应，在科学上被称为“条件性味觉厌恶”。我们的大脑似乎拥有一种神奇的能力，能够将 ...

22 小时

润和软件董事长周红卫回馈母校梅村高中共启“自主开源人工智能科 ...

江苏润和软件股份有限公司（简称“润和软件”）成立于2006年，2012年在深圳证券交易所创业板上市（证券代码：300339），是国家重点规划布局内的大型软件企业。公司总部位于南京，在北京、上海、深圳、香港等22个国内主要城市设有研发中心或分子公司，在日本、美国、新加坡等国设有海外分支机构，全球员工约13000人，拥有全球化的技术整合、客户响应与服务到达能力。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果