2 天on MSN
近期,美国加州大学圣地亚哥分校的研究团队公布了一项令人瞩目的研究成果,声称他们已经找到了人工智能系统能够成功通过标准三方图灵测试的实际证据。此次研究中,四种AI系统——GPT-4.5、LLaMa-3.1-405B、GPT-4o以及ELIZA接受了严格的测试。
值得注意的是,在所有参与测试的AI系统中, GPT-4.5的表现尤为突出 ,裁判将其误认为人类的比率高达73%。有趣的是,这一比例甚至超过了真实人类参与者被选中的比例,从而证实了GPT-4.5在模拟人类行为方面的显著优势。
格隆汇4月3日|美国加州大学圣地亚哥分校发布了一项研究成果,宣称首次提供了“人工智能系统能够通过标准三方图灵测试的实证证据”。研究选择了四种 AI 系统:GPT-4.5、LLaMa-3.1-405B、GPT-4o 和 ELIZA。实验设计为每轮对话中,裁判与两个人类和一个AI系统进行对话,以判断何者为人类。其中,GPT-4.5被判断为人类的比例高达73%,显著高于真实人类参与者被选中的比例。
这表明,尽管测试人员能够成功地区分人类与ELIZA,但他们在与GPT-4.5-PERSONA和LLAMA-PERSONA比较时,无法可靠地识别出人类。
相比之下,LLaMa-3.1-405B虽然在技术上同样令人印象深刻,但在情感表达和语境适应性上略逊一筹。然而,其在特定设定下的表现已接近人类水平,显示出开源模型在AI竞赛中的潜力。而GPT-4o作为GPT-4.5的前代,虽然能力不俗,但在人格化表现和动态调整方面与后者存在明显差距。
BlockBeats 消息,4 月 1 日,ai16z 创始人 Shaw 在社交媒体发文表示:「Launchpad 平台 auto.fun 已准备就绪,我们将在两周内与首批合作伙伴一起启动。此外 Eliza v2 也已准备就绪,我们即将开始营销和发布公告,并正式上线。」 ...
组图:"人机共创·2025AI赋能正能量创作大会"举办,正能量,何宁,机器人,人工智能,南宁 ...
第四范式推出SageOne Lite,可8.8万元运行满血版DeepSeek,第四范式,lite,deepseek,一体机,sageone ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果