资讯
2. 时间动态理解缺陷模型在理解随时间变化的跨帧信息方面表现不佳,难以准确计算和描述运动特征如位移、速度和轨迹。尤其难以区分物体运动与相机运动,这些问题源于跨帧信息整合困难和物理先验的缺失。
OpenAI重磅发布的GPT-4.1系列模型,带来了编程、指令跟随和长上下文处理能力的全面飞跃!由中科大校友Jiahui Yu领衔的团队打造。与此同时,备受争议的GPT-4.5将在三个月后停用,GPT-4.1 ...
Agent始终是一个绕不开的话题。Alex很果断地判断:通用Agent的爆发时机还没有到。首先,在某些领域,模型本身做的不是特别好,比如模型跟物理世界的交互能力还不够好;其次,算力成本核算下来依旧过高;此外,不同场景的壁垒有待打通,私有的DataSe ...
OpenAI 表示,这三个模型的性能全面超越了 GPT-4o 和 GPT-4o mini,并在编程和指令遵循方面均有显著提升。它们还拥有更大的上下文窗口 —— 支持高达 100 万个上下文 ...
我们提出的解决方案是 JEPA(联合嵌入预测架构),它不直接生成像素级的预测,而是在一个更抽象的“表征空间”里进行推理。这有点像人类的大脑——我们不会在脑子里渲染每一帧画面,而是用更高效的方式理解世界。
谷歌将于2025年4月发布的Chrome 136版本引入"已访问链接分区"功能,这项突破性特性将修复困扰互联网二十余年的隐私漏洞。作为首个实现这一强力防护机制的主流浏览器,Chrome确保用户浏览历史免遭窥探,标志着在线安全领域的重大进步。
2025年第一季度记录显示,勒索软件活动达到历史峰值:超过2,063名受害者,70个活跃勒索组织,同比增长56%。非营利机构遭受的攻击激增106%,教育行业事件增长16%,而制造业和医疗保健仍是持续攻击目标。
aider多语言编程基准测试显示,Gemini 2.5 Pro近出世半个多月,编程能力已经是全球第一,口碑一众超越Claude 3.7 Sonnet。 Aider Polyglot基准测试是评估AI模型在多语言编程能力上的重要指标,涉及C++、Go、Java、JavaScript、Python和Rust等多种编程语言。
按照惯例,首日更新往往最重磅。而这一次,OpenAI 在预告中就明确点名:这是一款为开发者准备的硬核模型,并用一个形象的比喻预热它——“开发者 🤝 超大质量黑洞”。
DeepSeek 默默地在自己的 open-infra-index 库中发布了一份题为「开源 DeepSeek 推理引擎的路径」的文档,宣布将开源自己的内部推理引擎(internal inference engine)并与开源社区建立更广泛的合作。有意思的是,该文档发布之后不久就经历了两次修改,对一些措辞和表述进行了更加中立和宽泛的处理。
该机构与佐治亚理工学院合作,开发了CHAT (Cetacean Hearing Augmentation Telemetry) 这款水下应用,其设计目的并非直接解读海豚复杂的自然语言,而是建立一套更简单的共享词汇。
专门针对Microsoft 365和Gmail账户实施多因素认证(MFA)绕过的钓鱼即服务(PhaaS)平台Tycoon2FA近期完成功能升级,其隐蔽性和规避检测能力显著提升。该平台最初由Sekoia研究人员于2023年10月发现,随后持续迭代增强攻击效能。据Trustwave最新报告,攻击者新增多项技术改进以突破终端安全防护。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果