Python 1 - 搜索 News

大模型又迎来一个历史性的技术，MCP（Model Context ...

1 天

「注意力实际上是对数的」？七年前的Transformer还有新发现，Karpathy点赞

事实上，由于注意力至少需要将 QK^T 部分实体化（通常是非常大的整数，非常大的整数），这几乎肯定会溢出二级缓存（这要么迫使你在内存中计算的速度慢于 OOM，要么迫使你通过将 QK^T 矩阵分片为部分关联块并传入 softmax 来将其转化为顺序问题 ...

4 天on MSN

豆包AI编程大升级，HTML预览、Python运行，一键生成完整项目！

近期，豆包平台在AI编程领域迈出了重要步伐，宣布对其编程功能进行了三项重大升级，为用户带来了更为便捷和高效的编程体验。此次升级涵盖了HTML预览、Python运行以及完整项目生成三大方面。

红板报 on MSN10 天

ChatGPT再进化：o1支持调用Python分析数据，网友：已经成为Copilot了

克雷西发自凹非寺量子位 | 公众号 QbitAI 今天一大早，ChatGPT突然更新—— 基于Python的数据分析功能，在o1和o3-mini当中也可以使用了。

IT之家26 天

DeepSeek 开源进度 2/5：首个用于 MoE 模型训练和推理的 EP 通信库 DeepEP

CUDA 12.3 及以上版本 PyTorch 2.1 及以上版本使用 NVLink 进行节点间通信基于 RDMA 网络的节点间通信广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。

IT之家28 天

DeepSeek 代码库开源进度 1/5：为 Hopper GPU 优化的高效 MLA 解码内核 FlashMLA

IT之家2 月 24 日消息，DeepSeek 今日启动“开源周”，首个开源的代码库为 FlashMLA—— 针对 Hopper GPU 优化的高效 MLA 解码内核，专为处理可变长度序列而设计。据介绍，FlashMLA 的灵感来自 FlashAttention 2&3 和 cutlass 项目。使用 CUDA 12.6，H800 SXM5 在内存受限配置下可达 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果