Llama 3.1 - 搜索 News

5 小时

同时，基于英特尔酷睿Ultra系列处理器打造的AI PC，可以说是性能体验最好、稳定性最好、兼容性最好的本地化AI部署平台。Ollama、Flowy、LM Studio、Miniforge等常用软件全部支持，并且支持Intel ...

11 小时

全新华硕Ascent GX10的配备了先进的NVIDIA GB10超级芯片，该芯片采用Grace Blackwell架构设计，并针对紧凑型外形进行了优化。功能强大的GB10芯片包含一个强大的BlackwellGPU，支持第五代张量核心和FP4，可提供高达1000TOPS的AI处理能力。此外，它还配备了高性能的Grace ...

爱范儿2 小时

笔记本跑百亿大模型？在 AMD 这里没问题

尽管参数量极大，过往对硬件要求也极高，远超过去业界对于移动计算设备本地推理能力的认知上限——笔记本电脑现在也可以顺利且轻松地运行数百亿参数量的大模型了。 AMD 这样做的目的，是确保基于大模型的企业级应用和科研能力，能够被普及到 x86 阵营的笔记本 ...

腾讯网1 天

大模型怎么做好角色扮演？最大的真实数据集、SoTA开源模型、最深入 ...

王鑫涛，复旦大学博士生，师从肖仰华、汪卫教授，致力于探索用AI创造具有人格的数字生命。研究方向聚焦大语言模型与Agent技术，在AI角色扮演领域发表多篇ACL/EMNLP论文，以及该领域首篇研究综述，总计引用量三百余次。他的研究寻求AI技术与人类情感 ...

1 天

OpenAI CEO奥特曼：我们一直在改变规则马斯克会把坏事做尽

从那以后，所有人都被打开了一扇新世界的大门，萨姆·奥特曼（Sam ...

23 小时

苹果杀疯了，Mac Studio内存狂飙，跑满血DeepSeek R1消耗448GB，M3 Ultra竟然 ...

最终，DeepSeek R1 在 M3 Ultra Mac Studio 表现不错。虽然这里用的是 4-bit 量化版本，牺牲了一定的精度，但模型依然保持了完整的 6710 亿参数，速度为 16-18 ...

腾讯网1 天

RAG-Gym: 基于过程监督的检索增强生成代理优化框架

RAG-Gym将知识密集型问答任务形式化为嵌套马尔可夫决策过程 ...

1 天

砍掉99%采样成本，腾讯AI Lab提出大模型无监督训练新技术

腾讯AI Lab与香港中文大学（深圳）合作开展了一项新研究，提出了这样一种名为无监督前缀微调（UPFT）的方法。团队研究发现，关键的正确推理信号，全都藏在模型的“前几步”里，将这种现象称为“推理前序自一致性”。

6 天on MSN

富士康自研AI大模型FoxBrain出炉，120块英伟达H100显卡4周打造！

富士康，这家全球首屈一指的电子产品代工巨头，近日宣布了一项重大技术突破：成功自主研发出首款针对繁体中文的AI大语言模型——FoxBrain。这一创新成果标志着富士康在人工智能领域的又一重要里程碑。

头部财经6 天

实测苹果M3 Ultra运行DeepSeek R1满血版：速度超过8卡A100！

快科技3月12日消息，近日，B站UP主“虽然但是张黑黑”分享了一段视频，展示了满血版苹果M3 Ultra运行6710亿参数的DeepSeek R1模型的测试结果，其速度甚至超过了8张A100显卡，而成本却低得多。运行6710亿参数的DeepSeek ...

6 天

苹果M3 Ultra实测：实力超越8张A100显卡，AI性能惊人！

近期，B站知名UP主“虽然但是张黑黑”分享的一段视频引发了广泛关注，揭示了苹果最新的满血版M3 Ultra芯片在运行超大规模AI模型时的非凡表现。测试中，这款芯片驱动的DeepSeek R1模型拥有惊人的6710亿参数，其性能竟然超越了8张NVIDIA A100显卡。令人咋舌的是，M3 Ultra在这场性能比拼中的花费却远低于传统的GPU解决方案。通常，要处理如此庞大的AI模型，用户不得不依赖于 ...

5 天

大模型长文推理迎来“核弹级”提速！清华APBB框架狂飙10倍，Flash ...

要知道，随着 ChatGPT 等大模型的爆火，AI 们“阅读”能力也水涨船高，动辄处理十几万字的长文不在话下。然而，面对海量信息，传统大模型的“大脑”却有点卡壳—— Transformer 架构虽强，但其核心的注意力机制就像一个“ 超级扫描仪”，文本越长，扫描范围呈指数级膨胀，速度自然就慢了下来。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果