alibaba deepseek - 搜索 News

对比近期开源的Mistral-Small-3.1-24B 、Gemma-3-27B-IT等， Qwen2.5-VL-32B在纯文本能力上也达到了同规模的SOTA表现。在多个基准上，Qwen2.5-VL-32B甚至超过了72B。

由于中国AI企业DeepSeek开发出了高性能的低成本大语言模型，2025年1月下旬，英伟达（NVIDIA）等美国高科技公司的股价暴跌。“DeepSeek冲击”这一说法，可能模仿了前苏联在1957年成功发射全世界第一颗人造卫星“斯普特尼克1号（Spu ...

腾讯网22 天

Alibaba 新开源模型 QwQ-32B：以更小算力匹敌 DeepSeek-R1

这些包括 OpenAI 的 o3 系列和来自竞争对手中国实验室 DeepSeek 的非常成功的 DeepSeek-R1，该实验室是香港量化分析公司 High-Flyer Capital Management 的一个分支。根据网络流量分析和研究公司 SimilarWeb 的一份新报告，自 2024 年 1 月 R1 推出以来，DeepSeek 已迅速攀升至成为 ...

腾讯网22 天

Alibaba 新开源模型 QwQ-32B：以更小算力匹敌 DeepSeek-R1

这些包括 OpenAI 的 o3 系列和来自竞争对手中国实验室 DeepSeek 的非常成功的 DeepSeek-R1，该实验室是香港量化分析公司 High-Flyer Capital Management 的一个分支。

腾讯网12 天

诞生了DeepSeek的中国AI生态为何与美国不同？

通过押注AI，中国希望能开发面向全球市场，尤其是低收入国家的成本效益高的实用商业工具。图片来源：Pexels本文转载自公众号“自然系列”原文作者：Jacob Dreyer当美国科技企业家彼得·蒂尔（Peter Thiel）的书《从0到1》（Zero ...

36氪1 个月

DeepSeek开源周第四弹，3大猛料一口气发完，梁文锋亲自贡献

DeepSeek开源三大算法，提升计算性能。 DeepSeek开源三大优化策略，网友：已打破最后封印。智东西2月27日报道，刚刚，DeepSeek开源周第四弹来袭 ...

新浪网28 天

理论成本利润率545%！DeepSeek 知乎发文引业内震动

3月1日，DeepSeek官方认证账号在知乎发布了《DeepSeek-V3/R1推理系统概览》(下称《概览》)一文，首次公布模型推理系统的核心 ...

36氪4 天

DeepSeek V3再次震撼硅谷

DeepSeek发布V3-0324模型，消费级硬件运行，开源免费挑战GPT-5。 DeepSeek周一晚发布了V3-0324模型，初步测试显示其可在消费级硬件上运行，打破大模型 ...

华尔街日报中文版4 天

DeepSeek发布更新版大语言模型，称其推理能力更强

DeepSeek宣布了DeepSeek V3-0324更新，称较上一版本有“显著的改进”，包括更好的推理、网络开发和搜索能力。中国人工智能(AI)初创公司DeepSeek发布了其大语言模型的更新版，称后者具备更强的推理能力。几个月前，这家公司推出一款旨在与OpenAI模型竞争的低成本 ...

新浪网29 天

DeepSeek“开源周”今日收官，都发布了什么？

2月28日，国内AI明星企业深度求索（DeepSeek）为期五天的“开源周”活动正式收官。 “开源周”都发布了什么？自2月24日启动以来，DeepSeek“开源周 ...

快科技18 天

美国怎么防！消息称DeepSeek-R2将于下周一发布：多个关键领域实现突破

快科技3月11日消息，据国内媒体报道称，DeepSeek新版已经准备就绪，其在多个关键领域实现突破。报道称，DeepSeek下一代AI模型DeepSeek-R2或将于3月17日 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果