alibaba deepseek - 搜索 News

1 天

中国开源力量的崛起正在重塑全球人工智能格局。 recent reports indicate that Chinese tech giants like DeepSeek, Alibaba, and Qiankun Technology are ...

对比近期开源的Mistral-Small-3.1-24B 、Gemma-3-27B-IT等， Qwen2.5-VL-32B在纯文本能力上也达到了同规模的SOTA表现。在多个基准上，Qwen2.5-VL-32B甚至超过了72B。

由于中国AI企业DeepSeek开发出了高性能的低成本大语言模型，2025年1月下旬，英伟达（NVIDIA）等美国高科技公司的股价暴跌。“DeepSeek冲击”这一说法，可能模仿了前苏联在1957年成功发射全世界第一颗人造卫星“斯普特尼克1号（Spu ...

通过押注AI，中国希望能开发面向全球市场，尤其是低收入国家的成本效益高的实用商业工具。图片来源：Pexels本文转载自公众号“自然系列”原文作者：Jacob Dreyer当美国科技企业家彼得·蒂尔（Peter Thiel）的书《从0到1》（Zero ...

Qwen 团队是中国电商巨头阿里巴巴的一个部门，专注于开发其不断扩展的开源 Qwen 大语言模型（LLM）系列。该团队推出了 QwQ-32B，这是一种新的 320 亿参数推理模型，旨在通过强化学习（RL）提高复杂问题解决任务的性能。该模型作为开源权重在 Hugging Face 和 ...

但与 DeepSeek-R1 一样，该模型可在 Hugging Face 上下载并进行离线使用和微调或重新训练，这表明这些问题可以相对容易地克服。

36氪20 天

对于这个问题，其实有不少专业文章都做过解释，不过大家未必会想去看万字长文，也对枯燥的学术概念没啥兴趣。所以小雷 ...

7 天

对比近期开源的 Mistral-Small-3.1-24B 、Gemma-3-27B-IT 等，Qwen2.5-VL-32B 在纯文本能力上也达到了同规模的 SOTA 表现。在多个基准上，Qwen2.5-VL-32B 甚至超过了 72B。

来自MSN24 天

Qwen 团队是中国电商巨头阿里巴巴的一个部门，专注于开发其不断扩展的开源 Qwen 大语言模型（LLM）系列。该团队推出了 QwQ-32B，这是一种新的 320 亿 ...

3月1日，DeepSeek官方认证账号在知乎发布了《DeepSeek-V3/R1推理系统概览》(下称《概览》)一文，首次公布模型推理系统的核心 ...

36氪29 天

DeepSeek的超高利润率，不仅是一个数字上的奇迹，更是对整个AI行业的一次深刻启示。在过去一周的开源周上， DeepSeek“五天五连炸”让市场 ...

快科技3月11日消息，据国内媒体报道称，DeepSeek新版已经准备就绪，其在多个关键领域实现突破。报道称，DeepSeek下一代AI模型DeepSeek-R2或将于3月17日 ...

当前正在显示可能无法访问的结果。