Token 图 - Search News

红板报 on MSN1d

视觉Token无缝对齐LLMs词表！V²Flow：基于LLMs实现高保真自回归图像生成

V²Flow团队发自凹非寺量子位 | 公众号 QbitAI 视觉Token可以与LLMs词表无缝对齐了！ V²Flow，基于LLMs可以实现高保真自回归图像生成。随着ChatGPT掀起自回归建模革命后，近年来研究者们开始探索自回归建模在视觉生成任务的应用，将视觉和文本数据统一在“next-token prediction”框架下。实现自回归图像生成的关键是设计向量化(Vector-Quan ...

谷歌Meta AI技术封锁！电商人如何用AI一键换背景，轻松制作吸金商品图？

最近，谷歌和Meta都在疯狂布局AI技术，谷歌甚至想要封锁自家的AI技术，而Meta则提出了全新的“多token注意力”技术。这些黑科技听起来很高大上，但对于我们普通的电商人来说，如何才能真正用上这些技术呢？

腾讯网13d

掀桌子了！满血版3万Tokens每秒，英伟达捅破DeepSeek推理性能天花板！关键技术全揭秘

30000个tokens每秒，太炸裂了！刚刚，英伟达在2025GTC大会上宣布了创世界纪录的满血 DeepSeek-R1 推理性能。 DGX系统搭载八颗NVIDIA Blackwell GPU，在DeepSeek-R1模型（6710亿参数）推理任务中创下了世界纪录↓ 单用户推理速度超过每秒250个token，峰值吞吐量超过每秒30000个token。这一突破性的性能提升，得益于针对NVIDIA ...

腾讯网7d

长视频理解新突破！Mamba混合架构让显存消耗腰斩，处理10万视频token不费力

在多个长视频的评价标准上，Vamba保持了高准确率和出色的性能，尤其在LVBench长视频理解基准上相较先前的高效长视频理解模型达到了约4.3%的性能提升。团队现已开源Vamba模型的代码、模型权重以及训练、推理脚本供研究社区进一步探索与应用。

Some results have been hidden because they may be inaccessible to you

Show inaccessible results