Llama 3.1 - 搜索 News

1 天

砍掉99%采样成本，腾讯AI Lab提出大模型无监督训练新技术

腾讯AI Lab与香港中文大学（深圳）合作开展了一项新研究，提出了这样一种名为无监督前缀微调（UPFT）的方法。团队研究发现，关键的正确推理信号，全都藏在模型的“前几步”里，将这种现象称为“推理前序自一致性”。

51CTO28 天

Llama模仿Diffusion多模态涨分30%！不卷数据不烧卡，只需共享注意力分布

中国研究员联合DeepMind团队的最新研究《Lavender: Diffusion Instruction Tuning》，通过简单的“注意力对齐”，仅需1天训练、2.5%常规 ...

IT之家1 个月

米哈游《崩坏：星穹铁道》3.1 版本「门扉之启，王座之终」 2 月 26 ...

感谢IT之家网友 F宝、软媒新友2077564、软媒新友2010825、最亮的派大星、肖战割割的线索投递！ IT之家2 月 14 日消息，米哈游今晚宣布《崩坏：星穹铁道》3.1 版本「门扉之启，王座之终」将于 2025 年 2 月 26 日上线，全新角色、全新场景、全新活动即将上线。

搜狐1 个月

中国AI模型震惊世界，这3个人要哭惨了！

中国AI模型震惊世界这3要个人哭惨了： 1.马克•扎克伯格，原来的Facebook，现在的Meta公司创始人，开创了大模型应用的“免费时代”，2024年7月，Mera发布了Llama 3.1人工智能模型，目前正在开发Llama 4，运用了24万块GPU训练，训练预算5亿美元，预计今年正式登场。

GitHub4 个月

Tips: 图片完全由AI生成

LLM-Dojo使用简洁且易阅读的代码构建LLM、VLM模型训练、RLHF框架等各种功能，使项目易于学习且方便魔改与实验，与大多开源框架相同均是基于huggingface。主要内容如下： SFT训练框架: 简洁清晰的开源大模型训练框架，支持Deepspeed多卡、Lora、QLora、全参等训练 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果