1. 开源微调神器Unsloth优化了DeepSeek-R1同款GRPO训练算法,上下文变长10倍,显存需求减少90%。 3.
IT之家 3 月 17 日消息,摩尔线程官方今日发文宣布, 已正式开源 MT-MegatronLM 与 MT-TransformerEngine 两大 AI 框架 。这两大框架通过深度融合 FP8 混合训练策略和高性能算子库,在国产全功能 GPU 上实现混合并行训练和推理,提升了训练效率与稳定性。
据报道,字节跳动旗下豆包大模型团队近日宣布了一项关于混合专家架构的重要技术突破,并决定将这一成果开源,与全球AI社区共享。这一技术通过一系列创新方法,成功将大模型的训练效率提升了约1.7倍,同时显著降低了训练成本,降幅高达40%。开源不仅有助于加速行业技术发展能为更多研究者和开发者提供宝贵的资源,进一步推动人工智能技术的创新与应用。
展锐W337拥有超高的集成度,集成了双核CPU、GPU、ISP、Display、Video、Audio、WCN和安全模块,Memory采用SiP封装。 基于RTOS系统首创双核CPU架构,配置双核 ...