IT之家 3 月 17 日消息,摩尔线程官方今日发文宣布, 已正式开源 MT-MegatronLM 与 MT-TransformerEngine 两大 AI 框架 。这两大框架通过深度融合 FP8 混合训练策略和高性能算子库,在国产全功能 GPU ...
长文本任务是当下大模型研究的重点之一。在实际场景和应用中,普遍存在大量长序列(文本、语音、视频等),有些甚至长达百万级 tokens。扩充模型的长文本能力不仅意味着可以在上下文窗口中装入更长的文本,更是能够更好地建模文本段落间信息的 长程依赖关系 ...
Susan ...
编者按:尽管抗反转录病毒治疗(ART)能够使绝大多数HIV感染者获得长期的病毒学抑制状态,从而改善治疗预后;但临床中仍有少数感染者存在持续的病毒血症。长期维持低病毒血症状态,可增加治疗方案失败的风险,并促进耐药性毒株的演变,且仍存在传播风险。掌握持续 ...
伍德麦肯兹下调了今年及以后住宅太阳能的展望。2025年,该公司最近将其增长预测下调了15%。然而,伍德麦肯兹预计2025年将有温和复苏,同比增长9%。它认为加利福尼亚市场将趋于稳定,并以7%的速度增长,因为安装商在NEM ...
Preface前言杨松琳专注于线性注意力机制、机器学习与大语言模型交叉领域,聚焦高效序列建模的硬件感知算法设计,围绕线性注意力、循环神经网络优化开展研究,并取得多项研究成果,多篇论文被 ICLR 2025、NeurIPS 2024 ...
“在本季新作的创作过程中,我聚焦于探索不同文化背景下的创意表达,并将多元化的灵感融入设计与工艺之中。这一系列不仅延续了我对细节与质感的追求,也在形式与结构上尝试了全新的突破。创作期间,上海服装设计协会(SFDA)、意大利国家时装商会(CNMI)以及造 ...
A team of Chinese scientists has created a six-legged "space mining robot" inspired by insects, which could be used for ...
美光财务业务表现的强劲反弹预计将继续上演。在截至2025财年第一季度,美光科技调整后每股收益大幅升至1.43美元,上年同期仅为0.43美元。未经过调整后的净利润高达18.7亿美元 (每股收益1.67美元),而上年同期则录得未经过调整后的净亏损大约12.3亿美元 (每股亏损1.12美元)。
4 小时
什么值得买社区频道 on MSN本地化部署DeepSeek这么简单?零刻SER9 Pro实操,还能玩3A!自开年以来以DeepSeek为代表的AI工具火出了天际,工作中的许多琐碎事儿都可以交给AI来完成。不过对于商业体来说,提升生产力效率是一回事,数据隐 ...
最终,DeepSeek R1 在 M3 Ultra Mac Studio 表现不错。虽然这里用的是 4-bit 量化版本,牺牲了一定的精度,但模型依然保持了完整的 6710 亿参数,速度为 16-18 ...
11 小时
知乎 on MSN晚上睡不着白天睡不醒,是什么「偷走」了我们的夜晚?这个话题,我来脑洞一下。 雷德利·斯科特有部非常经典的科幻片《银翼杀手》,这部电影刚上映时,口碑并不理想,甚至可以说「恶评如潮」。 这部影片节奏缓慢,主题晦涩,当时流行的快节奏动作场景,许多观众认为这部电影「无聊到让人愤怒」。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果