为了全面评估这个框架的性能并找到最适合的“大脑”,研究团队选择了13个不同的大语言模型进行对比测试,包括闭源模型(如GPT-4)、开源模型(如DeepSeek、Llama、Qwen)以及专门针对金融领域训练的模型(如Palmyra-Fin)。 所以,DeepSeek是这些候选“大脑”中的一个 ...