比如说,过去两年内, 一直是一个热门话题,但实际上几乎没 能很好地运作。原因是网络上根本没有大量有价值的 t 数据。这些数据不在那里,所以我们需要生产高质量的 数据。 : 能举个例子,说明我们需要生产什么样的数据吗 : 我们即将发布的一项研究表明
目前所有前沿模
型在工具组合上的表现都很差。比如它们需 新加坡邮件列表 要先查找信息 然后编写一个 脚本,再绘制图表,使用多个工具串联起来解决问题时,模型表现得非常糟糕。而这对人类来说是非常自然的 是的,但这些操作没有被记录下来,是这个意思吗?也就是说,模型无法学习到这些步骤。
完全正确 这些
推理链条在人类解决复杂问 即使没有专门为旅行社设计的 题时非常常见,我们会自然地使用一系列工具 思考问题并推理下一步需要做什么。如果遇到错误,我们会回过头重新考虑。很多这样的智能链条数据今天根本不存在。这是一个需要生成的数据例子。 退一步讲,首先需要在数据上取得的进展是增加数据的复杂性,朝前沿数据迈进。其次是增加数据的生产量,捕捉更多人类在实际工作中的行为。
更多捕捉人类在工
作中的实际操作 : 是的,捕捉更多人 CZ 领先 类的操作行为,同时投资于合成数据或混合数据。利用合成数据,同时让人类参与其中,从而生成更高质量的数据。我们需要像对待芯片生产一样看待数据生产。 就像我们讨论芯片生产的边界,确保有足够的生产能力来制造芯片。对于数据也是一样的,我们需要有效的数据生产边界,能够生成海量数据来支持模型训练。 最后一个经常被忽视的方面是对模型的测量,确保我们能够科学地分析模型的不足之处,从而精确确定需要添加哪种数据来提高模型的性能。