本文引入了微调llm做为可扩展“”的概念,跨越了人取人之间的分歧性。并引见了加强不怜悯况下模子分歧性的方式,该模子正在处置各类使命时也表示出顺应性。该阐发处理了LLM判断微调固有的误差,该方式连系了大量高质量的模子数据集,包罗分歧的种子使命、JudgeLM做为一种可扩展的言语模子,