OpenEvidence批评近期LLM基准研究，呼吁更好基准，Medmarks被建议作为替代评估 | thinkgap

Loading / 加载中

OpenEvidence批评近期LLM基准研究，呼吁更好基准，Medmarks被建议作为替代评估 | thinkgap