上海人工智能实验室葛佳烨：大模型评测亟需可靠的数据_mgm高梅美线路·(中国)mgm美高梅79906官网

mgm高梅美线路

mgm美高梅79906

高端装备人工智能

MGM高梅美线路官网

人工智能

上海人工智能实验室葛佳烨：大模型评测亟需可靠的数据

发布时间：2024-04-18 09:41:48 来源：mgm美高梅79906 作者：MGM高梅美线路官网

　　【上海人工智能实验室葛佳烨：大模型评测亟需可靠的数据污染检测技术】在“知乎AI先行者沙龙”上，上海人工智能实验室司南大模型评测产品负责人葛佳烨表示，大语言模型评测中面临全面性、评测成本、数据污染、鲁棒性等挑战。她表示，评测数十万道题需要大量算力资源，基于人工打分的主观评测成本高昂。同时，海量语料不可避免带来评测集污染，亟需可靠的数据污染检测技术。此外，大模型对提示词十分敏感，多次采样情况下模型性能不稳定。

　　在“知乎AI先行者沙龙”上，上海人工智能实验室司南大模型评测产品负责人葛佳烨表示，大语言模型评测中面临全面性、评测成本、数据污染、鲁棒性等挑战。她表示，评测数十万道题需要大量算力资源，基于人工打分的主观评测成本高昂。同时，海量语料不可避免带来评测集污染，亟需可靠的数据污染检测技术。此外，大模型对提示词十分敏感，多次采样情况下模型性能不稳定。

上一篇：华为正式官宣大模型AI领域再起波澜！中美人工智能发下一篇：2024年我们如何向通用人工智能发起冲锋？张鹏、周