三星推出了TrueBench,这是一个评估AI模型生产率的
2025-09-25 08:47
三星电子周四推出了一个平台,旨在审查其工作环境中人工智能(AI)模型的生产力。
韩国的巨型技术在新闻稿中说,该平台称为TrueBench,将为企业提供一套全面的指标,以监视实际生活工作场所中大语言模型(LLMS)的生产率。
“最近,随着企业采用AI来执行任务,衡量LLM生产率的需求增加了。但是,现有的基准测试主要衡量总体绩效,主要是以英语为中心,并且仅限于单回路Q&A结构。”
为了满足这些限制,三星表示,该平台研究了与工作相关的任务,内容和数据分析的生成,分别是10个类别和46个子类别。
该服务支持12种语言,包括韩语,英语,日语等。
“三星研究所通过真实经验带来深厚的专业知识和竞争优势三星电子体验部的首席技术官员Cheun Kyung-Whoon说,“我们希望TrueBench建立生产力评估标准,并结合三星技术的领导才能。
金融的官方帐户
24小时广播滚动滚动最新的财务和视频信息,并扫描QR码以供更多粉丝遵循(Sinafinance)
相关推荐