(资料图片)
500道题目、对标接受过高等教育的人类水平、强调对产业和生活的实际价值……8月12日,新华社研究院中国企业发展研究中心发布《人工智能大模型体验报告2.0》(以下简称《报告》),讯飞星火以总分1013分位列本次国产主流大模型测评榜首位。
据悉,《报告》严格按基础能力指数、智商指数、情商指数、工具提效指数四大测评维度进行权重设计,讯飞星火在四大评测维度中的智商指数和工具提效指数两个维度获得第一,“在工作提效方面优势明显”。
《报告》认为,讯飞星火具有7大核心能力(即文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力)的讯飞星火认知大模型拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务。从海量数据和大规模知识中持续进化,实现从提出、规划到解决问题的全流程闭环。
在智商评估方面,《报告》认为,人类在智商方面仍然具有明显优势。课题组分别从常识知识(20%)、逻辑能力(50%)和专业知识(30%)方面对大模型进行考量,结果显示,讯飞星火排名第一。
代码能力无疑是讯飞星火“高智商”的底层能力,8月15日讯飞星火代码能力将进行重大升级,同时还将推出相关代码产品成果。
在工作效率提升方面,《报告》认为, AI对人类提供了有力的支持,AI的处理速度远远超过人类。然而,尽管AI具有高速度和高效率的优势,但在某些复杂和具有创新性的任务中,人类的智慧和想象力仍然具有无法替代的作用。课题组重点在工具提效(50%)和生成创新(50%)方面进行考量,结果显示,讯飞星火以350分排名第一并遥遥领先。
《报告》认为,与2023年6月相比,当前中国大模型产品进步显著,但与接受过高等教育的人类相比,大模型在智商、情商等方面还存在一定程度差距。虽然在不同领域中,AI和人类表现出不同的优劣势,但在整体上,AI大模型的发展为人类工作和生活的提质增效带来了重要的积极影响,大模型正在加速走进生活、走进产业。
关键词:
相关内容
- 新华社研究院发布国产大模型报告 讯飞星火智商指数和工具提效指数第一 a>
- 利润公式怎么算初中(利润计算公式初中) a>
- 与英伟达有合作的吧?天通股份回应 a>
- win7系统电脑两边出现黑边 win7电脑屏幕两边出现黑边怎么还原 a>
- 中信证券:政策落地正处起点而非终点 A股依然处于做多窗口期 短暂波动带来入场良机 a>
- 时隔近1300天重新启航,山东边检全力保障全省海港口岸国际客货班轮恢复通关 a>
- RMC:内马尔即将加盟利雅得新月,恩里克称他不再是球队计划一部分 a>
- 英诺特:红杉智盛拟减持不超2%公司股份 a>
- 银行存款并非想象中那么安全?内行人透露:存定期存款请注意3点 a>
- 宇瞳光学:宇瞳转债网上中签率为0.0011856348% a>
- 科大讯飞:上半年BC端营收占比达70% a>
- 康希诺:婴幼儿用吸附无细胞百(组分)白破联合疫苗启动III期临床试验并完成首例受试者入组 a>
- 吉林省发布地质灾害气象风险黄色预警 a>
- 北京门头沟:截至12日18时 第一轮山区巡诊已基本实现全覆盖 a>
- 打通党群交流“最后一公里”!苏州工业园区唯亭街道居民共商社区事,和谐邻里情 a>
- 重庆冉家坝有一家热门商场,三条地铁线在此交汇,地理位置太好了 a>
- 唐韦星:带着贵州围棋走向世界 a>
- 灵活用工平台有哪些税收风险类型 灵活用工平台有哪些 a>
- 未来几天 我国中东部多闷热天气 西北地区出现明显降温 a>
- 数字化推动漳州高质量发展 a>