新华社研究院发布国产大模型报告:讯飞星火第一,智商最高、工具提效能力最强
500道题目、对标接受过高等教育的人类水平、更强调对产业和生活的实际
(资料图片仅供参考)
500道题目、对标接受过高等教育的人类水平、更强调对产业和生活的实际价值,严格按基础能力指数、智商指数、情商指数、工具提效指数四大测评维度进行权重设计……8月12日,新华社研究院中国企业发展研究中心发布《人工智能大模型体验报告2.0》(以下简称《报告》),讯飞星火以总分1013分位列本次国产主流大模型测评榜首位,在四大评测维度中的智商指数和工具提效指数两个维度获得第一,《报告》认为讯飞星火“在工作提效方面优势明显”。
《报告》认为,具有7大核心能力(即文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力)的讯飞星火认知大模型拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务。从海量数据和大规模知识中持续进化,实现从提出、规划到解决问题的全流程闭环。
面对国产大模型“涌现”,讯飞星火认知大模型从立项到发布,再到迭代升级,每个节点都紧锣密鼓:5月6日发布讯飞星火认知大模型及其在教育、办公、汽车、数字员工等领域的应用落地;6月9日突破开放式问答,并在数学能力和多轮对话能力上迭代升级;即将到来的8月15日会在代码能力上实现重大突破,并在多模态交互能力上升级;10月24日对标ChatGPT,实现中文超越、英文相当的水平。
在智商评估方面,《报告》认为,人类在智商方面仍然具有明显优势。课题组分别从常识知识(20%)、逻辑能力(50%)和专业知识(30%)方面对大模型进行考量,结果显示,讯飞星火排名第一。
在工作效率提升方面,《报告》认为, AI对人类提供了有力的支持,AI的处理速度远远超过人类。然而,尽管AI具有高速度和高效率的优势,但在某些复杂和具有创新性的任务中,人类的智慧和想象力仍然具有无法替代的作用。课题组重点在工具提效(50%)和生成创新(50%)方面进行考量,结果显示,讯飞星火以350分排名第一并遥遥领先。
《报告》认为,与2023年6月相比,当前中国大模型产品进步显著。但与接受过高等教育的人类相比,大模型在智商、情商等方面还存在一定程度差距。虽然在不同领域中,AI和人类表现出不同的优劣势,但在整体上,AI大模型的发展为人类工作和生活的提质增效带来了重要的积极影响,大模型正在加速走进生活、走进产业。
关键词:
500道题目、对标接受过高等教育的人类水平、更强调对产业和生活的实际
中新网布里斯班8月13日电(记者顾时宏)中国南方航空股份有限公司和澳大
中证网讯(王珞)近日,各个线上电商平台7月份数据已经更新,2023年7月猫
【国务院:保障外商投资企业依法参与政府采购活动】财联社8月13日电,
新华社奥克兰8月13日电(记者肖世尧、树文、牛梦彤)如果植木理子的点
01:27近日,由中国红十字基金会、山东第一医科大学附属中心医院联合开
记者杨雪市北区2023“影享金秋”公益电影进社区活动启动,将在8、9月在
科教新报·新湖南客户端讯(通讯员徐延平)8月11日晚,由常德市文化馆
小里:巅峰麦迪一度与科比五五开但论整个生涯皮尔斯比他更好,麦蒂,小里
精彩暑期趣味图书馆夏日炎炎,最是书香能解暑。进入暑假以来,天桥街道
博德之门3法师敲击术万能钥匙指南是怎么样的?很多能还不清楚游戏中这
美台勾连以“过境”为幌子安排赖清德在美从事政治活动,严重违反一个中
多风格现场Live燃爆夏夜氛围,伴随着音乐律动,享受充满泰国风情的吃喝
赛特新材(688398):盈利能力显着改善真空玻璃取得突破
警方确认收到假警报法国埃菲尔铁塔目前已恢复开放
——黑龙江省五常市雅臣中学安置点见闻(副题)工人日报—中工网记者张
据海淀法院网消息,因认为对方未经许可在经营的酒店内外将“锦江之星”
糖醋汁,起锅烧油,油可以少放一点,倒入番茄酱或者番茄沙司均可,用勺
NO 01>>>>>>>>>>蔡徐坤新恋情曝光?近日蔡徐坤被拍到在韩国和某女生同
8月11日,河南省新乡市辉县市发布《关于印发关于进一步促进房地产市场
8月12日电,乌克兰媒体当地时间12日报道称,乌克兰武装部队海军发言人
来为大家解答以上问题,扣扣群怎么查找,腾讯qq群查找很多人还不知道,
科技风暴又一次袭来。这一次,依然是拜登,无休止地对咱们的科技产业进
一、伦敦议会大厦和泰姬陵的异同?印度泰姬陵是远古建筑,伦敦议会大厦
彼瘾犯了梗是最近有点火爆的梗,一些知道这个梗是怎么火起来的,也不知
Copyright 2015-2023 港澳酒业网 版权所有 备案号:京ICP备2023022245号-31 联系邮箱:435 226 40 @qq.com