您的位置:首页>栏目首页 > 报告 >

科大讯飞入局大模型“无限游戏”,下一个头号玩家会是谁?

2023-08-17 10:33:06    来源:大河财立方

【大河财立方 记者 张克瑶 文图】科大讯飞(002230.SZ)掀起了新一轮的“百模大战”,携着最新发布的多项应用和产品,也悄然加入到大模型领域的“无限游戏”。

8月15日,讯飞星火认知大模型V2.0升级发布会如约而至,科大讯飞董事长刘庆峰、研究院院长刘聪发布代码能力和多模态能力升级版本,同时发布搭载升级讯飞星火认知大模型V2.0能力的多项应用和产品。科大讯飞与华为再度合作,联合发布星火一体机。


(资料图片)

巧合的是,科大讯飞发布会当天,由国家互联网信息办公室、国家发展改革委、教育部、科技部等七部门联合发布的、我国首个针对生成式人工智能(AIGC)产业的规范性政策《生成式人工智能服务管理暂行办法》(以下简称《办法》)正式施行。

科大讯飞并不是国内大模型领域的“孤勇者”。随着三六零(601360.SH)、小米集团(01810.HK)、阅文集团(00772.HK)等企业加码大模型,我国生成式人工智能产业有望加速发展。

讯飞星火代码能力升级,

明年上半年对标GPT-4

代码是大模型硬碰硬的能力,此次升级也是科大讯飞在今年5月6日首发讯飞星火认知大模型时立下的flag。

“代码数据能提升认知大模型的‘智慧’,代码能力是认知大模型聪明程度的重要标志。”刘庆峰说,代码能力也是构建和链接数字世界的有效手段,可以大幅降低数字经济的创业门槛和成本,不用个个都是编程高手,只要发挥自己的想象力、基于对应用场景的认知,就可以提升开发效率、实现相关创业。

此次讯飞星火认知大模型V2.0对代码能力进行5个维度的升级,包括代码生成、代码补齐、代码纠错、代码解释、单元测试生成。

现场演示中,刘聪使用Python画红色的心形线、画出马鞍面方程三维立体图,用代码生成小游戏等。“使用Python处理视频星火.m4v,提取其中第2到10秒,保存成gif图片,就连这种利用小视频做表情包的需求都可以迅速搞定。”刘聪说。

刘庆峰介绍,根据OpenAI构建的代码能力公开测试集HumanEval显示,星火V1.5 Python语言的效果只有41分,但是V2.0已经到了61分,接近ChatGPT。根据认知智能全国重点实验室构建的代码真实场景使用的测试集,讯飞星火认知大模型V2.0在代码生成和补齐维度上已经超过了ChatGPT。根据计划,讯飞星火代码各维度的能力将在今年10月24日超越ChatGPT,明年上半年对标GPT-4。

多模态能力再升级,

星火大模型现场“读图”

拍了美图想“秒速”发一个图文并茂的朋友圈?张嘴就想画出脑海里突发奇想的图画?只要输入一段文字,一键就想生成声情并茂的小视频?这些功能,讯飞星火认知大模型V2.0全部可以实现。

发布会现场,刘庆峰对讯飞星火的多模态能力进行发布,讯飞星火在图像描述、图像问答、识图创作、文图生成、虚拟人合成等方面全新升级。刘聪现场继续进行真机实测,让星火大模型现场“读图”,生成人物、风景等各类照片,生成班级手抄报,还能根据古诗词“作画”。

“多模态能力是赋能行业的刚需,也是实现通用人工智能的必经之路。”刘庆峰说,当前多模态能力已广泛应用在教育、医疗、工业、汽车、机器人等领域。它可以从真实世界获得越来越多的数据,在产品终端有学习、训练和提升,包括更柔性更自主的工业机器人、更好的自动驾驶、走入家庭的陪伴机器人等。

据了解,最近3年,科大讯飞已在多模态领域获得了17个国际权威评测冠军,2022年初讯飞就发布了包括多模感知、深度理解、多维表达、运动智能等核心能力的“讯飞超脑2030计划”,让懂知识、善学习、能进化的机器人走进每个家庭。

多模态能力的升级也将为AIGC带来产业机会。发布会上,多模态能力升级后的产品——讯飞智作2.0正式发布,无论是视频的后期处理还是创意视频生产,搭载了讯飞星火核心能力的讯飞智作2.0都能轻松搞定。讯飞智作2.0可以进一步降低短视频制作的门槛,满足更多元的视频制作需求,推动AIGC产业的发展。

科大讯飞牵手华为,

打造国产化算力底座

今年7月6日,科大讯飞公布讯飞星火将与昇腾AI强强联合,打造基于中国自主创新的通用智能新底座。此次发布会,科大讯飞与华为再度合作,联合发布星火一体机,让企业可以在国产自主创新的平台上,更方便、更自主、更安全可控地私有化部署大模型。

刘庆峰表示,认知大模型深度赋能时代已经到来,健康发展急需构建安全可控保障。在他看来,认知大模型在行业深度应用有三方面的关键要素:一是安全可控,通用人工智能改善民生、赋能社会,发展要根植在自主可控、算力安全平台上;二是场景驱动,要在看得见摸得着的场景上,能够产生实实在在的应用价值,能够用统计数据来证明应用成效;三是专项训练,构建私有化专属大模型,保护用户的专有数据和知识产权,并提升行业应用效果。

在安全可控方面,刘庆峰介绍,科大讯飞和华为正在联合攻关算力“卡脖子”的问题。科大讯飞拥有自研大模型训练平台,具备训练和数据闭环全流程设计、大模型训练和推理一体化设计、大规模异构算力兼容、支持混合云架构易拓展等优势,华为基于昇腾AI基础软硬件具有高算力AI芯片、高性能算子库、多卡高速互联、分布式存储等优势。

会上,讯飞星火和华为昇腾联合发布了星火一体机,该设备可提供对话开发、任务编排、插件执行、知识接入、提示工程等5种定制优化模式,以及办公、代码、客服、运维、营销、采购等10种以上即开即用的丰富场景包,支持3种模型尺寸供用户选择。

刘庆峰表示,有了这些能力,就可以使得每一家企业、每一个行业、每一所学校、每个医院都有机会构建自己的专属大模型。讯飞星火在已完成的金融、政务、汽车等领域的9个专属大模型的数据显示,在场景任务优化和私域知识增强等方面平均效果能够提升20%。

AI政策落地,

“百模大战”升级为“无限游戏”

就在科大讯飞举行新品发布会的当天,前文所述的《办法》正式施行,这也是我国首个针对生成式人工智能产业的规范性政策。

《办法》提出:“鼓励生成式人工智能技术在各行业、各领域的创新应用,生成积极健康、向上向善的优质内容,探索优化应用场景,构建应用生态体系。”

纽约大学宗教历史系教授詹姆斯·卡斯在其著作《有限与无限的游戏》中认为,有限的游戏在边界内玩,无限的游戏玩的就是边界。从当前全球大模型领域的竞争态势来看,各家企业推出的应用和产品,不断突破着人们对人工智能想象力的“边界”,人工智能产业的“百模大战”已毫无悬念地升级为“无限游戏”。

在2023全国工商联主席高端峰会暨全国优强民营企业助推河南高质量发展大会现场,三六零创始人周鸿祎接受大河财立方记者采访时表示,大模型代表着一个工业革命的机会,将会大幅度提高政府、企业的管理以及生产效率。

“以城市和政府部门为代表的企业级市场是大模型发展的重要方向,未来每个城市都会拥有自己的专有GPT。”周鸿祎在接受大河财立方记者采访时说,如今三六零与郑州市签署战略合作,将依托三六零搜索、终端等业务积累的数据优势,融合郑州市专有数据,为郑州打造“安全向善可信可控”的城市GPT大脑。

科大讯飞新品发布会的前一天,小米集团官宣拥抱大模型。8月14日晚,小米集团创始人、董事长兼CEO雷军在小米新品发布会上正式宣布,手机端侧大模型初步跑通,小爱同学升级AI大模型,并开启邀请测试。

雷军介绍,小米60亿参数的自研大模型在C-EVAL权威榜单上取得同参数量级排名第一,在CMMLU中文向大模型取得排名第一;小米自研的端侧大模型已经在骁龙平台跑通,目前自研13亿参数端侧大模型的效果,在部分场景上可以媲美行业60亿参数的云端大模型。

今年6月,阅文集团发布组织升级规划,成立内容生态平台事业部、影视事业部、智能与平台研发事业部、企业发展事业部这四大事业部,其核心目的正是要打通“内容+平台”,利用AIGC为IP孵化和生态增效提质。

组织业务升级一个月后,阅文集团发布了国内首个网文行业大模型“阅文妙笔”和基于这一大模型的应用产品“作家助手妙笔版”,对创作效率提升和运营工具的升级产生积极作用,这也是阅文拥抱AIGC、推动IP产业走向全新面貌的第一步。

责编:王时丹 | 审校:李金雨 | 审核:李震 | 监制:万军伟

关键词:

相关阅读