科大讯飞发布星火认知大模型 刘庆峰:其在中文长文本生成领域已超过ChatGPT

5月6日,科大讯飞正式对外发布了讯飞星火认知大模型,并公布了基于大模型的“1+N”产品路径,“1”指通用认知智能大模型,“N”指大模型在教育、办公、汽车、人机交互等各个领域的落地。


【资料图】

发布会现场,科大讯飞提取出了讯飞星火认知大模型的七大核心能力,即文本生成、语言理解,知识问答、逻辑推理、数学能力、代码能力、多模态能力。

界面新闻记者从现场看到,讯飞大模型能够较好地完成中英文论文、品宣文案、以及故事内容等内容形式的撰写。

部分星火大模型能够生成的内容类型图源:讯飞

同时,该大模型能够在中文特殊语境下表现良好,可以对俗语进行解读,能够有“情商”地回答情感问题。输入一个中学水平的数学题,AI能够迅速完成常规计算、几何、情景应用等问题的解答。

大模型支持多模态,能够支持对英文菜单图片进行直接翻译,用自然语言输入要求,即可生成一个虚拟人实时播报的视频段落。

讯飞现场演示实时生成的虚拟人朗读视频

值得注意的是,与其他大模型厂商不同,除了强调讯飞大模型将对开发者进行开放,讯飞着重公布和介绍了大模型在讯飞内部产品体系中的落地运用。

根据科大讯飞董事长刘庆峰的介绍,讯飞大模型将重塑讯飞办公、教育、医疗、汽车、人机交互等业务,大大提升原有业务的实际效果。

教育业务方面,搭载大模型后,AI学习机能够像老师一样批改作文,像口语老师一样实景对话。相比于传统学习机只能针对字词标点纠错、识别句式修辞错误这些基础批改,AI学习机能够围绕写作要求、分析全篇结构和文采的深度高阶批改。

办公方面,讯飞原本的传统业务语音转写,搭载大模型后,能够实现自动会议纪要,并且将冗杂的录音转写后进行语篇规整,并且根据指定的主题,一键生成新闻稿或其他内容类型。

并且,基于大模型,讯飞还对外展示了任务执行方面的功能,基于自然语言生成业务流程和 RPA,帮助企业员工完成大量重复性工作。现场以公司招聘事项为例,输入指令后,系统即可自动按照事先设计的RPA脚本,操作计算机中的相应软件,实现业务流程的自动化操作并输出结果,还能进行数据分析。

刘庆峰在采访中提到,整体看,讯飞在长文本生成和数理能力方面有一定优势。在长文本生成上,大模型在国内明显领先,在中文方面超过了ChatGPT,英文方面则还有一定差距。

科大讯飞研究院院长刘聪告诉界面新闻记者,相比于阿里以及百度等公司,科大讯飞在大模型算法上具有一定优势,讯飞自2014年从“讯飞超脑”计划开始在大模型上进行投入,团队经验相对成熟。另外,由于讯飞此前将教育、医疗等垂直行业列为根据地,因此在相关行业累积了大量数据,并且讯飞开放平台以及重要的专业机构合作,为讯飞大模型提供了大量且专业的中文训练语料。

不过,刘庆峰直言,当前大模型技术仍有待攻克的缺陷,比如新知识难以及时更新、事实类问答容易“张冠李戴”,史实、传统典籍等容易“编造情节”等,但这些问题在今年会有明显的改进。

同时,刘庆峰公布了年内大模型技术持续升级的三个关键里程碑节点:6月9日,将突破开放式问答、多轮对话能力明显提升、数学能力再升级;8月15日,代码能力升级以及多模态交互能力提升;10月24日,将实现通用模型对标ChatGPT,中文超越ChatGPT的当前版本,英文能做到相当水平,并在教育、医疗等领域做到业界领先。

(文章来源:界面新闻)

关键词: