大模型应用7项第一!10月24日,第七届世界声博会暨2024科大讯飞全球1024开发者节开幕式上,科大讯飞董事长刘庆峰公布讯飞星火大模型应用成绩单,并发布讯飞星火4.0 Turbo:七大核心能力全面超过GPT-4 Turbo,数学和代码能力超越GPT-4o,国内外中英文14项主流测试集中讯飞星火4.0 Turbo实现9项第一。与此同时,国产超大规模智算平台“飞星二号”正式启动。

20241025115715975-81-3d115.png_scale.png

会上,科大讯飞首发10项基于讯飞星火底座能力的硬核产品与创新应用:定义多模AIUI标准,发布超拟人数字人;发布星火多语言大模型、讯飞星火医学影像大模型、汽车端侧星火大模型;发布首个基于“问题链”的高中数学智能教师系统、星火智慧黑板2.0、AI作业过滤器等;发布星火智办一体机、智能座舱人机交互效果评测机器人VIAS以及科大讯飞多语种 AI 翻译透明屏。

讯飞星火4.0 Turbo:国际14项主流测试集9项超越,提效50%

讯飞星火大模型4.0 Turbo正式发布,在数学能力、代码能力上超过了GPT-4o。由艾伦人工智能研究所、OpenAI等国内外权威单位发布,涵盖理解和推理、综合考试、数学和科学、代码等不同任务类型的14项主流测试集中,讯飞星火4.0-Turbo在其中9项测试集中实现超越,效率相对提升50%。

20241025120104834-69-2f910.png_scale.png

根据实用数学任务构建测试集CAppliedMath-1.0,讯飞星火4.0 Turbo在计算、财务、金融、度量等多个维度的任务中均超过GPT-4o水平,已完成超长思维链、树搜索和自我反思评价等算法验证,预计今年底可实现类“o1”的高难度数学能力显著提升。

根据代码生成HumanEval测试集上的效果对比,讯飞星火4.0 Turbo在Python、Java、JavaScript等任务上和GPT-4o的差距微弱,在C++能力上超过GPT-4o。在真实应用场景,基于认知智能全国重点实验室构建的iFLYCode-Eval-2.0代码实用场景测试集,讯飞星火4.0 Turbo在代码生成、代码检错、单元测试等任务上都超过了GPT-4o。同时推出星火代码7B版本,满足代码生成、代码补全等极速响应型任务,效果业界最优。

首发语音视觉虚拟人交互“三合一”

发布会上,科大讯飞重新定义万物智联时代的多模AIUI交互标准,在原有的远场高噪、全双工、多语种多方言能力上,升级了多模态能力,新增了超拟人和个性化能力。

20241025120104908-30-9994a.png_scale.png

超拟人数字人首次亮相,多模态的交互从超拟人的语音变成超拟人的数字人,实现语音、视频、图文的全部联动的多模态交互。科大讯飞研究院院长刘聪现场和超拟人数字人玩了个“角色扮演”游戏,无论是扮演孙悟空还是小猪佩奇,数字人反应都惟妙惟肖。

20241025120105155-58-3c440.png_scale.png

刘聪还演示了更实用的旅游购物场景,当摄像头转向印有外文的化妆品及酒类产品时,超拟人数字人能对画面中产品的品牌、功能等信息进行“秒回”,超拟人数字人已成为“跨语言”购物的好帮手。

“目前,讯飞星火支持用户创建自己的个性化数字人,打造每个人的数字分身。”刘聪现场演示了一个自己的“数字分身”,只需在后台进行简单的编辑、定义,就可快速生成自己的卡通形象,更能一句话复刻自己的声音作为发音人,随时随地与自己对话。目前,已支持1300+种人设打造。

20241025121155242-89-d1c8a.png_scale.png

硬件产品端,内嵌了星火多模AIUI能力的讯飞AI学习机阅读伙伴即将上线,孩子们“指哪读哪”,书中的故事可以马上“拟人化”启发孩子思考和提问。

首发星火多语言大模型,为世界提供第二种选择

在语音识别领域,科大讯飞的远场高噪场景语音识别领先优势进一步扩大。

在多语言能力上,首次实现全国地级市方言全覆盖,含全国288个地市、202种方言,讯飞输入法14.0即将支持202种方言免切换自由说。

在多语种能力上,首次发布星火多语言大模型,除中英文外,可支持俄、日、阿、法等8个语种。根据实用任务场景构建测试集MMT-Eval-1.0,讯飞星火在汽车、家电、办公、翻译等行业的任务场景应用效果超过了GPT-4o。

20241025130023533-10-db9d2.png_scale.png

“讯飞作为中国唯一的认知智能全国重点实验室承建单位,我们有使命有责任要做多语言大模型”,刘庆峰表示,讯飞星火底座能力要不断提升,对标全球最好水平,同时还要针对真实应用场景做到全球最好,不断扩大多语种范围,“我们一定要代表中国给世界第二种选择。”

大模型赋能民生刚需:发布教育、医疗、司法、政务等领域AI助手

“用人工智能技术解决社会刚需”,是科大讯飞一直以来的出发点之一。此次1024科大讯飞全球开发者节上,科大讯飞面向教育、医疗、司法、政务服务、企业办公等多个行业场景发布了最新的产品应用。

20241025130116577-16-a8d64.png_scale.png

在教育行业,首次发布基于“问题链”的高中数学智能教师系统。

今年1月份,中国教育科学研究院与科大讯飞、华为开展深度合作,在讯飞星火教育大模型的基础上开展“基于生成式人工智能的中小学智能教师示范研究”。此次发布的高中数学智能教师系统,是众多高中数学学科优秀教师集体智慧和AI大模型的机器智能双向赋能,实现“人机共育”。它可以智能生成教学问题链,以循序渐进的方式辅助教师启发学生思考并逐步解决问题,同时基于精准学情定位学生薄弱点、融合最近发展区规划路径、鼓励学生基于真实世界的主动提问、探究式学习,帮助学生实现知识、到能力、再到素养的综合培养。该高中数学智能教师系统是中国教科院牵头、北京、上海、重庆、深圳、合肥、成都、大连、广州、哈尔滨等12个区域50多位数学教研员、400多位优秀教师与讯飞星火大模型人机共创的智慧成果。

20241025130116821-17-105ef.png_scale.png

搭载了高中数学智能教师系统的星火智慧黑板2.0也将于10月25日在第84届教育装备展上正式发布,从AI均衡视听更公平、AI教学工具更高效、AI教师助手更智慧、全国产化算力更安全等四个方面推动黑板从板书工具跃迁为教学AI助手。

20241025130333292-23-f1ba4.png_scale.png

此外,讯飞AI学习机中首发AI作业过滤器。学习机通过OCR能力识别出纸质练习题,根据学生历史学习情况和本地化考情,将题目分出“必做题”“选做题”“建议不做题”三个等级,实现“练得更少、学得更好”的目标。

20241025130333292-23-f1ba4.png_scale.png

发布会上,科大讯飞、华为、合肥市大数据资产运营有限公司三方联合打造的国产超大规模智算平台“飞星二号”正式启动。面向未来,刘庆峰认为人工智能产业发展的关键是五个关键词:顶天立地、自主可控、通专结合、端云联动、软硬一体。刘庆峰说:“坚持这五个关键点,我们的人工智能就有大未来,就能真正的解放生产力、释放想象力,改变产业格局和竞争格局,带来科研范式的变化,带来各行各业的变化,最重要的是满足老百姓对美好生活的期望!这就是我们未来的发展方向。”