超越GPT-4,联手华为,科大讯飞全球1024开发者节亮点全揭秘

2024-10-25 18:06:42

今日举办的科大讯飞全球1024开发者节上,作为一年一度的人工智能盛会,本届开发者节以“万物智联 生生不息——解放生产力,释放想象力”为主题。

 

 

这次的盛会上,科大讯飞晒出了全科成绩单,场景覆盖了汽车、医疗、教育等,甚至在许多“科目”中得到了第一名。

 

七大能力全面超GPT-4 Turbo

 

据刘庆峰介绍,讯飞星火4.0 Turbo全新升级,七大能力全面超过GPT-4 Turbo,数学能力、代码能力超过GPT-4o(Open AI最新一代GPT模型)。此外,星火4.0 Turbo效率相对提升50%。

 

 

在数学能力上,讯飞星火已完成超长思维链、树搜索和自我反思评价等算法验证,预计今年底可实现类o1的高难度数学能力显著提升。

 

与GPT 4o、Claude 3.5 Sonnet、Genmini1.5 pro等国际同行对比,星火4.0 Turbo在国内外中英文14项主流测试集上,实现了9项9项第一。

 

 

科大讯飞董事长刘庆峰宣布,语音识别首次实现全国地级市方言全覆盖, 含288个地市202种方言。刘庆峰表示,未来将实现方言语音识别的细化,争取覆盖到每一个县,每一种方言。

 

星火超拟人数字人,表情动作媲美真人

 

据了解,星火超拟人数字人在业界率先实现语义贯穿的“口唇-表情-动作”的超拟人数字人生成。科大讯飞副总裁、研究院院长刘聪现场进行了真机演示,超拟人数字人可以展现出目瞪口呆、卖萌的表情,实时与用户实现交流。

 

 

星火超拟人数字人还可识别、分辨面霜、酒、模型、植物等物品,不仅能介绍产品、还能为用户进行推荐,实现哪里不会拍哪里。刘聪演示过程中,在桌子上摆了孙悟空、奥特曼、怪兽的玩偶,超拟人数字人直接根据玩偶的站位变化,讲述了一个生动的故事。

 

据悉,星火超拟人数字人还支持个性创建,仅需一张照片即可打造自己的数字分身,用户可自定义数字人的性格、介绍、声音等个性化设定。

 

 

科大讯飞表示,一句语音即可实现声音复刻,支持多种身份、性格、场景的人设打造,人设类型已超1300多种。目前,超拟人数字人能力已正式开通内测,所有开发者和行业人士可申请使用。

 

汽车端侧大模型,效果不输云端

 

会上,科大讯飞正式发布汽车端侧星火大模型,相较于云端大模型,汽车端侧星火大模型在无网环境下可用,且使用效果与云端相比几乎无差异。

 

 

科大讯飞介绍,很多用户在开车经过山洞隧道,或在其他特殊场景下,会遇到无网的情况;还有些用户出于保护个人隐私需求,不希望将个人数据同步至云端。而科大讯飞首发的汽车端侧星火大模型,将大模型部署在汽车端本地,不依赖云端网络,完美解决以上用户的使用痛点和需求。

 

科大讯飞表示,虽然他们部署的汽车端测星火大模型,只有1.3B的参数产出,比现在通用模型降低了两个数量级,但在汽车典型应用场景中,这些应用场景中的实际效果只下降了1%,实用效果几乎没有差异。

 

 

端侧首响应时间降低到40毫秒,在复杂场景下还可以调用云端模型,即便需要调各种信源,端云融合的响应时间也降低至1.3秒,汽车端侧星火大模型的技术效果和响应速度,属于全行业领先的水平。

 

科大讯飞透露,汽车端侧星火大模型不仅是今天首发软硬件一体化的模型,关键是从今年第四季度开始,奇瑞、广汽、长城等多款车型,正在陆续集成上线并开售,用户很快就能体验到。

 

联合华为共研小艺,解决语障问题

 

科大讯飞还宣布和华为联合研发了小艺声音修复技术,让AI技术帮助语障朋友自由沟通。该功能旨在帮助一些言语障碍人群,他们可以发出声音,但口语表达不够清晰,说话时可能别人听不太懂,只能理解个一半。

 

 

据悉,小艺声音修复功能利用AI技术对用户的语音进行实时分析、修复和优化,在保持音色相似的前提下,大大提升了用户发音的可懂度和清晰度,是业界首创的无障碍“黑科技”。

 

无论是在生活还是工作中,有了小艺声音修复功能,言语障碍人士都可以跟人进行面对面交流沟通。

 

智能教师系统,AI作业过滤器

 

科大讯飞联合中国科教院,首发高中数学智能教师系统,它是众多高中数学优秀教师集体智慧与AI大模型智能的综合体,是知识与智能双轮驱动、人师与机师双向赋能的技术创新,试点应用获得好评。

 

同时,最新星火智慧黑板2.0也将于10月25日第84届教育装备展上正式发布。其包括AI均衡视听更公平、AI教学工具更高效、AI教师助手更智慧、全国产化算力更安全四大特性推动黑板从板书工具跃迁成为教学AI助手。

 

 

面向家庭学习,科大讯飞发布了搭载到学习机上的AI作业过滤器,能够帮助学生对作业、考题筛选,基于其对学生的知识习得能力等进行判断,选出学生的必答题、选做题和可不做题。这一功能预计在11月中旬上线。

 

医疗大模型六大核心场景升级

 

讯飞星火医疗大模型2.0实现了六大核心场景能力升级,包括医疗海量知识问答、医疗复杂语言理解、医疗诊断治疗推荐、医疗专业文书生成、医疗多轮交互、医疗多模态交互。

 

 

在细分的医学影像方面,目前围绕医学影像的诊断治疗,存在影像科医生数量相对不足、拍片质量参差不齐、重复影像检查发生率达到41.82%的问题。

 

写在最后

 

刘庆峰公布了科大讯飞亮相星火大模型一年来的应用落地成绩单:讯飞星火央国企中标第一、教育医疗市场第一、智能汽车市场第一、智能硬件市场第一、工业大模型第一、赋能科研应用第一、大模型开发者生态第一。

 

具体的一些数据指标为,2024年1-9月,讯飞星火智能硬件GMV同比提升50%,截至10月23日,双十一大促全渠道GMV同比增长280%;讯飞星火App安卓平台累计下载量2亿。

 

未来,随着人工智能技术的不断发展和应用,不仅是科大讯飞,将会有更多大模型厂商为全球用户带来更多创新和价值。

 
 
 
 

『本文转载自网络,版权归原作者所有,如有侵权请联系删除』