在ChatGPT的热潮下,大模型五花八门,层出不穷,让人目不暇接。
近日,科大讯飞也宣布即将在5月6日发布讯飞星火认知大模型。尽管大家可能已经审美疲劳,但科大讯飞的大模型,依然是有值得注意、显而易见、却常常被人们忽视的特别之处——
(资料图片仅供参考)
尽管各行各业、各个大厂都在推出类ChatGPT大模型(或是通用的,或是垂直的),但作为榜样的ChatGPT本身是OpenAI在网页上推出NLP的模型。NLP,全称Natural Language Processing,也就是自然语言处理。在这一技术上,科大讯飞无疑是该领域的领跑者。
“百模大战”中难免泥沙俱下,但有一点是比较肯定的——从大模型的发展特点来看,新选手想要突围十分不易。
大模型并非空中楼阁
想要打造一个中国版ChatGPT,必须是建立在大模型的基础上。ChatGPT证明了在某种程度上,大模型拥有比小模型更优的效果。
过去AI公司囿于种种条件制约,基本都以小模型为主。如今这些公司确实要纷纷从小模型迁移大模型,但这不是一个从零开始的过程。
与小模型类似,AI大模型的核心要素在于数据、算法和算力,因此从小模型到大模型很多东西是通用的。
在数据领域,以ChatGPT为例,数据来源主要是互联网上的大量文本数据,以及各种知识库和语料库。一个优秀的中文NLP模型在获取数据的难度上还要超过ChatGPT,因为中文数据在互联网的开源程度较低,高质量无监督语料严重不足。而类ChatGPT大模型本质是基于有限语料范围的概率归纳模型,语料质量不高可能会导致大模型频繁“失灵”。
但幸运的是,小模型的数据集可以完全迁移至大模型使用,这使得在AI 1.0时代积累起来的数据优势可以延续。科大讯飞近日接受机构调研时表示,在严格遵守适用法律法规前提下,讯飞在多年认知智能系统研发推广中积累了超过50TB的行业语料和每天超10亿人次用户交互的活跃应用。科大讯飞在语音方面的主流市场占有六七成的市场份额,这无疑形成了讯飞大模型的优势。除了拥有海量的中文数据,科大讯飞通过深耕垂直领域还掌握了医疗、教育等专业数据端口的数据。
在算法领域,大模型和小模型也不是完全割裂的。不仅是大模型可以通过量化、剪枝、知识蒸馏等模型压缩方法生成小模型,优秀的小模型可以“反向蒸馏”、有效引导大模型的生成。这比从0开始构建大模型的可操作性强得多。
算力优势能迁移到大模型之上,这一点相信十分容易理解。以科大讯飞为例,公司于2009年开始算力基础设施建设,在总部自建有业界一流的数据中心,目前已建成4城7中心深度学习计算平台,在自用以外还面向平台数百万开发者和其他行业伙伴开放。尤其在当前美国卡脖子AI芯片的重要关口,这个优势在中国市场更凸显了重要性。尤其值得注意的是,超级算力中心建设资金门槛在ChatGPT出现后,已经推向百亿之上(在微软的支持下),而运营与维护成本更是天文数字。基于优质数据卡位,算法能力和商业化策略,科大讯飞在算力维度可以通过推动企业间的分布式计算协作,提升算力的效率、降低成本。
这些都是后来者远难以弯道超车赶上的。正如科大讯飞管理层在业绩会上说:“(这)是吃第十个包子,厚积薄发的一个事情。”
但NLP大模型却又并非新瓶装旧酒。过去的NLP领域有着非常显著的技术瓶颈,引用科大讯飞管理层的原话“瓶颈不在语音转文字,而在语义理解。”不同于机器视觉识别技术已经相当成熟甚至进入红海阶段,“语义理解”一直是全球AI难以翻越的一座大山,直到ChatGPT翻越了这座大山。
尽管我们要承认中国人工智能在这个领域稍许落后,但也要看到机会。就像某新财富分析师曾提到,就像特斯拉车没出来之前,蔚来和小鹏这些东西都没搞出来,但特斯拉车搞出来后,我们国家大量的新能源车厂像雨后春笋一样出现。
科大讯飞管理层表示,现在机会真正来了,技术会突破临界点,到达一个真正能商业化落地应用的阶段。
进入规模化的新阶段
在一片流血上市的人工智能公司里,科大讯飞的盈利能力独树一帜,恐怕已是人工智能公司之最,在整个A股市场中也担当得起“成长长青”这四个字。科大讯飞是过去10年来唯一连续10年营收年增长率均超25%的A股上市公司。
尽管如此,我们却依然能常常看到它的盈利能力受到诟病。这与科技公司的属性有关,由于高研发投入和定制化成本,所以在渗透率不足、规模化速度不高的情况下,盈利能力会承压。尤其在2022年科大讯飞在加大投入的同时,疫情导致项目收入确认延期,国际环境使得供应链调整进一步延迟项目。三重因素叠加,科大讯飞超30亿的合同延期到2023年,因此收入和支出形成“剪刀差”,短期的账面盈利能力向下。
但进入2023年第二季度,除了业务进度恢复常态,规模化带来的盈利弹性更值得期待。科大讯飞在业绩会表示,从2023年开始,要开启年利润增长30%的新阶段。
由于小模型的通用性较低,导致定制化属性较强。但大模型通过"大规模预训练+微调"的新范式,拥有了较强的通用性,这使得快速规模化落地成为可能。大模型作为解决AI应用碎片化的新开发范式,将带来了比传统AI更高的ROI。
事实上,过去传统AI时代的有效供给不充足制约了渗透速度,但事实上整体智能语音市场的需求很旺盛。从科大讯飞的财报也能看到这点。尽管受宏观因素影响,2022年公司可持续型“根据地业务”在2022年仍实现23%的增长,抵消了大项目延期所产生的影响,并推动公司的整体营收逆势中保持稳中有升。
具体地看,“根据地业务”中多个应用场景的前景十分明朗。2022年,科大讯飞的教育考试业务新增12个地市中考和2个省市高考,个性化学习手册新增300所运营校,学习机流水型线下门店新增769家,“双减”校内课后服务合作平台新增130个市区县,智慧医疗新开拓96个区县,智慧汽车新增合作车型110个。根据财报,以上业务拓展将在2023年才开始产生持续型收入。
大模型有望成为科大讯飞加速深耕这些应用场景的发动机,科大讯飞于2022年12月启动生成式预训练大模型“1+N”任务攻关,其中“1”是通用认知智能大模型算法研发及高效训练底座平台,“N”是应用于教育、医疗、人机交互、办公等多个领域的专用大模型版本,例如,通过学习海量医学教材、论文和病例,实现专业的医疗领域对话式AI系统,打造“每个医生的AI诊疗助理,每个人的AI健康助手”。“1+N”模式使得低成本、高效率的规模化成为可能。科大讯飞管理层在业绩会披露了未来目标,包括运营型的根据地业务和可持续流水型业务,5年内占比要超过80%;三年内人均效益能翻番,现金流要匹配利润增长,最终实现同步良性增长。
像科大讯飞这般在中国既能服务企业又能服务用户的科技公司屈指可数。随着开启AI开发新模式,科大讯飞有望进入大规模落地应用关键期,在B端和C端走出新天地。
标签:
精彩推荐
随着开启AI开发新模式,科大讯飞有望进入大规模落地应用关键期,在B端和C端走出新天地。
问记者丨广交会二期新增了哪些亮点展区?---第133届广交会二期日前在广州举行,本期展览以日用消费品、礼品
美国的童工很多都是来源于从南部边境进入美国的无人陪伴的移民儿童。美国国会众议院将于当地时间4月26日举
1、有线耳机一张毛爷爷就可以搞定的耳机:漫步者H285 对于大部分学生而言,音乐耳机的价格他们接受的档
看不够的波提切利!这次来上海的,还有他的“文艺复兴朋友圈”
美国前总统特朗普(资料图)海外网4月27日电据美国《政客》杂志网站26日报道,特朗普的律师在当天给美国国
沈阳花海音乐节小孩要买票吗?1米2以下儿童免票,需由监护人携带入场(一名成人仅限携带一名儿童);1米2以上儿
中新网永州4月27日电(唐小晴张兴国杨福刚单建华)26日晚,南岭旅游联盟在湖南永州成立,并发布南岭旅游联盟
【人民银行上海总部:下一步将深化农村信用体系建设】财联社4月27日电,中国人民银行上海总部副主任刘兴亚
挖贝网4月27日,绮耘科技(871902)近日发布2022年年度报告,报告期内公司实现营业收入19,678,401 05元,同
上证报记者宋薇萍摄 上证报中国证券网讯(记者范子萌宋薇萍)当前,上海在深化金融改革、扩大金融开放方
近年来,区水务局围绕“稳水质、提品质”的总体要求,全面开展水环境治理,推动全区水环境质量持续向好...
1、其实用360安全卫士的文件恢复功能就可以恢复回收站的文件。2、打开360安全卫士,找到功能大全区域,点击
新华网广州4月26日电(记者魏蒙)拱北海关26日披露的数据表明,继去年在拱北口岸和港珠澳大桥口岸立案侦办2
正常人考辽宁师范大学有多难?考上辽宁师范大学要多努力?辽宁师范大学2022高考录取分数线是多少?辽宁师范
1、一楼:一楼是最底层,房子容易受潮,由于高度的问题,一楼的视野和采光也比较差;另外一楼人来人往,隐私
原标题:为什么人们选择在电影节看电影今年的北京国际电影节将步入尾声,但有关北影节的消息一直被人们关注
周五晚高峰交通压力或为今年来最大
1、推荐鬼灭之刃的同人小说五本。2、1,鬼灭之刃之穿越进书追义勇作者:慕雨九狸突如其来的车祸,我穿越进
《崩坏星穹铁道》雅利洛-VI解密流程攻略,「磁流解阀」系列解密大体上能分为2类,第一类修复回路即可,第二
资讯News
06-20
11-03
11-03
11-03
11-03
11-03
11-03
11-03
11-03
11-03
11-03
聚焦Policy
当好农民工的“护薪人” 近日,罗某等7名农民工在收到被拖欠的工资后,纷纷打电话向江西省南昌市...
“通讯录里所有人都知道我欠钱了” □ 本报记者 韩丹东 □ 本报见习记者 张守坤 ...
大连宝马车撞人案肇事司机被判死刑 本报讯 记者韩宇 10月29日,辽宁省大连市中级人民法院一审...
医院财务迷上网络赌博输光5000万元公款 □ 本报记者 马维博 □ 本报通讯员 汪宇堂 曹...
辊环车削 雕琢毫厘(工匠绝活) 【绝活看点】 23年来,雷虎始终扎根一线,改进钢材轧制工艺...
交警严查超标电动自行车挪用“白牌” 截至昨晚6时,处罚电动自行车违法行为共计6585笔;下一步将...
明起寒潮来袭 北方气温普降10℃以上 中央气象台预计,本周日北京平原地区最低气温降至-4℃左右...
多种蔬菜价格降幅达五成 包括菠菜、蒿子秆等 预计本月中旬蔬菜恢复供需平衡 本报讯(记者...
北京周日最低气温或达-4℃ 本报讯(记者 赵婷婷)北京青年报记者昨天从中央气象台获悉,新一股...
昌平一家四口确诊新冠肺炎 天通北苑第二社区升级为中风险地区 朝阳两涉疫校区及16所学校停课 ...