文|蔡小锦 刘庆全 林佳欣 宁钟
关键词:科大讯飞 平台+赛道 商业生态 开放创新平台 智能语音
作为2022年北京冬奥会和冬残奥会官方自动语音转换与翻译独家供应商,科大讯飞股份有限公司(简称科大讯飞)不仅提供了可边录边译且能实时转写的录音笔、可在线翻译60种语言的双屏翻译机等智能语音设备,还开发了能够用6种语言进行面对面交流的虚拟志愿者“爱加”,为来自世界各地不同国家和地区的人们解答冬奥会赛事、赛程及周边交通、人文、旅游等各种问题,助力打造了奥运史上首个信息沟通无障碍的奥运会,全方位展现了科大讯飞智能语音技术创新的硬核实力,标志着其“平台+赛道”商业生态建设收获了丰硕成果。
聚焦智能语音技术,实施“顶天立地”战略
创立于1999年的科大讯飞聚焦智能语音技术领域,实施“顶天立地”发展战略:“顶天”即通过持续研发创新,奠定核心技术领先地位;“立地”即通过商业模式创新,拓展应用场景,实现技术成果落地应用。
1. 技术“顶天”
自2001年正式确定专注语音技术领域的发展方向以来,科大讯飞相继与中国科技大学、中科院声学研究所、中国社科院语言研究所等院校和科研机构共建语音技术联合实验室,整合各方优势资源,持续开展人工智能与语音技术深度融合的研发攻关,取得了一系列创新成果,形成多项核心技术的领先优势。
2006年,科大讯飞首次参加国际语音合成大赛即一举夺冠,并在此后十四年蝉联该项国际赛事冠军。
2010年,科大讯飞开展DNN(深度神经网络)语音识别技术研究。
2011年,科大讯飞上线首个DNN中文语音识别系统。
2012年,在全球语音合成大赛中,科大讯飞的汉语语音合成技术以自然度达4.5MOS的指标,接近新闻联播主持人的水平(5.0MOS)。
2013年,科大讯飞在语种识别领域研发成功BN-ivec技术。
2014年,科大讯飞启动“讯飞超脑计划”,研发基于人类神经网络的认知智能系统,目标是让机器不仅“能听会说”,还要“能理解、会思考”。
2015年,科大讯飞发布对人工智能产业具有里程碑意义的人机交互界面——AIUI,定义万物互联时代的人机交互全新标准。
2016年,科大讯飞研发成功讯飞翻译机,开创智能消费新品类;同年,科大讯飞与中国科技大学联合成立语音及语言信息处理国家工程实验室。
2017年11月,在科技部举行的“《新一代人工智能发展规划》暨重大科技项目启动会”上,科大讯飞、百度、阿里巴巴、腾讯四家公司入选首批“国家新一代人工智能开放创新平台”;同年,科大讯飞首次上榜《麻省理工科技评论》“全球50大最聪明公司”。
2018年,科大讯飞机器翻译系统通过CATTI全国翻译专业资格科研测试,达到专业译员水平。
2019年,科大讯飞新一代语音翻译关键技术及系统荣膺世界人工智能大会最高奖项——SAIL(卓越人工智能引领者)应用奖;同年9月,科大讯飞成为2022年北京冬奥会和冬残奥会官方自动语音转换与翻译独家供应商,致力于打造首个信息沟通无障碍的奥运会;同年10月,在教育部及国家语言文字工作委员会指导下,科大讯飞承建全球中文学习平台项目。
2020年,“讯飞人工智能开放创新平台”及产业示范项目荣获“中国工业大奖”;同年5月,科大讯飞认知智能国家重点实验室创新团队被共青团中央、中华全国青年联合会授予“中国青年五四奖章(集体)”。
2021年,科大讯飞“语音识别方法及系统”发明专利荣获第二十二届中国专利金奖;同年4月,科大讯飞荣获中国智能科技最高奖项——“吴文俊人工智能科技进步奖”一等奖。
2. 应用“立地”
科大讯飞的技术从实验室到市场,都要经过“联合实验室—研究院—事业部”三层研发机构的筛选优化,从而确保其既能代表科大讯飞的核心科技,又可满足用户的实际需求,达到一定的市场规模。首先由联合实验室开展底层技术研发,其次由科大讯飞研究院将底层技术设计成面向不同应用场景的产品,最后由各事业部形成可以投放市场的标准化批量产品。
以人工智能技术为例,智能家电、智能翻译机等产品的底层技术都是深度学习,其核心技术研发由联合实验室完成,而进一步探索深度学习技术在不同领域的应用是科大讯飞研究院的职责,各个事业部则负责将研究院在不同领域的研究成果转化为实物产品或者具体的解决方案,面向应用场景进行市场化推广。
科大讯飞智能语音技术的市场化应用大致经历了三个阶段:2000—2015年,持续研发积累核心技术,取得了让机器从“能听会说”到“能理解会思考”的技术突破;2016—2018年,重点在教育、医疗、城市管理等领域开展技术落地应用探索;2019年至今,随着“讯飞人工智能开放创新平台”的搭建、双轮驱动战略实施和“讯飞超脑2030计划”的启动,开始在多个新赛道拓展应用场景,致力于进入B端的各行各业和C端的千家万户。
商业模式探索:从C端到B端,寻求破局之道
科大讯飞虽然在科技创新方面不遗余力,奠定了核心技术的领先地位,但商业模式探索之路并非一帆风顺。
1. 首战C端受挫
创业之初,直接面向消费者的C端市场大多被行业巨头垄断,科大讯飞想在其中分一杯羹十分困难。与此同时,盗版软件泛滥,科大讯飞的正版软件也难逃此劫。科大讯飞创始团队成员多为技术出身,缺乏营销推广经验,在C端市场屡屡受挫。“畅言2000”是科大讯飞最初推出的面向C端消费市场的软件产品,可用语音向电脑发送操作指令,同时具有文本输入功能,售价两千元一套。虽然科大讯飞对该产品颇有信心,投入巨资进行广告宣传,但并未得到市场认可,销量不尽如人意。原因是彼时个人电脑在人机交互技术方面还不成熟,加之电子商务尚未兴起,代理商、零售商层层加价导致B2C业务难以打开市场局面。这款面向终端消费者市场的语音软件最终折戟,科大讯飞一度濒临破产。
2. 转战B端,掘得第一桶金
2001年11月,科大讯飞举行了一场名为“半汤会议”的重要会议,决定放弃C端个人用户市场,转向开发B端企业用户市场。2002年,科大讯飞与华为达成语音合成系统的业务合作,其语音技术解决方案经过反复测试、修改、优化,在稳定性、工程化方面终于达到规模化商用要求。随着科大讯飞语音合成系统陆续被中兴、神州数码等巨头采用,由科大讯飞提供语音核心技术、合作伙伴做具体应用的FLY Inside模式得以确立,科大讯飞掘得B端市场第一桶金。
从面向消费者的C端市场转向面向企业用户的B端市场,科大讯飞从单纯经营软件产品转向以自身技术优势与合作伙伴进行“捆绑”经营的协作型模式,加快了语音技术的市场应用步伐。2004年科大讯飞首次实现盈亏平衡,2008年在深交所上市,成为中国智能语音第一股,迈上了发展快车道。
3. 风口下的困局
在科大讯飞B2B业务稳定发展的同时,更为激烈的行业大战已经暗潮涌动。作为一家高科技企业,科大讯飞处于一个技术快速迭代的风口,一系列技术成果及光鲜荣誉并没有从根本上解决其面临的市场应用难题。随着互联网和数字化时代的到来,语音识别技术已不再高不可攀。过去,科大讯飞语音识别准确率一年仅能提高两三个百分点,而在数字技术的加持下,同样时间能提升五倍的准确率,这意味着科大讯飞近年来积累的技术优势正在逐渐变弱。
2013年,百度成立深度学习研究院,开始研发深度学习技术,推出语音识别和图像识别产品;阿里巴巴旗下的达摩院、阿里云也持续加大智能语音技术研发力度,并在淘宝、支付宝等平台的实践应用中不断迭代优化;腾讯的所有语音端都采用自主研发的AI技术;高德、携程等互联网企业也利用海量的C端数据,自主开发智能语音系统;搜狗也建立了语音技术研发团队,开发语音实时翻译技术。与此同时,众多新兴创业公司也努力在各个细分市场分一杯羹。受到两面挤压的科大讯飞从2015年开始净利润逐年下滑,平均销售利润率仅为10%。
更让科大讯飞感到“压力山大”的是,竞争对手还免费开放语音技术,使得市场竞争更加激烈。2017年11月,百度宣布语音技术全系列接口永久免费开放,并为合作伙伴和开发者全方位提供语音识别、语音合成、语音唤醒等多种SDK(软件开发工具包)。随后,百度宣布与华为达成全面战略合作,而过去华为的年度旗舰机如Mate10等产品搭载的是科大讯飞的语音助手系统。
在C端硬件方面,科大讯飞的翻译机虽然具有支持34种语言实时翻译、离线翻译、拍照翻译等功能,但售价高达2999元。与之相比,网易的有道翻译王2.0pro采用自主研发的离线神经网络翻译技术,支持43种语言在线翻译、21种语言在线拍照翻译、7种语言离线拍照翻译,且具有英、日、韩三大常用外语与中文的离线互译功能,售价仅1688元。阿里巴巴推出的天猫精灵X1、小米推出的AI音箱,均未采用科大讯飞的语音技术,而是采用了思必驰和云知声两家新锐公司的语音技术。
面对激烈的市场竞争形势,科大讯飞该如何破局?
深耕人工智能技术,构建“平台+赛道”商业生态
人工智能领域的竞争已不再是单个企业之间的竞争,而是产业生态体系之间的竞争。严酷的市场竞争形势让科大讯飞认识到,只有通过构建互利共生的商业生态,才能从根本上解决先进技术的市场化应用问题,从而建立持久的竞争优势。
从2017年下半年开始,科大讯飞实施以讯飞人工智能开放创新平台为依托,智慧城市、智慧教育、智慧医疗、智能服务、智能汽车和消费者产品等多个行业应用场景为赛道的“平台+赛道”发展战略(如图1所示):平台的功能是整合各相关方资源,构建互利共生、开放创新的行业生态体系,赋能合作伙伴;赛道即聚焦刚需市场,将人工智能技术与各行业应用场景深度融合,建立“垂直入口+代差”的竞争优势。

1. 构建人工智能开放创新平台
作为“国家新一代人工智能开放创新平台”,科大讯飞致力于通过技术赋能、成长赋能、解决方案和市场赋能,为合作伙伴和开发者团队提供从初创到成长再到高质量发展的全链路服务,持续构建互利共生的行业生态。2017年,科大讯飞斥资10.24亿元建立开发者扶持基金,每年10月24日举办全球开发者节,不断吸引优秀人才加入讯飞开放创新平台。在市场需求不断变化的数字化时代,讯飞开放创新平台提供的解决方案不再局限于网页插件等接口服务,而是延伸到终端设备、行业场景解决方案、技术能力调用、移动数据查询等多元化服务,其业务模式主要分为四类:分成收费模式、交易型盈利模式、产品和解决方案型盈利模式、间接获利模式。
截至2022年1月31日,讯飞开放创新平台已开放466项AI技术,聚集了逾302万个开发者团队,总应用数超过139万次,累计覆盖终端设备数超过34亿台,讯飞AI大学堂学员总数达68万人,链接了420多万个生态伙伴。同时,通过平台获得的海量数据正好弥补了科大讯飞在用户数据方面的短板:平台为开发者提供全链路服务,开发者开发的应用和技术吸引了大量终端用户,使得开发者和平台之间建立了牢固的互利共生关系,形成了从源头技术创新到产业技术创新,再到商业模式创新、应用场景拓展的良性循环(如图2所示)。科大讯飞2021年三季报显示,讯飞开放创新平台前三季度业务收入近20亿元,同比增长107%。

2. 聚焦刚需市场,建立行业赛道竞争优势
依托开放创新平台,科大讯飞聚焦智慧教育、智慧医疗、智慧城市等刚需市场,将人工智能技术与各领域应用场景深度融合,建立“垂直入口+代差”竞争优势。在智慧教育领域,科大讯飞通过覆盖教、学、考、管四大主场景的全栈产品体系,打造数字化和智能化教学环境,并进一步实施区域因材施教综合解决方案,实现教与学的数据积累。2020年,科大讯飞智慧教育产品已在全国31个省级行政区广泛应用,与38000多所学校开展了深度合作,服务师生超过1亿人次。2020年,智慧教育领域已经成为科大讯飞第一营业收入来源,占当年公司总营收的30.86%。在智慧医疗领域,科大讯飞通过构建人工智能辅助诊疗系统,提升医生诊疗技术和服务水平;与中国医学科学院、北京协和医学院共建国内首个医学人工智能实验室,将医学专家经验与大数据、人工智能技术有机融合,形成持续迭代优化的闭环生态系统。在智慧城市领域,科大讯飞开发的7×24小时政务服务地图,助力机关人员提升办事效率,满足群众便捷化、精准化、个性化的办事需求。
3.“To B+To C”双轮驱动,收获商业生态红利
激烈的市场竞争使得科大讯飞认识到单纯依靠B端市场无法获得长足发展。科大讯飞从2018年开始实施“To B+To C”双轮驱动战略,除了拓展B端行业赛道外,也在C端个人消费市场持续发力。
例如,在智能汽车领域,已有多家汽车厂商在一百多款车内运用了科大讯飞的人工智能技术,而后台的车联网服务是科大讯飞潜在的C端市场。在智慧教育领域,通过B端产品和智能教学解决方案深入校内教学场景积累数据资产,形成学生精准画像,用于开发面向学生群体的C端产品。通过采集、分析学生使用C端产品时反馈的信息数据,不仅可以优化C端产品,还可以反哺B端市场。2021年前三季度,科大讯飞营业收入108.68亿元,同比增长49.2%;实现净利润7.29亿元,同比增长31.48%。其中对总营收贡献最大的是智慧教育和消费者两个事业群,充分显现了科大讯飞双轮驱动战略下B端和C端市场互补互促效应,开始进入“平台+赛道”商业生态的红利收获期。■
主要参考文献
[1] 张心怡.科大讯飞:以解决社会刚需为出发点发展人工智能[J].国际品牌观察,2021(8).
[2] 淦凌云,卫萌.科大讯飞:从语音到AI的前行之路[J].中国工业和信息化,2019(4).
作者单位
蔡小锦 宁钟 复旦大学管理学院
刘庆全 上海商学院工商管理学院
林佳欣 暨南大学法学院
|