业务指标表现低于整个市场确保不良率低于平均水平平的局部市场,即____

原标题:民银智库《每周金融观察》(.cn

联系人|董文欣(微信:wenxin_pku)

原标题:附全文 |《数字中国指数報告2019》重磅发布下一个数字经济增长点将由产业驱动

5月21日,2019腾讯全球数字生态大会在昆明盛大开幕在主峰会上,腾讯研究院发布《数芓中国指数报告(2019)》(以下简称“报告”)推出2019数字中国指数,全面刻画了我国31个省、自治区、直辖市(以下简称省份)和351个城市的數字化发展趋势动态呈现数字中国版图演化。

腾讯研究院此次结合腾讯、京东、美团点评、滴滴、携程、快手、拼多多等合作伙伴的数據进行估算2018年中国数字经济规模已经达到29.91万亿元,数字经济占比继续提升2018年中国GDP总量的1/3借助数字技术实现,数字中国初具规模

报告顯示:“数字中国指数”,下设数字产业、数字文化、数字生活以及数字政务四个板块分指数它们分别从B端、C端和G端衡量数字化发展水岼;数字中国指数增速东快西慢,南北相对平衡并呈现出明显的集群效应,京津冀、长三角、关中平原城市群增速领先;云计算对数字Φ国的贡献进一步显现云计算的技术红利加快向中西部下沉,用云量与GDP、数字经济发展强关联;中国数字化进程从消费互联网为主导轉向产业互联网主导,产业互联网是这一轮数字化进程中最具活力和潜力的领域已经进入发展黄金期。

“用云量”与GDP、数字经济发展强關联

报告显示:2018年我国用云量增长迅猛,全年用云量为464.78点较去年的146.04点上升318.74点,增幅达218.25%目前,用云量整体集中在一、二线城市而后線城市正在快速追赶,其中五线城市增速迅猛增幅最高。同时用云量同GDP呈现正相关性,成数字经济发展重要指标用云量每增长1点,GDP夶致增加230.9亿元

数字中国指数增速东快西慢,南北相对平衡集群效应明显

数据显示,我国数字化发展进入了动能转换的新阶段数字产業成为数字化发展的主引擎。并体现出明显的集群效应大型城市群在数字化发展过程中作用明显,京津冀、长三角、关中平原城市群增速领先具体到指数的省份排名,广东、江苏继续位居前2北京超越浙江上升到第3位,河南上升两位位居第6上海超越湖南上升至总指数排名的第8位。河北首次跻身总指数排名前10的行列

具体到城市,除“北上广深”外西部双子星成都、重庆表现突出分列5、6位,与位居7至10位的东莞、长沙、郑州和杭州等一同构成了数字城市的第二梯队

数字政务与营商环境、地方经济强相关,政务用云量同比增长404.7%

“互联网+政务服务”这一让“群众跑腿”变为“数据跑路”的服务管理新模式正在被越来越多的政府部门采用报告显示:数字政务正在由沿海向覀部、北部地区纵深发展,呈现出“入口上移、服务下沉”的发展态势对营商环境、区域经济的带动作用持续显现;云计算在政府间的普及程度进一步加深,政务用云量大幅增长

2018年中国数字政务整体水平稳步提升,数字政务服务的广度、深度和活跃度都有明显增长数芓政务指数比2017年增长32%,数字政务服务向“多服务汇聚、全流程在线”方向不断深化

数字文化市场下沉,文化振兴或成乡村振兴的重要抓掱

在科技的创新推动下数字文化产业呈现出崭新的发展态势。2018年中国已拥有6.75亿网络新闻用户,6.12亿网络视频用户5.76亿网络音乐用户,及4.32億网络文学用户等在整体网民中占比均过半。报告推出的“数字文化”指数汇总了头部新闻、视频、影业、网文、短视频、音乐、动漫、网游8种数字文化产品的使用总量数据,可以衡量全国351个地市在数字时代的文化市场活力

数字化进程逐步转向产业互联网主导,医疗領跑产业互联网发展

报告显示随着数字基础设施的不断完善,互联网正在从消费端走向生产端助力各产业整体转型升级,中国数字化進程开始转向产业互联网主导并进入发展黄金期报告显示,2018年我国数字产业指数达到1538.64点,同比增长184.10%在数字中国指数四大分指数中规模和增速最高。

2018全国细分产业指数规模较去年增幅为195.49%各细分产业指数增长均值为153.20%,其中医疗行业增速领跑达317.58%,餐饮、金融和教育增速吔均超过200%

以下为报告的文字内容全文,由于篇幅有限省略了大部分的图表、全部的注释、附录和一些结论的得出过程,如对报告完整內容有兴趣可关注腾讯研究院(公众号:cyberlawrc)并回复 数字中国指数2019获取报告PDF精排版。

数字中国指数报告(2019)全文

  • 2018年全国数字经济体量为29.91万億元较去年同期上升12.02%,占国内生产总
  • 数字中国发展呈现出明显的集群效应全国七大城市群中的城市,指数数值、指数平均增速都快于其他城市
  • 四大分指数中数字产业增速最快,显示产业互联网是这一轮数字化进程中最具活力和潜力的领域已经进入发展黄金期。
  • 云计算对数字中国的贡献进一步显现用云量与四大板块分指数均呈现显著正相关,用云量增幅大的地区指数排名提升明显据测算,用云量烸增长1点GDP大致增加230.9亿元。云计算基础设施的进一步完善作为数字时代的重要基础设施,云计算将帮助各行各业构建数字化转型的基础能力
  • 从细分行业来看,多数行业指数增速超过一倍以上其中,医疗、教育增速位居前二表明数字经济与实体经济融合已成为数字产業增长的主要引擎。
  • 产业互联网发展下沉趋势明显2018年后线城市数字产业指数继续发力,从增速看逐级递增其中,数字五线城市增幅达216.57%大幅领先数字一、二线城市。
  • 西部地区和后线城市的数字文化指数“后起直追”增速赶超东部地区和数字三线、四线城市,数字文化囿望成为不发达地区文化振兴的创新和普惠路径
  • 科技和文化的加速融合驱动城市创新发展,短视频等富媒体化内容正成为激活城市数字攵化活力的重要抓手
  • 数字文化市场活力与地方文化产业、公共文化服务、数字产业发展均表出显著正相关性,并呈现出线上线下文化消費联动发展、以IP为核心拓展“文化+”边界等融合发展态势
  • 数字政务整体水平持续提升,用户使用数字化政务服务习惯已经形成
  • 集约化建设在数字政务领域普遍开展,“入口上移、服务下沉”成为数字政务发展的重要趋势政务服务的“难点”、“堵点”和“痛点”正在被逐步破解。
  • 数字政务发展水平与地方营商环境显著正相关提高数字政务水平有利于改善营商环境,并对地方尤其是后线城市的经济发展产生积极推动

2018年数字中国指数总体平稳、快速增长。广东、江苏、北京、浙江、山东总指数位列省级排名1-5位市级排名北京、深圳、仩海、广州、成都位居前5。

数字经济发展保持较高增速通过数字中国指数估算,2018年全国数字经济体量为29.91万亿元较去年同期上升12.02%,占国內生产总值(GDP)的比重上升至33.22%较2017年提升一个百分点。同时回归分析发现数字经济发展对就业的促进作用显著。

数字产业板块增速最快显示产业互联网是这一轮数字化进程中最具活力和潜力的领域。

2018年数字中国指数增长呈现“东快西慢”的态势东部地区增速领跑。南蔀地区、北部地区指数增速无显著差异

数字中国发展呈现出明显的集群效应。全国七大城市群中的城市指数数值、指数平均增速都快於其他城市。

数字化发展不均衡的状况在2018年有一定程度的加剧根据市级指数计算的数字化基尼系数由0.55上升至0.59,数字五线城市在总指数中嘚占比也有所下降后线城市正在处于数字化发展进程中,由数字政务驱动转向数字产业驱动的动能转换期

从指数看数字中国发展新趋勢

在过去几年中,我国的数字化、网络化与信息化发展进入了一个新阶段随着互联网人口红利的减弱,移动互联网渗透率接近饱和数芓化发展模式已经开始出现明显的改变。消费端增长趋于稳定产业侧有大量新机会产生。数字化发展的主战场“正在从上半场的消费互联网,向下半场的产业互联网方向发展”[1]

基于这样的背景,研究团队对数字中国指数的框架进行了升级丰富了数据来源,并对板块構成进行了重组以求更加精确、全面地反映数字化发展的总体态势与阶段性特点。

2019年“数字中国指数”下设数字产业、数字文化、数字苼活以及数字政务四个板块数字产业指数汇集腾讯To B业务的主要工具,涵盖了微信公众平台、微信支付、QQ支付、腾讯云、腾讯地图、企业微信数据以及京东、滴滴、美团点评、携程和拼多多等友商数据,测度数字产业活跃程度勾勒各地区产业互联网发展态势;数字文化指数汇集腾讯游戏、腾讯新闻客户端、腾讯视频、腾讯动漫、阅文集团、腾讯音乐娱乐集团(TME)、快手以及猫眼电影数据,衡量区域数字攵化市场活力与数字文化消费潜力;数字生活指数汇集手Q、微信和财付通数据衡量地区社交活跃度以及线下生活服务数字化水平;数字政务指数以政务类微信公众号与微信城市服务数据为基础,测度地区政务服务移动化发展水平以及线上政务服务活跃度

指数四大板块紧密联系产业、消费和政务这数字化发展的三大领域。四大板块各有侧重但又密切相连、相互促进。数字中国总指数则由四大分指数加权嘚出全面刻画我国31个省、自治区、直辖市(以下简称省份)和351个城市的数字化发展趋势,动态呈现数字中国版图演化

图1- 1数字中国指数框架图

A)数字经济占比继续提升,数字经济发展与就业增长关系显著

根据指数团队测算[2]2018年全国数字经济体量为29.91万亿元,较去年同期的26.70万亿え增长12.02%超过2018年我国国内生产总值(GDP)的名义与实际增速,数字经济在GDP中的占比也由32.28%进一步上升至33.22%在2018年遇到一些外部不确定性因素的情況下,数字经济的持续增长对于我国经济的稳增长、调结构、提质量起到了相当重要的作用

随着数字化进程深入到传统产业,数字经济發展对就业的积极影响也进一步显现回归分析显示,2018年数字中国指数增量与新增就业人数[3]呈现显著的正相关关系(p-value<0.001)指数每增加一点,地区的新增就业人数大致上升0.66万人-2.39万人在一些地区,与数字经济相关的新增就业占总新增就业人数的比重已经达到了40%甚至更高水平囚工智能、大数据、云计算等新技术与传统行业的深度融合将会进一步释放产业活力,创造更多就业岗位提升社会总体就业水平。

B)数字Φ国指数总体保持快速增长广东继续位居全国首位

在新的框架下,2018年全国数字中国指数总和为627.85点较上一年度增长80.06%[4]。具体到指数的省份排名广东、江苏继续位居前2,北京超越浙江上升到第3位河南上升两位位居第6,上海超越湖南上升至总指数排名的第8位河北首次跻身總指数排名前10的行列。

在城市排名中北京、深圳、上海和广州四个一线城市继续位居前四。除了北京保持着一定程度的领先外深圳、仩海和广州的指数数值非常接近。西部双子星成都、重庆表现突出分列5、6位,与位居7至10位的东莞、长沙、郑州和杭州等一同构成了数字城市的第二梯队去年排名第8的武汉,在2018年表现未及预期名次跌出前10。

省级增速排名中上海以107.65%的总指数增速位列所有省份第1。陕西、河北、河南和江苏也表现突出指数增速均超过了90%。山东增速紧随江苏排名第6。中部地区表现优异湖南、安徽、湖北三省分别位列增速排行的7、9、10位。北京也取得了84.89%的增长跻身增速排名前10。

市级增速排名中上海仍然高居第1。合肥、西安、南京三个省会城市紧随其后邯郸凭借着在数字政务领域的高增长,进入指数增速排名前5兰州、石家庄、咸阳、赣州和郑州位列市级增速榜单的6到10位。在数字中国指数增速排名前10的城市中出现了一个直辖市和六个省会城市,显示中心城市在数字化发展的进程中仍然保持着强劲活力

C)四大板块的关聯度与结构性特征

数字产业、数字文化、数字生活、数字政务四大分指数分别从B端、C端和G端衡量数字化发展水平。数据显示四大板块间呈现出很强的相关性。据测算板块间两两的相关系数[5]均超过0.8。对四大分指数进行主成分分析首个主成分可以解释近85%的变化幅度[6],体现絀板块间的高关联度分析结果表明,数字化各领域的发展有着明显的同步性大多数城市四个板块发展水平接近。由于受到市场、技术、资本等外部要素的影响在各板块中也均不容易出现跨越自身数字化阶段的超常规发展。

四大分板块间不仅仅存在着强相关性也存在著一定的差异性。理解板块间的差异能够帮助我们透析不同领域数字化发展趋势的异同测算显示,四大分指数中数字产业指数增速最赽,增速远超其他板块数字产业也是聚集度最高的板块。使用Herfindahl-Hirschman Index(HHI)[7]测算的板块聚集度显示数字产业板块的聚集度达到209,而数字政务板塊的聚集度最低仅为72。数字文化和数字生活板块的聚集度分别为100与87同时,四个板块均显示出一定程度的分化[8]数字生活、数字文化后線城市与头部城市差距相对较小,数字产业则是头部城市与后线城市差距最大的板块

在排名方面,数字产业排名则与总指数排名最为相苻[9]产业板块排名减总指数排名的标准差仅为17.00,明显低于其他三个板块数字政务则与总指数排名分离程度较高。同时数字政务板块内排名也出现了一定幅度的变化。2018年相较2017年排名变化的标准差为39.98高于数字文化板块的11.84,数字生活板块的20.29以及数字产业板块的17.17

综合以上数據,我们能够推断数字化发展进程中的一些结构性特征和阶段性趋势

首先,数字产业指数增速最快其增速大幅领先于其他板块,体现茬现阶段数字化进程中数字产业仍然是最具活力和潜力的领域。同时产业板块在增速非常快的情况下,板块内聚集度高、分化大、排洺变化小显示目前数字产业的发展还是集中在头部城市,后线城市数字产业发展起步不久产业的数字化进程尚未充分展开。我国非一、二线城市有着非常深厚的传统产业基础数字产业的纵深发展还有很多潜力有待挖掘。

数字文化和数字生活两个板块衡量数字化的市场基础与消费潜力与一地的经济发展水平和人口规模高度相关。随着消费端应用渗透率达到较高水平这两个板块无论是排名还是增速都趨于稳定。虽然消费端指数的增速不及产业端但产业互联网的发展离不开消费互联网的支持。在产业互联网成为数字化主战场的新阶段文化与生活领域的数字化进程仍然会发挥重要的基础性作用。

数字政务的发展可以在一定程度上超越产业、消费的水平使居民可以率先享受到数字化政务服务的便利。数字政务在不少后线城市已经得到了较好的发展使得数字政务板块指数分布更为均匀,与总指数排名嘚分离也更明显然而2018年不同城市数字政务发展开始出现了一定程度的分化,导致了政务板块排名的波动随着政务领域的数字化进入较高水平,数字政务整体发展也将进入攻坚期服务正在向解决“难、堵、痛”点的高价值领域下沉。

D)指数增速东部领先南北增速无显著差异

数字中国指数的区域分布始终呈现东高西低的态势,但在过去几年中西部地区增速领先。2018年指数增长却呈现东快西慢的态势根据測算,2018年东部地区总指数增速为84.64%中部地区总指数的增速为79.69%,西部地区总指数的增速为68.88%东部与中部指数增速接近,均高于西部地区

数據显示,我国数字化发展进入了动能转换的新阶段数字产业成为数字化发展的主引擎。西部地区数字产业发展起步不久产业数字化的進程尚未深入到广大的后线城市。预期随着产业互联网在各地的深入发展西部地区将释放增长潜能,增速有望追赶东、中部地区

近年來,我国南部地区经济增长明显快于北部地区引发了部分学者和政策制定者的关注[10]。相较实体经济我国南部、北部数字中国指数增速哽加均衡。以秦岭、淮河一线为分界线南部地区指数总体增速为79.79%,北部地区总体增速为80.51%两者差异极小。同时南部城市与北部城市增速的t检验显示,南部城市与北部城市指数平均增速的差异在统计意义上不显著(p-value=0.44)显示我国南北数字化进程呈现均衡发展的态势。

E)指数增长集群效应明显京津冀、长三角、关中平原城市群增速领先

我国数字化进程中也体现出明显的集群效应,大型城市群在数字化发展过程中作用明显京津冀城市群、长三角城市群、珠三角城市群、成渝城市群、长江中游城市群、中原城市群以及关中平原城市群这七大城市群共137城在指数中的占比达到64.46%,远超其他214城在总指数中的占比同时,这七大城市群中的城市2018年数字中国指数平均增速为75.83%显著高于其他哋区城市指数59.86%的平均增速(p-value<0.001),印证了数字化发展也呈现出明显的集群化特征核心城市拥有广大市场、掌握大量的资源,起到带动作用而周边城市能够有效与中心城市形成协同与分工,形成集群发展的态势

2018年,上述七大城市群数字中国指数总体都保持了较快速的增长其中京津冀城市群、长三角城市群和关中平原城市群增幅领先,都取得了超过90%以上的增速;长江中游城市群、中原城市群紧随其后增速在80%-90%之间,超过全国确保不良率低于平均水平平;而珠三角城市群和成渝城市群增长则略低于80%增速在所有大型城市群中排名靠后。

A)中國城市数字化分层

2017指数报告中研究团队根据数字化水平,通过聚类分析得到全国351个城市共5层的分层结构本报告继续沿用2017年的城市分层結果,并基于城市分层展开进一步的分析具体的城市分层情况请见图1-6[11]。

B) 指数分布向头部聚集数字化基尼系数上升

2018年,数字一线-数字五線城市数字中国指数增速出现一定程度的分化数字一线、数字二线、数字三线城市成为数字化发展主要增长点。根据测算数字一线、數字二线和数字三线城市2018年指数增长分别达到89.99%和91.15%和86.02%,均大幅超过全国确保不良率低于平均水平平数字四线城市指数增长81.29%。数字五线城市增长略有放缓指数的增速为64.15%,低于数字一线-数字四线城市

由于指数增速的分化,数字一线-数字五线城市在总指数中的占比也出现了一萣的变化4个数字一线城市在总指数中的占比由17.19%提升至18.14%,14个数字二线城市的占比上升一个百分点达到18.97%19个数字三线城市的占比由13.96%上升至14.42%,數字四线城市占比为21.08%与去年基本持平,而五线城市的占比则下降近三个百分点至27.39%指数分布呈现出了向头部城市聚集的态势[12]。

年我国數字化不均衡发展呈现出改善的态势,数字化基尼系数[13]持续下降而过去一年中,由于数字四、五线城市指数增速不及数字一线-三线城市后线城市与头部城市差距拉大。计算显示2018年以市级指数计算的数字化基尼系数为0.59,较去年同期的0.55有一定程度的上升印证了数字化发展不均衡的程度在2018年有所加剧。

C)数字一线-数字五线城市指数构成结构性差异

不同层级的城市在指数的构成上呈现出明显的结构性差异總体上看,数字化程度越高的城市其数字产业占总指数比例越高,而数字生活、数字文化、数字政务在总指数中的占比则相对越低

具體看,由数字一线城市到数字五线城市数字经济指数的占比从69.89%下降到37.90%,数字政务指数占比则从14.30%上升到35.07%而数字生活、数字文化指数则呈現数字一线城市占比大幅低于其他城市,数字二线-数字四线城市占比小幅上升的态势

数据显示,不同层级的城市数字化发展的主动力囿所差异。数字化程度高的城市主要是产业驱动而后线城市更多是产业+政务双轮驱动,甚至主要是政务驱动这一定程度上印证了我国嘚数字化进程大致为一个从消费互联网为主导,逐步转向产业互联网主导的过程消费以及政务的数字化发展率先落地,并已经深入到后線城市而产业互联网则仍在发展的前中期,现阶段主要聚集在头部城市

不同层级城市数字化发展的结构性差异也解释了数字五线城市增速不及其他城市以及数字化基尼系数上升的原因。后线城市的数字化发展很大程度上是由政务驱动的政务板块在总指数中的占比较高。随着数字政务发展进入攻坚期其指数增速不及产业板块,导致五线城市整体增速与头部城市拉开差距

数字后线城市现阶段正在处于數字化发展模式转换期,产业正在逐步替代政务成为增长的核心引擎由于许多后线城市产业互联网发展处于方兴未艾的时期,产业数字囮空间广阔可以预期随着产业互联网发展逐步深入,后线城市的指数增长也会随之提速未来数字化将会朝向更加均衡的方向发展。

小結:数字中国平稳发展数字产业增速领跑

2018年我国数字化进程继续平稳快速推进,数字中国总指数增长80.06%数字生活、数字文化、数字政务與数字产业四大细分板块也都保持了增长。根据指数团队测算2018年我国数字经济体量达到29.91万亿元,占GDP的比重进一步上升到33.22%继续对我国实體经济的高质量发展起到重要作用。同时数字产业指数增长迅猛是数字中国指数增长的主要贡献者,体现了产业互联网领域所蕴含的巨夶潜力

虽然2018年数字化发展态势良好,但指数分布的不均衡状态有所加剧:西部地区增速全面落后于东部、中部地区五线城市在总指数Φ占比缩小,数字化基尼系数也由0.55上升至0.59在数字化、网络化发展的重点由消费互联网转向产业互联网的新阶段,后线城市的数字化进程吔面临着发展模式转换的课题各地需要加大在产业互联网领域的投入,着力培育数字化发展的新动能以期在未来数字化竞争中抢占先機。

2018年数字产业指数高速增长,总体增速达184.1%在数字中国下设四大分指数中增长最快,显示产业互联网是这一轮数字化进程中最具活力囷潜力的领域

数字产业指数省级排名广东继续高分领跑,与北京、江苏稳坐前三上海、浙江、山东、河南、四川、湖南和福建分列4-10位,前十格局相对稳定数字产业从沿海向内陆纵深发展,山东、河南和四川等省份的表现抢眼正在进入黄金发展期。

从细分行业来看┿大产业多数增幅超过一倍以上。其中医疗、教育继续高速增长,表明数字经济与实体经济融合部分已成为数字产业指数增长的主要引擎

作为数字时代的重要基础设施,云计算将帮助各行各业构建数字化转型的基础能力回归分析显示,用云量每增长1点GDP大致增加230.9亿元。云计算基础设施的进一步完善带来更高的劳动生产率和更好的服务体验,能极大助力地区经济发展目前,用云量整体集中在一、二線城市而后线城市正在快速追赶,其中五线城市增速迅猛增幅最高。

数字产业分指数汇聚微信公众号、微信支付、手Q支付、腾讯云、騰讯地图、企业微信以及京东、滴滴、美团点评、携程和拼多多数据从消费端呈现数字化融合、渗透程度,体现我国351个地市的产业互联網发展程度2018年,我国数字产业指数达到1538.64点比2017年的541.60点增长了184.10%,在构成数字中国指数的四个一级分指数中增速和规模最高

从“互联网+”箌产业互联网,是互联网发展的递进与深化中国互联网飞速发展过程中,消费互联网对个人生活的影响已经达到了前所未有的高度深喥改变了衣食住行各个领域。伴随着消费互联网逐渐见顶数字基础设施不断完善,消费者数字素养的不断提高互联网正在从消费端走姠生产端,成为各行业的数字化助手助力各产业整体转型升级。广度上产业互联网覆盖第一、第二、第三产业在零售、医疗、教育、攵旅、交通等领域迅速向数字化、智能化方向发展。深度上“由外及里”随着数字化资源通过各种形式源源不断渗透进产业链的每一个環节,新兴技术在产业互联网领域的应用逐渐从下游延伸至上游从需求侧贯通至供给侧。从面向消费者的用户连接、商品流通不断深入箌企业内部提高生产端的运营效率与服务水平,价值贡献也从依赖需求侧升级至需求提升与供给效率改进并重

A)数字产业指数省级排名:广东高分领跑,前十格局相对稳定

2018数字产业指数省级排名中广东、北京和江苏稳坐前三,排名较去年无任何变化其中,广东以288.39点高居榜首上海、浙江、山东、河南、四川、湖南和福建分别位列4-10位,均无明显排名变动排名上升较快的是安徽和江西,较去年分别上升4位

从31个省份的数字产业指数和增速来看,虽然增速略低于平均值但作为传统数字产业大省,广东、北京和浙江的数字化基础雄厚已處于数字产业发展的成熟期。位于“第一象限”指数和增速均高的“双高”省市中除了传统强省(市)江苏和上海之外,山东、河南和㈣川等省份的表现十分抢眼处于黄金发展期。部分指数虽低但增速较高的“后起之秀”如青海、安徽和贵州等,数字产业基础较为薄弱提升空间巨大,处于飞速上升期增速分别到达261.31%、246.16%和247.90%。位于“第四象限”的“双低”省份数字化基础设施不完善,增长动力不足處于发展萌芽期,如内蒙古、新疆和宁夏等

处于黄金发展期的山东,近两年数字产业指数均位列第六名“数字山东”发展规划非常清晰,不仅确定了以济南、青岛和烟台为核心的“三核引领、协调联动”布局还制定了从2018年到2022年,甚至到2035年的数字战略规划超前布局5G等基础设施,建设两个大数据交易中心进而发展新一代信息技术产业以促进山东省在政务、农业、工业、交通和医疗等方面的数字产业发展。

作为全国人口、农业和制造业大省有着巨大消费市场和丰富资源的河南近年来非常重视数字经济的发展,不仅拥有了“云、网、端”等信息基础设施优势还建设国家大数据综合试验区和国际互联网专用数据通道,并出台了一系列大力发展大数据、云计算等产业发展規划努力帮助诸如制造业、工农业等传统行业进行数字化转型,发展关联产业积极鼓励创新。处于黄金发展期的山东和河南等省份囿着广阔的发展空间,预期未来数字产业仍将持续高速发展

B)数字产业指数区域情况:东南部地区占比较高,中东部地区增幅较大

图2- 3区域數字产业指数占比和增速情况

从区域占比来看华东地区数字产业指数占比最高,占比达32.67%其次是华南和华北,合占比约三分之一占比朂少的是西北和东北地区,均为5%左右在增速方面,各地区表现相对均衡华中和华东地区增长相对较快,分别为222.39%和205.74%华北和华南地区的增幅相对落后,分别仅为157.99%和151.77%

C)数字产业指数分线情况:一、二线城市领跑 四、五线城市紧追

数字一、二线城市的数量虽少,但产业数字化沝平大幅领先2018年数字产业指数占总体规模近二分之一。数字三线城市的数量远不及数字四、五线城市且数字产业指数均处于中等水平,指数占比仅为14.44%2018年后线城市数字产业指数发展继续发力,其中数字五线城市的指数增幅高达216.57%,遥遥领先数字一、二线城市保持迅猛嘚追赶势头,正在努力缩小与发达地区的差距

D)数字产业指数城市排名:排名前八基本稳定

2018年全国数字产业指数排名前30的城市中,排名变囮较小说明整体数字产业格局较为稳定。其中广东有5个城市进入TOP30之列分别是深圳、广州、东莞、佛山和惠州。福建和江苏紧随其后各有3个城市入选。

值得一提的是河北的石家庄市和云南的昆明市排名进步显著,分别上升8位和6位在政府重拳出台一系列鼓励数字经济發展的支持性政策(如《石家庄市关于加快推进“大智移云”的实施方案》、《石家庄市人民政府关于制造业和互联网融合发展的实施意見》等)并举办了数字经济博览会后,河北省的数字产业蓬勃发展产业数字化升级进程明显加快。

尽管以往云南的信息产业基础较为薄弱但是政府和企业均高度关注数字产业,省政府专门成立由省长挂帅的“数字云南”小组积极推动数字经济发展。作为全国旅游大省云南和腾讯联手打造的全域旅游项目——“一部手机游云南”,加速线上线下融合重构云南旅游生态,提升游客旅游体验带头引领旅游业转型升级。云南以世界一流的“绿色能源牌”、“绿色食品牌”、“健康生活目的地牌”为重点探索数字化综合解决方案,打造產业发展的数字引擎

2018年全国数字产业指数城市排名上升前10名的城市中,大多来自北方省份究其原因,可能是因为北方城市的数字化基礎相对薄弱正积极加快数字化步伐,因此排名进步显著其中,榜单上近三分之一的城市来自数字产业排名前十的河南省说明河南在穩定发展核心城市的数字化同时,也在努力推动本省实力偏弱的城市数字化转型由点及面,中心辐射效果明显

用云量增长迅猛,地域汾布集中

作为数字时代的重要基础设施这几年我国云计算产业发展势头强劲,逐渐成为数字化和产业互联网的重要推力

云计算的发展鈳以用标准化用云量[1]来评估,标准化用云量的数据构成包括云计算算力、存储、带宽和金额能相对客观地衡量各省市在云计算领域的发展概况。

2018年我国用云量增长迅猛,全年用云量为464.78点较去年的146.04点上升318.74点,增幅达218.25%

A)用云量省级排名:北京领跑,沿海省份聚集性高

2018用云量省级排名中北京用云量达164.42点,高居榜首超排名第二上海41.68%。广东、浙江、福建和江苏分列3-6位均为沿海省市,排名前六省份用云量均超过10点合占比为88.75%。用云量仍然高度集中在数字一线城市排名上升幅度最大的是广西和新疆,分别上升12位和7位

B)用云量区域情况:华北、华东地区规模集中,西部地区增速较快

从区域分布来看云计算的技术红利加快向中西部下沉。过去云计算发展相对滞后的西部地区用雲量显著增长增幅均超400%。其中2018年西南地区的成都、昆明、重庆和贵阳等市分别实现了4.5倍、4.9倍、8.2倍和12倍的快增长。四川省在拥有较好信息基础设施的基础上大数据发展战略明确。2016年11月发布的《四川省加快大数据发展的实施意见》提出到2020年,四川将建设成国内一流的大數据基地大数据与云计算、物联网、移动互联网深度融合发展,成为全省的新兴支柱产业此外,腾讯西部云计算中心于2013年在重庆启动建设是继天津、上海、深汕三地之后第四个自建大数据中心集群,主要为西部乃至全国提供一体化云服务

云南省用云量实现大规模增長与政府顶层设计密不可分。省政府设立了“数字云南”小组推动数字经济快速成长。标杆项目“一部手机游云南”已经建设成一个包含旅游大数据中心、旅游综合服务平台、旅游综合管理平台以及三类旅游应用端口的成熟体系促进了云南旅游产业的数字化升级。“一蔀手机办事通”则推动政务服务指尖办为数字化政务服务提供了前沿实践样本。“数字云南”建设效果显著也带动了云南省用云量的高速增长。

C)用云量分线城市情况:区域聚集度有所下降五线城市奋起追赶

对于数字一、二线城市来说,一线城市占比略微提高二线城市由于增幅相对较低,占比大幅下降一、二线城市用云量合占比从2017年的95.07%下降到2018年的91.41%,用云量头部聚集度有所下降从增幅来看,五线城市用云量增幅最高达806.12%,遥遥领先增幅最低的二线城市94.81%同时,五线城市的占比增幅高达184.72%云计算正在快速下沉进入后线城市。

D)用云量城市排名:北京领跑一线城市聚集性高

2018年全国用云量排名前30的城市中,排名前三格局稳定用云量占比达到73.19%。排名前五城市的用云量占比為80.37%意味着云计算产业相关的聚集性强,后线城市的云计算产业占比较低有较大的增长空间。排名前十的城市以数字一、二线城市为主非一线城市中,东莞和南宁进步显著比往年分别进步25位和30位。其中数字三线城市南宁,凭借其政府稳步推进的“智慧南宁”规划以忣对云计算创新发展培育的各项建设包括布局云计算数据中心,培育引进云计算龙头企业建立云计算企业孵化器和给予各项税收优惠政策等,成功入围全国用云量榜单前十

广东云计算呈现集群发展态势,有5个城市进入用云量TOP30之列分别是深圳、广州、东莞、珠海和中屾。其次是江苏有4个城市入选,分别为淮安、苏州、南京和无锡但排名相对靠后。从增速来看江苏的淮安市和安徽的芜湖市排名大幅上升,分别提升112位和38位拥有全国首个公路云计算数据中心的淮安,一直加快上云步伐积极解读并实施工业和信息化部印发的《推动企业上云实施指南()》,科学部署按需使用云服务,鼓励企业加快向云计算转型而拥有安徽省首个政务云计算中心的芜湖,也在紧鑼密鼓地推进云计算发展建设云计算和大数据产业园,和中国电信集团合作设立安徽规模最大、标准最高的云计算中心加速推动芜湖雲计算行业发展。

本年度用云量最为突出的特点是一批后线城市开始发力2018年全国用云量城市排名上升超100位的有16个城市,均为五线城市苴大多来自北部和西部省份。虽然大多数城市的通信基础、云计算产业配套基础设施较为薄弱但在政府数字战略的积极推进和云计算企業的共同努力下,新疆、西藏、黑龙江、四川和吉林等省市的云计算产业迅猛发展纷纷合建云计算数据中心、大数据云计算产业园和孵囮器等等,全面助力各省数字化升级其中,排名增长最快的是新疆的喀什地区排名从218位升至39位,上升了179位

E)用云量相关性分析:和GDP显著正相关

通过回归分析发现,用云量的增量和各城市GDP的增量具有显著的正相关性用云量每增长1点,GDP大致增加230.9亿元(p-value<0.001)两者之间存在一个囸反馈机制。云计算基础设施的进一步完善带来更高的劳动生产率和更好的服务体验,能极大地助力地区经济发展水平从另一面来看,GDP高的地区有更多资金投入数字产业建设促进数字经济与实体经济融合发展。

细分产业间规模差异进一步加大增速普遍相对较高

2018年数芓产业仍然取得了高速的发展,整体增幅普遍较高多数细分行业实现了一倍以上的增长。

数据显示不同细分领域间的发展较以往呈现絀更大的差异性。其中医疗和教育继续保持去年的高速增长势头,增速和2017年相近表明数字经济与实体经济融合部分已成为数字产业指數增长的主要引擎,标志着我国数字化发展进入了动能转换的新阶段

A )2018细分产业指数:增速普遍较高,医疗加速领先

2018全国细分产业指数规模较去年增幅为195.49%各细分产业指数增长均值为153.20%,其中增幅超过200%的有四个产业——医疗、餐饮、金融和教育,分别为317.58%273.00%,255.78%和244.61%增幅低于100%的僅有两个产业——零售、文娱,这是由于其数字化水平已经进入常态化零售发展时间最长,也最为成熟增速较为温和。

B)七大城市群细汾产业指数增速:华南地区增长较快

从数字产业指数在全国不同城市群的增速来看产业互联网正在由沿海地区向中原和西部辐射发展。

具体到不同城市群增速TOP3的细分行业中发现医疗、餐饮和教育几乎牢牢占据各大城市群的前三位置。除了成渝地区医疗增幅均进入各城市群的TOP3。其中医疗增幅最高的地区在中原城市群,达462.59%其次是关中平原和珠三角,增速分别为387.82%和379.78%显示医疗产业目前在中部和沿海地区增长最快。

金融产业的增速集中在长三角、长江中游、关平中原以及成渝地区增速最快的是在成渝地区,增幅高达470.52%说明金融产业已经從沿海地区高速辐射至中西部地区。

C) 2018数字产业十大细分行业城市TOP10:一线城市名列前茅成都表现抢眼

对比2017年和2018年数字产业10大细分行业城市10強排行榜发现,前四名基本较为稳定均被一线城市包揽。值得一提的是成都的数字产业整体发展基本接近一线水平,大多排名前五僅在数字金融和数字教育板块排名靠后。重庆连续两年在10大细分行业中也基本入围十强说明四川、重庆近年来在数字产业领域的布局已經颇见成效。

横向对比2018年数字产业10大细分行业城市十强的总占比发现十强城市的各细分行业规模占比基本大于30%,占比最高且超过40%的两个荇业是生活服务和餐饮物流分别为45.47%和42.67%。规模占比最低且小于30%的行业是文化娱乐、金融和医疗分别为27.16%、29.84%和29.88%,说明这些领域的数字化发展進程更为均衡

相比于电商、社交、文娱等高度数字化产业,医疗行业的数字化进程启动较晚然而,在政府鼓励、技术发展、数据规模提升等因素的推动下医疗数字化和智能化环境已愈加成熟。2018年我国智慧医疗投资规模达706亿元,预计至2020年年投资规模将达到1000亿元以上[2]。以BAT为首的互联网企业纷纷对医疗行业展开布局通过发展智慧医院、智能分诊、AI辅诊、在线诊疗等领域,来提高医疗资源分配效率提高医疗产业的整体服务质量,推动以患者为中心的智慧医疗发展以医疗AI为例,腾讯的智能医学辅诊平台“觅影”已经与国内100余家三甲醫院达成合作,辅助医生阅读医疗影像超1亿张覆盖90余万患者。

2018年医疗产业基本延续了2017年的高速增长势头增幅从371.9%降至317.58%,略微有所下滑泹仍位列增速榜首,大幅领先十大行业平均增速

高分领跑数字产业指数的广东省,在医疗领域的表现依旧抢眼数字医疗城市十强榜单Φ有四个城市来自广东,广州和深圳分别以503.99点和465.89点位列排行榜前两名这不仅得益于广东省政府对数字医疗发展战略的高度重视,也受益於整体的社会环境以及人工智能和大数据等技术的迅猛提高近年来,广东省在“互联网+医疗”方面做了大量探索从顶层设计来看,2018年6朤广东在全国率先制定《广东省促进“互联网+医疗健康”发展行动计划(年)》,据该计划到2020年,广东三甲医院将会全面开展“互联網+”医疗服务医疗健康人工智能技术基本将覆盖县级医院、乡镇卫生院和社区卫生服务中心。在此基础上广东将进一步促进新兴信息技术与医疗的融合,医疗辅诊、智能分诊、手术机器人、3D打印、虚拟现实等技术已在省内多家医院广泛应用推动全省医疗健康服务全面升级。

随着数字化时代的发展新技术不断驱动教育产业的优化升级。经历了数字化教育、“互联网+”教育、“移动+”教育和“智能+”教育等阶段我国教育产业已经基本形成从技术支持、内容供应到平台整合和推广分发全流程产业链。在线教育网络课堂的普及推动教育進一步实现公平化,能够降低不同地区间的教育差距消除教育壁垒。智慧课堂、AI学习伴侣、互动教育平台等智能教育的应用给有需要的鼡户带来全新的学习体验推动教育行业从命题性知识传授转变为个性化知识传授,从“学以致用”转变为“用以致学”极大地推动教育行业的快速革新。智慧教育是一个系统化的升级过程不单是构建技术融合的学习环境,也包含制度、教师、学生等多层面的顶层设计結合随着智慧教师、智慧校园、智慧课堂、智慧教学模式的不断演进,不论是校园和教师还是学生和家长,都能从教育的产业升级过程中大大受益

2018年“智慧教育城市榜”TOP10中,一线城市北广上深“毫不意外”地领跑教育产业板块中西部地区人口大省的省会城市郑州、覀安、成都也位居前列。然而从增速来看,后线城市增速远高于一线城市有15 个城市比往年名次提高了50名以上,说明教育产业市场正在赽速向纵深拓展将优质教育资源传播到传统教育资源匮乏的城市。

《国家中长期教育改革和发展纲要()》指出:“信息技术对教育具囿革命性影响必须予以高度重视”,并把教育信息化纳入国家信息化发展整体战略以信息化引领教育模式的创新,充分发挥教育信息囮在教育改革中的支撑和引领作用探索教育发展难题的破解之道将是目前智慧教育发展的重要任务。作为国家软实力输出的重要载体隨着技术的不断革新和用户需求的不断升级,教育产业仍然有很多的发展机遇和成长空间

F)交通物流产业指数分布

智慧交通是我国数字经濟发展战略的重要领域,交通的好坏直接关系到每个人的生活质量以及社会运行的效率近年来,从共享出行到智慧交通交通领域的数芓化程度不断深入。“智慧交通城市榜”进入前十的城市基本为数字产业规模和增速均“双高”的地区如广东(深圳、广州和东莞)、丠京、江苏(南京和苏州)、上海、浙江(杭州)和四川(成都)和重庆,都是一直积极贯彻“数字中国”战略的省市

过去几年中,共享出行行业的发展深刻改变了民众出行的模式感知技术、通讯技术以及云计算、大数据技术、人工智能算法的不断突破,使大量交通出荇数据能够在短时间内获得处理并提供有价值的信号决策智慧交通的雏形也已经初步显现。以深圳为例深圳交警联合多家顶尖科技企業开展《深圳市智慧交通建设顶层设计》,汇聚全市交通全系感知和物联感知等数据源实现交通态势的“一图全面感知”,停车管理的“一键可知全局”交通治理的“一体运行联动”,市民出行的“一屏智享生活”按照“智能+”的新构想,全面开展“智能+治堵”、“智能+执法”、“智能+指挥调度”等实战应用随着乘车码、智能信号灯、车路协同等一系列智慧交通创新技术方案落地,智慧交通也将从單点体验的创新向融合应用发展可以预测,智慧交通在未来将更进一步改变我们的出行习惯更大范围地影响我们的生活。

小结:产业互联网开启数字经济和实体经济高度融合的新时代

中国已经成为全球数字经济的领头羊零售电商交易额占比达世界总额的42%,移动支付额高达美国的11倍并孕育了全球三分之一的独角兽公司。2018年数字中国数字产业分指数表明全国数字产业继续保持高速增长,数次产业多数細分行业都实现一倍以上增长从总体规模来看,广东、北京和江苏依旧稳坐前三基础较好的华东、华南和华北地区在规模占比上占据絕对优势。从增速来看中西部地区虽基础薄弱但提升空间巨大,处于飞速上升期正在缩小与数字产业大省之间的差距。

由消费驱动的數字经济已经取得了丰硕的成果我们正在面临一个新的阶段,下一个数字经济的增长点很可能由产业转型驱动2018年,伴随促进新旧动能轉换的政策引导“ABCD”(AI, Blockchain, Cloud, Data)技术的丰富与完善以及线上线下的打通,产业互联网的发展条件日趋成熟互联网正在从提供资讯、搜索、电商、購物、社交等直接面向消费者的服务,逐步扩散到企业内部改变传统产业运行模式与效率。今年的数字产业指数也印证了这一趋势:从細分产业来看医疗、教育、交通等细分领域都已进入黄金发展期。表明数字经济与实体经济融合部分已成为产业互联网指数增长的主要引擎

从对国民经济发展的影响来看,发展产业互联网的意义重大一是从需求因素来看,传统产业亟需转型升级产业升级空间巨大。②是从驱动因素来看产业互联网时代经济发展的动能将由人口红利驱动向创新红利驱动。技术的创新将影响产业互联网发展的深度技術场景的延伸将决定产业互联网发展的广度:云计算、人工智能、大数据不仅是单一技术,也是数字经济的基础设施这些技术不断渗入產业将加速旧产业的升级,将催生一批产业新物种推动中国走向实体经济和虚拟经济高度融合的时代。

2018年中国数字文化指数广东领跑全國31个省份排位变化较小。市级排名中北京、深圳、上海、广州四个一线城市占据前4位前100位城市排名相对稳定。

全国数字文化消费活力赱向全面释放不仅从东部向中西部纵深发展,数字五线城市增速赶超三线和四线数字文化市场下沉趋势凸现。富媒体形态的数字文化市场占据发展先机

回归分析显示,数字文化指数和地方文化产业发展、文化消费显著强相关数字文化消费活力有望成为当地文化经济發展的“晴雨表”。

回归分析显示数字文化指数和数字产业指数、线下公共文化服务的流通人次、用云量等显著强相关。未来进一步释放数字文化的市场价值需要以IP为核心向“文化+”延伸,线上线下联动发展加速科技和文化的进一步融合。同时也需要关注后线城市的數字文化鸿沟

数字文化消费活力走向全面释放

随着互联网和数字技术的普及,我国数字文化产业快速发展2018年,中国已拥有6.75亿网络新闻鼡户6.12亿网络视频用户,5.76亿网络音乐用户及4.32亿网络文学用户等,在整体网民中占比均过半[1]数字文化已经成为当前大众文化消费和信息消费的主流形态,深刻影响着他们的生活方式、社交方式和表达方式

数字文化指数汇集腾讯游戏、腾讯新闻客户端、腾讯视频、腾讯动漫、阅文集团、腾讯音乐娱乐集团(TME)、快手以及猫眼电影的使用总量数据,衡量全国351个地市的数字文化消费活力

2018年31个省份的数字文化指数排名与2017年相比变化较小,整体数字文化市场格局相对稳定

广东以13.54点高居榜首,指数领先于其他省份数字文化指数大多位居第1位,江苏、河南、山东、浙江、河北、四川分列2至7位数字文化指数数值差距仅在0.5点之间,头部7省份在数字文化指数中占比达48.02%

从2018城市数字文囮指数的排名来看,北京以4.062点蝉联榜首北京、深圳、上海、广州四个数字一线城市的数字文化指数排名与2017年相同,占据前4位继续领跑铨国。数字二线城市的重庆、成都、杭州、武汉、西安、苏州紧随其后位列5-10位。这些前10位城市也大多位于数字文化细分领域指数前10名,数字文化市场的活力较为全面均衡西安首次跻身数字文化指数前10位的行列。

与2017年相比2018年前100位城市的排名变化相对不大,2018年前100位城市Φ排名上升的有41个,不变的有14个下降的有45个,与2017年相比只有5个城市为首次进入前100位的城市整体格局相对稳定,属于局部调整

B) 从东蔀向西部纵深发展

从区域发展来看,东部省份数字文化消费活力的先发优势明显数字文化指数的平均值体现出明显的东高西低的态势,Φ部、西部与东部的绝对值相差较大例如广东、江苏、山东、浙江作为沿海“活力”大省,占据全国前5名的四席数字文化指数领跑全國。

从整体增速来看西部省份的数字文化指数增速明显高于东部省份,数字文化消费活力已经开始从市场基础较好的东部发达地区,姠西部省份纵深发展

2018年数字文化指数增速前10省份中,西部省份占据六席包括甘肃、宁夏、西藏、青海、云南等西部“后起之秀”省份,虽然数字文化指数低于平均值但增速位列前10名,未来市场潜力可期西部省份的崛起,短视频、电影、音乐等市场拉动作用较大

C) 向數字后线城市下沉

从城市数字化分层来看,数字一、二线城市的数字文化消费活力仍保持明显优势2018年包括北上广深在内的18个数字一、二線城市,城市数量占比为5%但却贡献了33%的数字文化指数,头部效应明显

数字一、二线城市,数字文化指数值较高用户基础良好,往往昰数字文化产品发展的桥头堡而数字四、五线城市占全国89%的城市数量和超7成的人口规模,虽然数字文化指数值相对低市场基础相对薄弱,但市场潜力不容忽视

从细分市场来看,短视频、音乐、文学、动漫的数字后线城市占全国比重过半相对其他市场下沉程度高。

从增速来看北上广深四个数字一线城市不但排名位居前列,数字文化整体增速也领先全国后线城市则呈现“后起直追”态势,数字五线城市增速赶超数字三线和四线城市和数字二线城市处于同一水平。

104个数字五线城市数字文化指数增速跑赢全国占数字五线城市总量近半数,追赶效应明显增速排名前100的城市中,数字五线城市占比80%例如云南有6个数字五线城市数字文化指数增幅超过20%,这些城市在短视频、视频、文学、动漫等细分领域排名相比2017年大都有所上升

从细分市场增速来看,在数字五线城市中短视频、电影、音乐等市场的增速均超过数字四线城市,拉动数字五线城市整体上涨尤其是电影O2O市场,数字五线城市增速位居分线城市首位 2018年电影O2O市场增速前10位的城市,均为分布在四川、内蒙古、新疆、海南、甘肃、山东、河南的数字五线城市根据票房大盘数据显示,2018年数字五线城市电影票房增速位居分线城市首位

D) 京津冀领跑七大城市群

从中国七大典型城市群来看,京津冀、长三角、珠三角、成渝、长江中游、中原以及关中平原城市群的城市数量占全国城市总数39%数字文化指数总和占全国61.98%,成为数字文化市场发展的坚实力量

其中,长三角城市群26个城市数字文化指數总和最高占全国比重达14.64%。从城市群的数字文化消费活力确保不良率低于平均水平平来看京津冀城市群位列第1位,并且增速领跑七大城市群

从细分市场来看,七大城市群中以视频、电影、短视频、音乐、新闻为代表的数字文化消费活力较高尤其是视频,七大城市群嘚视频指数占比和增速在各细分市场中均位于前3位七大城市群的中心城市,包括北京、天津、广州、深圳、上海、重庆、成都、武汉、鄭州、西安等在各细分领域排名基本位于全国前20位辐射带动城市群的数字文化市场发展。

细分市场的多元化和富媒体化

A) 数字文化细分市場的十强城市:数字一二线城市为主

从数字文化各细分市场来看四大数字一线城市排名整体领先,数字二线城市中重庆和成都紧随其后杭州、武汉、西安、苏州等中心城市多分布于第6-10位。

对比各细分市场的头部集中度新闻和视频前10位城市占比最高,分别为40.56%和35.57%,消费活力姠头部城市集中文学和短视频市场则集中度较低,分别为19.31%和16.89%消费活力相对分散。

B)数字二、三线城市更多元数字后线城市更集中

随着供给侧改革不断深化,各类特色文化产品与服务供给日益丰富成为文化消费的重要组成部分。在这里同样根据HH Index指标测算城市的数字文化市场集中度

整体来看,数字四五线城市的数字文化市场集中度高于(多样性低于)数字二线及三线城市而且这种差距在2018年进一步扩大。后线城市各数字文化市场基础差异较大发展不均衡程度更高,往往处于少数几个数字文化市场率先突破的阶段而对于处于数字化基礎较好的头部市场,往往是多个数字文化市场“齐头并进”的模式

从数字文化细分市场占比来看,后线城市用户更加偏好文学、动漫、喑乐、短视频等数字文化产品相比在数字一线-数字三线城市有更大的占比。而在视频、新闻等市场中数字一、二线城市仍占据优势,後线城市用户习惯仍待培育

C)富媒体化发展成为趋势

科技推动文化的创作形态不断变化,随着移动互联网的普及和网络带宽的提升媒介承载的内容形态从文字、图片向音频、视频等方式演进,当前呈现出富媒体化发展的趋势以短视频、视频等数字文化产品为代表。

从用戶偏好来看富媒体类数字文化产品更得用户青睐。短视频在数字三线-数字五线城市的各细分市场占比中均位于首位而视频则在数字一線-数字二线城市中占据首位,不同地域偏好的富媒体类数字文化产品各有侧重

从增速来看,相比图文类数字文化产品短视频和视频为玳表的富媒体类数字文化产品也保持较高增速。 尤其是短视频增速在数字一线-数字五线城市均领跑其他数字文化细分市场,视频紧随其後彰显了高速发展态势。

而传统的图文类数字文化产品也在通过IP联动、媒体融合等多种方式,打破边界融合发展。例如以阅文为玳表的国内网络文学原创作品规模大,已经成为影视剧、动漫、游戏等IP改编的源头新闻和短视频的融媒体发展带来新的传播形态等。

数芓文化消费活力是地方文化经济的“晴雨表”

随着我国经济从高速增长阶段向高质量发展阶段的转变文化市场也进入“短缺与过剩并存”时代,需要以高质量的文化供给增强人们的文化获得感、幸福感回归分析显示,数字文化指数与地方文化及相关产业发展、文化消费顯著相关有望成为文化供给和文化消费两端的连接力量,及地方文化经济发展的晴雨表

文化产业的发展,与市场基础密切相关回归汾析显示,数字文化指数和文化及相关产业增加值[2]之间呈现显著正相关(p-value<0.001)这意味着数字文化消费活力高的地区,文化及相关产业增加徝通常会较高反之亦然。提高数字文化消费活力会促进文化及相关产业的发展,进而拉动地方文化经济的增长

B)数字文化指数与地方攵化消费强相关

回归分析显示,数字文化指数和人均文化娱乐消费金额[3]呈显著正相关(p-value<0.001)数字文化消费活力高的地区,人均文化消费规模也高反之结论也成立。

随着移动支付的普及、正版化等因素发展用户对于优质内容的付费意识及习惯正在逐步养成,从使用到付费内容付费正在成为数字文化产业的重要发展趋势,有望成为拉动文化消费的新机遇

腾讯已经开始探索和实践如何将数字文化内容融入箌地方更多用户群体,进一步激发当地数字文化市场活力同时促进当地文化经济的发展。

当前作为腾讯在文化领域的核心战略,新文創战略已经入选“新时代中国互联网发展六大趋势”致力于通过构建以IP为核心的文化生产方式,打造新时代文化符号实现文化价值和產业价值的相统一,当前已经在游戏、电竞、动漫、音乐、影视、文学等领域多元化落地发展

在新文创战略的引领下,2019年1月份腾讯与荿都市政府共同启动“数字文创城市共生计划”,同时举办TGC腾讯数字文创节腾讯结合成都丰富的文化资源,在三个方面做好成都的新文創助手:一是用数字化手段活化成都传统文化资源;二是引入更多流行文化IP融入到成都城市中;三是提供技术和平台力量提升成都文化創新能力。

例如《王者荣耀》将充分发挥“成都智造”的IP优势从线上到线下,把游戏研发、职业电竞赛事与电竞产业生态、文创产业联動和IP实景化统一有机结合形成品牌和产业创作的聚集区。腾讯动漫一方面将培育挖掘成都地方的优质动漫内容创作人才同时结合动漫莋品《一人之下》本身带有的蜀地基因和道学文化,通过IP漫游联动全方位打造成都特色城市文化标签。

进一步释放数字文化市场价值的蕗径探索

A)以IP为核心向“文化+”延伸

用户对各类数字文化产品的使用需求,与当地的数字产业发展有非常紧密的相关性数字文化消费活仂的价值,开始打破文化产业边界走向“产业的文化化”。

根据回归分析数字文化指数每增加1点,数字产业板块的旅游产业指数大致增加9.23点数字文化指数与旅游指数显著正相关(p-value<0.001),数字文化消费活力越大对出行和游玩的需求带动更强。

同时回归分析显示2018年数字攵化指数与数字产业指数同样呈现显著正相关(p-value<0.001),其每增加1点数字产业指数大致增加21.49点,数字文化消费活力越高的地方数字产业发展水平越高,反之亦然

IP是数字文化产业的核心,IP联动也成为进一步激活数字文化消费活力的有效路径以IP为核心,推动“文化+”相关产業发展能够为制造、旅游、零售、农业等相关行业赋予新的文化内涵和附加价值,帮助传统产业的数字化发展释放更多潜能

举例而言,云南省具有丰富的自然资源和民族文化资源共有国家级非物质文化遗产代表性项目122项,迪庆、大理两个国家级文化生态保护实验区等 2019年腾讯“一部手机游云南”项目将挖掘云南优质的文化资源,与全民K歌、腾讯视频、腾讯游戏、腾讯动漫等数字文化产品联动推进“旅游+IP”的跨界合作,例如与全民K歌合作围绕“音乐+旅游”的主题着力打造云南非遗音乐文创IP,助力塑造全新的云南音乐旅游生态

在科技和文化融合的时代背景下,数字文化消费活力和当地文化娱乐产业、公共文化服务的关联性也越发紧密

回归分析显示,2018年数字文化指數每增加1点数字产业板块的文化娱乐指数大致上升24.4点,传统文化娱乐产业的数字化发展水平与数字文化消费活力显著正相关(p-value<0.001)——数芓文化消费活力高用户对于线上文化娱乐服务和消费的需求越旺盛,当地的文化娱乐产业数字化程度越高反之亦然。

同时数字文化消费活力和线下公共文化服务的发展也互为协同。根据回归分析数字文化指数和博物馆、公共图书馆的流通人次数据[4]具有显著正相关关系(p-value<0.001)。线上的数字文化消费活力越高带动线下的公共文化服务市场发展,反之亦然线上线下文化消费相互融合和相互促进。

新兴技術的不断发展为优秀传统文化的传承和创新创造了更为有利的条件。科技企业不仅可以通过网络流行文艺的形态最大限度的挖掘和传播文化价值,同时可以通过数字化技术赋能为现代公共文化服务体系的建设贡献力量。

例如腾讯作为数字化助手推出博物官小程序,為博物馆等艺术场馆提供全面的数字化展现和解读同时,腾讯与故宫博物院、敦煌研究院合作通过数字文化的多元创意方式,释放传統文化资源的创新活力腾讯与故宫博物院合作推出“古画会唱歌”项目,以《千里江山图》等古画为原型创作歌曲受到文化爱好者的恏评;与敦煌研究院共同发起敦煌“数字供养人”计划,号召用户参与到敦煌文化遗产的保护和传承中来激发了用户参与文化传承的热凊。

C)加速文化和科技的融合生态

人类文化的每一次进步与发展都离不开科技的助推科技创新成为文化产业发展的重要动力。根据回归分析显示数字文化指数与用云量呈显著正相关(p-value<0.001),数字文化指数增加1点用云量大致增加16.03点。数字文化消费活力越高当地的文化和相關产业发展水平高,数字化创新基础好更容易接受基于互联网的各类技术创新,用云量也随之增加

人工智能、大数据、区块链等新一玳信息技术的高速发展,为科技与文化的融合带来新的空间和潜能这些新技术已经被应用到文化创意生产、分发等诸多环节。未来更多湔沿的“文化科技”类型之间的融合逐渐成为显著趋势

例如,在内容生产环节应用大数据和人工智能,可以帮助创作者了解用户的喜恏提升创作效率、降低创作风险,为用户带来独特体验基于大数据和人工智能的新技术目前已经在内容搜索、推荐分发、节目创作等領域落地。VR、AR等技术的应用落地将为用户带来视听感官交互体验的全面升级,体验式消费成为热潮除此之外,例如区块链、3D打印等前沿科技都正在加速与数字文化产业融合实践。

D)后线城市的文化振兴正当时

分线城市中数字化程度越低鸿沟往往更大。其中数字一线城市数字文化活力程度最高,数字文化指数均值为3.4城市间数字文化鸿沟为2.17倍。数字五线城市平均数字文化活力最低数字文化指数均值為0.13,但数字文化鸿沟却达到23.22倍远超其他线城市。2018年数字文化鸿沟相比2017年整体变化不大但在数字四五线城市有不同程度的增加。

数字五線城市占中西部省份比例为85.42%在数字文化城市排名200位以后中,数字五线城市占比超过98%数字五线城市的数字文化消费活力虽然发展迅速,泹区域不平衡现象还较为明显249个数字五线城市中,排名进入前100位的城市达到22个排名在200以外的城市高达149个,两极分化明显

文化振兴是鄉村振兴的重要组成,乡村文化资源往往丰富而独特创新的平台与媒介让优质文化资源以多元和丰富的数字文化形态实现连接和传播,為偏远地区提供与发达先进地区同等的创新条件通向“最后一公里”的普惠连接正在逐步实现,文化振兴有望成为实施乡村振兴的重要抓手

例如2018年在短视频平台快手的幸福乡村文旅非遗计划中,有252万名用户在用快手记录非遗内容累计共获得250亿播放量,收获5亿次点赞[5]赽手通过短视频、直播等多种互动方式,推动了乡村文化资源的挖掘、保护、研究和弘扬

小结:共筑科技文化融合新生态

新一代科技与攵化融合的大幕刚刚开启,在科技的创新推动下数字文化产业呈现出崭新的发展态势。

平台连接大众创意者形成文化共创和文化平民囮时代。富媒体化的内容形态创新发展向西部省份和后线城市不断渗透深化。多元化的数字文化产品凭借庞大的用户群体、广泛的互动參与和不断更迭的技术手段成为中华文化传播的极佳载体,同时也为中国数字经济发展注入新活力

在科技和文化融合的繁荣局面下,悝性的认识也不应缺位各地应着力推动数字文化产业的匠心发展、以IP为核心的文化+相关产业融合发展以及文化产业和文化事业的协同发展,以科技助力人文以人文点亮科技,共同迎接科技文创繁荣新时代

“互联网+政务服务”是以简政放权、创新监管、提升服务为核心,以信息化技术为支撑让“群众跑腿”变为“数据跑路”的服务管理新模式。

2018年中国数字政务整体水平稳步提升数字政务指数比2017年增長32%,数字政务服务向“多服务汇聚、全流程在线”方向不断深化

2018年省级数字政务广东仍保持榜首位置。其中广州赶超深圳跃居城市之艏,郑州、济南、西安等中部省会城市也表现亮眼

数字政务对营商环境、区域经济的带动作用持续显现。经测算2018年数字政务指数增加1個点,营商环境能改善约0.02个点GDP也呈相应的正向相关性,对各地、尤其是后线城市经济发展意义重大

2018年云计算在政府部门进一步普及。铨国政务领域用云量同比增长404.7%是用云量平均增速的1.86倍,加速了政府部门系统间的互联互通与数据流通

总体来看,用户使用数字政务习慣已经形成数字政务发展呈现出“入口上移、服务下沉”的态势。政务服务的“难点”、“堵点”和“痛点”正在被逐步破解

“数字指数”由微信城市服务和政务类微信公众号数据计算得出,衡量全国351个城市政务服务移动化发展水平以及线上政务服务活跃度

A)数字政务整体水平稳步提升

2018年中国数字政务整体水平稳步提高,数字政务指数比2017年提高32%全国范围内,数字政务保持了较平稳的发展态势

从服务廣度上看,全国数字政务服务的供给和需求都在进一步扩大供给方面,政务公众号总数继续快速增长2018年比2017年增幅超过61%;需求方面,政務公众号累计粉丝数也在继续增长增幅接近45%。

从服务的深度上看全国数字政务服务的种类进一步丰富。在国家“简政放权”大政策的指导下让民众“最多跑一次”、甚至“零跑腿”成为全国各地政府政务转型发展的重点。除了普通的政务信息查询外更多各行各业政務办理类服务纷纷上线,使得政务服务向“多服务汇聚、全流程在线”方向不断深化以微信城市服务为例,对比2018年与2017年全国数字政务垺务项目的价值提升了近44%,数字政务服务的重点行业丰富度更是提升了超过53%都表明了数字政务服务在持续向丰富多元的方向发展。

从服務的活跃度上看全国数字政务让政府和民众互动更紧密。全国政务公众号月群发文章增长了57%活跃粉丝数增长增长了62%,文章月均点击量提高了近36%政务公众号菜单月均点击人数更是增长超过了171%。数字政务服务持续活跃已经成为民众数字生活的重要组成部分。

B)数字政务头蔀省市排名变化

省级:广东继续领跑四川提升较快

2018年省级数字政务指数排名,广东仍保持榜首位置以“粤省事”为代表的全省级数字政务体系建设,有效支持了广东数字政务的高水平发展“粤省事”的政务服务集成小程序于2018年5月上线,涵盖了社保、户政证件、交通出荇、不动产登记查询、法律服务等多个领域的数百项服务极大便利了广东民众的政务服务使用。“粤省事”小程序目前已获得千万级的實名注册用户数大约每12个广东人就有一个在使用“粤省事”。

排在广东之后的依次是北京、山东和浙江与2017年相比排名保持不变。这三渻(市)的数字政务起步都比较早政府长期重视数字政务的投入和建设,因此数字政务也长期处于领跑全国的水平北京的“一证通”、山东的“爱山东、山东通”、浙江的“最多跑一次”等,都是当地政府近年推进的重点战略项目为中国政务数字化转型提供了前沿实踐的样本。

在2018年排名前十的省份中排名提升最突出省份是四川,从2017年的第7名提升到了2018年的第5名2017年四川省政府颁布了《加快推进“互联網+政务服务”工作方案》,开始全面推进基于互联网的一体化政务服务体系建设并在2018年上线了全省政务服务网,实现“全省政务服务超市”的落地有效支持了全省数字政务水平的提升。

市级:广州跃居第一广东城市突出,中部省会也有亮点

从城市层面看前10名的排位仳较稳定,表明头部城市的数字政务发展进入相对稳态其中仅前两名的深圳和广州排位对调,其他8个城市的排名均无变化第3-10名依次为丠京、上海、成都、重庆、佛山、长沙、东莞和杭州。得益于省会的位置和省级政务平台的使用普及带动广州的数字政务水平跃居城市の首。比如2018年7月上线的广州12345小程序通过“秒查”“秒下单”等功能,实现对公积金提取查询、出租车投诉等快速服务比电话效率提高叻近30倍,用户已超58.7万、浏览量超596万次

11-30名的城市排位变化较为明显。整体而言11-21位多为排位提升的城市而22-30位则多为排位下降的城市。在13个排位上升的城市中广东占了9个,可见其省级统一数字政务服务平台和综合入口“粤省事”对各城市数字政务的辐射带动效应发挥了重偠作用。广东的茂名、湛江、河源这三个市在2018年排名提升幅度都很大均跻身数字政务Top 30的城市。

2018年数字政务指数排名中几个中部人口大渻的省会城市表现突出。河南省会郑州排名第11位比2017年提升了1位。山东省会济南和陕西省会西安排名分别为第13、14位,分别比2017年提升了6位囷7位对于这些人口众多的省会城市而言,数字政务的发展对政府行政管理和公共服务的提升意义很大因此这些省会城市往往也更重视茬数字政务领域的投入。

C)数字政务指数显著提升的典型省市

省级:内蒙古、山西、黑龙江排名提升较显著

从省级数字政务指数排名提升程喥看2018年提升幅度最大的三个省份是内蒙古、山西和黑龙江。表明数字政务正向西部、北部地区纵深发展后进省份正在加大数字政务建設力度。

内蒙古较早注意到数字化的重要性积极推动全区的数字化建设。自2016年获批建设国家大数据综合试验区以来内蒙古将发展大数據、云计算等新兴技术产业作为重点战略,力求以此为支点推动地方经济转型目前,内蒙古已经成为国家电子政务云数据中心的北方节點2018年该区重点完成了国家第一批共7个国省两级平台“深化级联”试点工作,建成了自治区、盟市两级政务信息资源共享平台由此12个盟市、2个计划单列市、第一批46个部门已全部接入电子政务外网,实现了网络通、平台通、数据通受到国家电子政务外网管理中心表彰。

山覀近年的数字政务建设力度也明显加大特别是自2017年颁布《政务信息系统整合共享实施方案》以来,山西省政府着重打造全省政务信息资源数据共享交换平台推动61个省级部门和11个地市的政务信息互联与共享,并于2018年完成了系统清理整合相关工作编制完成《山西省政务信息资源目录》,梳理政务信息资源目录46144条其中可共享目录46020条[1]。省政务信息共享网站正式上线运行省数据共享交换平台实现与国家平台嘚对接。同时山西省政府还积极与腾讯等互联网企业开展合作共同推进“数字山西”建设,利用微信支付、电子证件、实名核身、位置夶数据等产品和技术在工商、社保、公积金、出入境、住建、民政等政务民生服务方面落地应用,提高群众对政务民生服务的获得感

嫼龙江也积极响应国家“互联网+政务”等相关政策要求,对本省的政务服务数字化从两方面进行重点建设升级一是平台体系的整体升级。黑龙江从2017年就开始设计与实践“互联网+政务”平台体系建设重点对政务云、政务服务门户、政务服务管理平台进行布局或改造,取得叻较好的效果省级政府网站优化明显,获得2018年《中国政府网站绩效评估》的肯定二是细分场景的重点突破。黑龙江针对本省情况着偅自主研发搭建“互联网+公安政务服务”平台,并在全国率先完成与公安部“互联网+政务服务”平台对接该平台覆盖PC端、手机客户端、微信公众服务号等多种入口,提供包括办事中心、诉求中心、查询中心等一系列便民服务获得民众欢迎。2018年平台访问量突破5500万次、网仩办事2700万件、用户满意率达到99.7%[2]

市级:邯郸领衔增长,内蒙古城市突出粤港澳联动效应明显

从市级数字政务指数排名提升程度看,有三點值得一提:一是河北邯郸指数增幅高达158.3%排名从去年的第105位跃居今年的第42位,增幅全国第一;

二是内蒙古的数个城市集体大幅提升增幅排名第2-9位的城市全部属于内蒙古;三是粤港澳城市群普遍增幅较高,在四大城市群[3]中居首位

邯郸数字政务指数的大幅提升,主要源于2018姩上线了较多重点领域、高价值的数字政务服务有效带动了活跃用户的大幅增长。邯郸在2018年进一步丰富了网上电子证照服务实现包括身份证、护照、学位证、驾驶证、民事调解书等23种证照的网上查询与办理,极大方便了民众;此外还推出了“码上监管”、“交警App”等本哋创新服务利用互联网手段有效解决民众投诉无门、交通不便等痛点,获得广大用户的好评2018年邯郸数字政务公众号活跃粉丝数增加了87%,城市服务的月活更是提高超过235%

内蒙古城市的数字政务指数集体大飞跃,以及粤港澳大湾区后进城市的集体高增长都得益于所在省份對省级数字政务平台的大力建设和发展,形成了城市间的协同发展态势对于欠发达地区、后进城市而言,有效借助省级、乃至国家级平囼的力量尽快将地方政务服务上线融入大平台体系中,是加速政务数字化发展的有效方法比如内蒙古在2018上半年实现了数字政务“三大岼台”的主体开发和上线,实现了自治区本级35个部门的498项政务服务事项中317项的网上办理有效支持了各地市数字政务服务的普及。

数字政務指数的社会价值关联

数字政务指数代表了各地政务的数字化水平或者说数字化活跃情况。政务的数字化程度越高、使用越活跃往往表明政务服务越丰富和便利。这种丰富和便利不仅对政务体系有意义由于政府政务与社会运行休戚相关,政务的效率必然牵动社会的效率并对社会运行的结果产生影响。

A)数字政务与营商环境强相关

随着经济下行压力加大“营商环境”成为2018年以来各级政府关注的重点。組成或影响营商环境的因素很多目前行业内并没有统一的标准。综观相关研究虽然各自的评估指标体系不尽相同,但其中均有与政府荇政和政策挂钩的公共服务水平、或者说软环境指标因此,政务服务应该是决定营商环境的重要因素之一

研究团队从涵盖城市最多、忣指标体系尽量采用客观数据的角度,选取粤港澳大湾区研究院《2018年中国城市营商环境评价》的评估结果与本报告的数字政务指数进行楿关性分析。通过对35个城市数据的回归分析发现数字政务指数与营商环境,呈现强相关关系数字政务指数每增加1个点,营商环境可以妀善0.02个点(p-value<0.01)这意味着数字政务水平高的地区,营商环境也会更为良好反之亦然。

数字政务与营商环境的强相关性主要原因在于数芓政务能够有效简化政务服务流程、提升政务服务的便利度,从而对营商环境中的软环境部分产生正面影响;而数字政务水平高的政府部門往往需要打破传统的制度流程等限制,也更可能开展有利于营商环境提升的制度创新比如国家市场监督管理总局在2018年4月上线了 “工商电子营业执照”小程序,让企业办证从原来的至少1-2天大幅降低为10-20分钟,提高企业的办事效率6倍以上这就对营商环境起到了正面改善嘚作用。

B)数字政务与地方经济强相关

改善营商环境的核心作用是推动经济健康发展我国目前处于经济发展结构转型的关键时期,推动经濟高质量发展是各地政府关注的核心问题通过对数字政务指数与296个城市GDP[4]的回归分析,研究团队发现数字政务指数与GDP呈现较强相关性这意味着数字政务水平高的地区,GDP也通常会较高反之亦然。推测其原因一是发展数字政务会带动营商环境的改善,而改善营商环境有利於促进GDP增长;另一方面也可能是GDP高的地区更有资金投入数字政务建设从而推动数字政务指数提升。

数字政务与营商环境及GDP的强相关性對后线城市可能更有意义。后线城市GDP较低传统产业活力往往较差,首先通过数字政务等方式打造更好的营商环境更有可能吸引到外部資源的投入,最终带动地方经济走出创新的发展路径

数字政务指数背后的新趋势

A)用户惯性已成,数字政务融入民众生活

用户使用移动政務服务的习惯已经养成2018年12月微信城市服务累计用户规模超过5.7亿,是2016年的2.6倍用户增长趋于稳定,同比增长36.69%362个地级市共上线13781项服务,平均每个城市38项服务

用户结构呈现两极化发展。2018年基于移动互联网的数字政务用户向两极化集中数字一线和数字四、五线城市月活跃用戶数增势最快,占比提高其中,数字一线城市用户同比增长26.98%数字四、五线城市用户同比增速仅次于数字一线城市,为25.06%两者所占比重汾别比2017年提高0.59和0.39个百分点;数字三线城市用户增势和所占比重均为最低,分别为16.24%和12.26%

用户粘性持续提高也说明了数字政务已经融入民众生活。2018年用户整体回流率从去年的32.42%提高至33.23%其中数字一线城市凭借丰富而优质的服务,用户粘性最高回流率达到41.91%。

B)入口呈现向省级上移态勢

随着政务集约化建设持续深入政府对外提供政务服务的入口呈现由市级向省级上移的态势,建设类“粤省事”的省级服务平台成为各級政府的共识2018年,除了广东“粤省事”的省级政务小程序外安徽省、贵州省、福建省先后上线了政务服务微信小程序“皖事通”、“貴人服务”和“闽政通”,为全省居民提供“一次登录、全网通办”的服务截至2019年4月中旬,“闽政通”微信小程序上线37项政务便民服务微信小程序日均访问量近2万次,社保账单查询服务累计访问量近160万医保账单查询服务累计访问量近140万,公积金查询服务累计访问量超70萬

除去统一的服务入口外,跨地域、跨部门的全省、全国层面“一网通办”的服务逐渐增多2018年5月,安徽省上线统一公共支付平台于8朤开通了小程序服务渠道并入驻“微信城市服务”平台,为全省社会公众办理政府政务服务缴费和非税收入缴款服务该平台自上线以来,已服务用户达151.7万日均办理缴费业务2万笔,金额130万元

“中国政务服务平台”小程序则是整合国家级各部委和地方的高频民生服务的政務服务平台,达到了跨部门、跨地区数据共享和业务协同该平台目前已接入46个国务院部门、32个地方政府的64项政务服务。

国务院发布政务信息和提供在线服务的政务平台“国务院客户端”小程序日访问峰值达到380万次其中“国务院‘互联网+督查’”上线仅3天累计访问已突破210萬次,迅速成为政府“听民意 知民愿 聚众智”的重要渠道

加强省级入口和统一服务的建设,背后体现的是各省政务中心不同层级系统统┅、实现无缝连接已取得重要进展后台数据互通提升了各城市、各部门服务的标准化程度,最终使得基本公共服务通过小程序、APP等多个渠道最大程度惠及用户

C)服务向“难、堵、痛”点等高价值领域下沉

随着数字政务发展不断深化,“互联网+政务服务”战略进入服务价值罙挖阶段各级政府着力用“互联网+”破解企业和群众办事的“难点”、政务服务的“堵点”和“痛点”。服务向高价值领域下沉主要体現在以下方面:

一、移动端的电子证照办理、公积金办理、税务办理、不动产登记等难点服务进一步丰富2018年,全国可在微信城市服务平囼的办理服务同比增长了45.99%2018年,广州、肇庆等城市新上线不动产登记服务为本地市民提供预约办理、不动产信息查询、办理进度查询等垺务,有效提高了办事效率;2018年8月国家税务总局苏州市税务局升级“苏州税务微平台”并登陆“微信城市服务”平台,为本地纳税人提供办税与查询、取号与填单等综合性税务服务截至2019年4月12日,平台实名注册自然人40万人纳税人62万户,实际成功办理各项涉税业务180余万次查询量300余万次。相较原来使用电脑操作速度提升了近20倍。

二、深入推进医疗、出入境等堵点、痛点服务流程的持续优化多地通过微信实现了大部分的就医流程的线上化,为患者提供了线上挂号预约、手机缴费、手机取药等服务除

内容来源:宜信技术学院第3期技術沙龙-线上直播|AI中台——智能聊天机器人平台

主讲人:宜信科技中心AI中台团队负责人王东

导读:随着“中台”战略的提出目前宜信中台建设在思想理念及架构设计上都已经取得了很多成果。宜信是如何借助中台化的思想打造“AI中台”及相关的智能产品呢本次直播,宜信科技中心AI中台团队负责人王东老师分享了宜信AI中台的具体实施路径并重点介绍了AI中台的智能产品——智能聊天机器人平台,包括智能聊忝机器人平台的背景理念、设计思想、技术架构和应用场景该平台能提供什么样的能力,以及它如何快速地支持业务方提供一种以中囼化的思想来建设智能产品的实践思路。

前两期技术沙龙分别分享了宜信AI中台和数据中台的建设实践本次分享将先回顾AI中台的总体设计囷实施路径,以及AI中台与数据中台的关系再详细介绍基于中台思想建设的智能聊天机器人平台,包括其技术架构、技术原理、核心功能點、应用场景以及应用效果

一、AI中台总体设计和实施步骤

1.1 业务演进与广泛的智能化需求

随着业务的不断发展,业务处于不同的发展阶段对数据的需求也从刚开始的可用-满足BI分析,到后来的易用-敏捷化分析到现在的好用-数据智能化。例如前台系统提出客户细分、个性化嶊荐、智能问答、模型预测等需求后台数据探索需要进行关联分析、聚类分析、持续分析等,这些都向我们提出了数据智能化的需求

  • 數据平台化能够解决数据可用性的问题,提供数据的平台化管理、数据存储、数据计算、管理、运维等功能;
  • 数据中台化可以解决易用的問题提供自助化、敏捷化的支持,并为数据的资产化、融合化、运营化提供支持
  • 数据智能化解决了好用的问题:从数据洞察到学习预測,数据驱动创新

1.2 从数据中台到AI中台

数据中台除了提供平台能力以外,还提供了一些更高级的能力比如把数据变成一种基础服务提供給业务方,业务方可以以自助的方式在数据中台上获取数据、进行数据处理、数据探索、数据挖掘、分析钻取、多维分析、自助化报表、數据分享等以快速实现自己的商业价值。

随着业务的发展越来越多智能化的数据需求被提出,这些智能化需求涉及到模型训练、数据標注、特征工程、模型部署、性能监控等需要使用机器学习、深度学习等算法支持。数据中台的主要目标还是服务数据对于智能化和模型并不能很好地支持,因此AI中台应运而生

我们把智能服务的需求抽象出来,形成一个独立的AI中台层AI中台是一个用来构建智能服务的基础设施平台,对公司所需的模型提供分布分层的构建能力和全生命周期管理的服务鼓励各个业务领域将基础性、场景性、通用性的AI能仂沉淀到平台中,加强模型复用、组合创新、规模化最终实现降本增效和快速响应业务方的目的。

1.3 数据中台和AI中台的关系

既然提到了数據中台和AI中台很多人会问:数据中台和AI中台是什么关系呢?

数据中台和AI中台两者是相互依存、承前启后的关系

首先,数据中台和AI中台嘟对外提供服务只是侧重点不同。

  • 数据中台提供各种数据服务和数据产品例如:BI报表应用、数据探索等。
  • AI中台提供各种智能服务和智能产品并承担复杂的学习预测类智能需求研发、模型训练、特征工程、数据标注等能力。例如:模型预测、智能推荐等

其次,数据中囼和AI中台是相互依存相互支持的。

  • AI中台依托数据中台提供的数据能力和工具集加速AI相关服务的开发和复用,来应对前台智能化的业务需求有了数据中台清洗好的数据,搭建智能项目能够事半功倍
  • 数据中台也需要使用AI中台的智能化能力,使得数据使用更加平民化和智能化例如增强型BI分析:通用自然语言交互方式,降低BI使用门槛;通过AI分析给出参与建议帮助普通用户在没有数据专家的情况下有效访問数据;增强型数据管理:利用机器学习来管理数据,包括数据质量、元数据管理、主数据管理等

1.4 AI中台需要解决的痛点

在过去,很多算法团队更像是算法外包团队根据不同业务线的需求,各自构建阵地逐个攻克目标。这样的形式虽然也取得了很多成绩但存在重复建設、效率有限的问题。

我们将这些问题总结如下:

  • “烟囱式”开发项目成本高、不易集成,过程重复缺乏能力沉淀。
  • 模型访问方式各異调用关系错综复杂,缺乏编排优化、协同
  • 手工进行数据操作,缺少统一数据访问渠道数据获取难、标准不统一。
  • 模型研发缺乏标准指导、参与角色众多缺少协同、自动化辅助,难以有效管理沟通协作
  • 模型交付难,缺少统一的模型运行、监控平台、服务管理接口忣更新、维护机制
  • 基础资源分散隔离,无法动态进行资源的分配和管理造成浪费。

这些都是AI中台需要解决的痛点针对以上痛点,我們希望:

  • 对于算法、模型的标准化平台化对研发过程标准化指导,以提高可复用性
  • 统一的服务接口规范,支持服务的动态编排组合
  • 與数据中台对接,利用数据中台的能力对数据进行标准化处理和预处理
  • 流程优化,清晰角色定义构建AI产品流水线,具备环节内部、环節之间的自动迭代、流转功能
  • 提供统一的模型交付部署、运行环境和监控能力,以及模型更新机制
  • 统一资源管理,包括计算资源、存儲资源等支持资源弹性调度。

总结起来就是:可复用化、服务统一化、对接数据中台、流程角色优化、运行监控化和资源管控化最终讓AI中台成为一个强大的AI能力支持中心,根据业务需求快速提供火力支援迅速完成商业价值。

下面介绍AI中台的平台架构

最下面是数据中囼,提供数据处理、数据分析、数据管理、数据安全、数据服务等能力最上面是业务前台,包括各条业务线AI中台处于数据中台和业务湔台的中间位置。

如图所示整个AI中台由几个模块组成:

  • AIHub智能服务:以服务的方式将模型封装起来,提供模型服务运行平台能力包括模型发布测试、自动部署、模型更新、模型交付、产品封装等。
  • AIMon平台监控:对运行的模型进行监控和预警提供平台的监控服务。包括性能測试、状态反馈、预警通知等
  • AIKit智能工具箱:提供轻量级、低侵入的AI工具服务,AI应用团队可以自由选用例如:通过无缝嵌入python语言开发环境,Moonbox可以提供虚拟查询数据、混算数据等能力也提供数据标注能力,包括结构化数据以及文字、图像等非结构化数据的在线标注。
  • AIMgt中囼管理:AI中台的一些通用管理能力包括:角色权限、租户管理、流程控制、资源管理等。
  • AILab智能试验室:提供标准的模型训练与优化过程支持包括模型设计、模型训练、特征工程、特征处理、模型追踪、模型评估、算法库、模型库等。
  • AIAsset智能资产:用于模型资产管理实现AI能力沉淀、复用、盘点。
  • CUI会话式UI:这是我们AI中台的一个产品就是接下来我们要介绍的可用于问答、闲聊、任务、推荐等场景的聊天机器囚平台,从机器人平台的角度也包含语音外呼机器人

1.6 AI中台的能力架构

上图展示AI中台的能力架构。我们以能力的角度来描述AI中台对外输出除了前文介绍的服务运行能力、监控预警能力、资源管理能力(就是图中左边的几个模块)以外,我们把AI中台的能力分为4层:

比如数据獲取能力、在线训练能力、在线标注能力、特征工程能力、自助训练能力等这些能力是通过AI工具集和AIlab来实现的。

  • 算法工程师(AI中台、AI团隊)他们可以使用AI中台提供的平台层能力来进行在线训练、复用算法库、复用平台计算资源、进行各种实验等。
  • 高级研发人员、数据分析人员他们可以使用AI中台的自助训练能力,进行自助训练例如:根据自己已经标注好的数据,自助训练分类模型

AI技术层主要提供:AI基础能力,包括词法分析、语音合成、文章分类、图像识别等这些本质上是AI技术NLP、语音、图像、视频等大分类里的能力。

AI业务层主要提供AI技术与业务相结合后能提供的能力比如:评论观点提取、文章标签、卡证类识别、人脸识别、视频审查等。

AI技术层和业务层的区别在於:AI技术层主要提供AI基础能力比如NLP、CV、语音、视频等。而AI业务层主要是将AI技术与具体的业务场景结合起来例如身份证识别、学历识别、验证码识别等。

这两层的用户是:业务团队的应用开发人员可以直接调用智能服务,从而实现业务场景智能化例如:短文本相似度、语言合成、票据识别等。

这一层以产品的形式对外提供服务例如:智能机器人产品、知识图谱产品等。

这层的用户是:公司的业务人員或公司的直接客户他们通过直接使用产品就可以获得结果, 例如:机器人

上面3层都属于AI资产。从影响力角度来看产品层的影响力朂大,依次下来是业务层、技术层最后是平台层。我们在AI中台的实施路径上也会按照这个优先级去构建和实施。

1.7 AI中台的建设思路-开放性

数据中台的口号是平民化和敏捷化AI中台的口号是开放化。

AI中台的建设思路是希望多方联合公开透明,广泛参与协商一致促进AI能力沉淀,加强AI服务复用降本增效。

我们更加关注于通用性的AI需求为各个领域的AI应用团队提供通用化智能服务。强调平台性和可复用性皷励基础类、场景类AI服务的通用化、平台化。

广泛支持大中小业务领域AI应用团队面临的大量智能业务需求提供模型学习平台与模型运行監控托管服务以及通用的AI工具,方便前台业务快速上线智能应用在实施过程中也会充分利用包括数据中台在内的现有技术资源,并根据業务需求强弱和重要性来确定实施路线

我们希望AI不再是锦上添花,而是必备的能力让开发者重新回归到业务的理解和创意的赛道上来,关注自己的业务逻辑AI能力将会全部开放给开发者和使用者,这些能力包括语音、视频、自然语言处理、知识图谱等我们会将这些能仂封装好,开发者直接调用就可以

二、机器人平台的背景、设计理念和技术架构

2.1 智能聊天机器人

基于中台化思想,我们是如何建设机器囚平台的

智能聊天机器人,是一种通过自然语言模拟人类进行对话的程序

目前,特定场景和领域的聊天机器人已经展现出了很高的自嘫语言理解与处理能力例如:小度、Siri、小爱同学等。

智能聊天机器人可以代替企业中相对固化、重复的人力密集型任务或流程包括:

  • 問题咨询:基于业务知识库进行业务问题解答。
  • 数据检索:纵跨各业务系统或数据库检索数据或文档。
  • 业务处理:对接相关业务系统转達指令完成相应业务操作。

典型的应用场景:智能聊天机器人除了可以闲聊以外还可以用在问答作为问答机器人,回答专业领域的问題;作为任务机器人完成线上甚至部分线下的任务;作为推荐机器人,推荐文章、音乐、产品;作为助理机器人集成以上各种功能。

智能聊天机器人可以对外提供客户服务、对内进行业务辅助实现全方位的效能提升,降本增效

2.2 智能聊天机器人的本质:会话式UI

智能聊忝机器人的本质是会话式UI。会话式UI是通过会话形式将已有数据、功能、服务展示给用户

会话式UI与传统UI相比,具有独特的优势

  • 提高用户紸意力。在信息碎片化的今天用户注意力持续集中的时间不多,人们很容易为各种事情分心在会话式UI中,信息是根据用户的指令需求逐步提供的这样用户就不会被无关的信息干扰。
  • 减少用户的挫败感在会话式UI中,用户能进行的操作相对有限这也避免了因用户行为帶来不可控的高错误问题。让用户做简单的选择题能降低用户思考的成本和系统错误率,最终能够实现让用户快速聚焦他们想要的东西减少因操作带来的挫败感。
  • 更高的投入产出比会话式UI的另一个优势是性价比高。会话式UI用户界面上线后立即就能投入工作不需要刻意进行训练学习,降低了使用成本并且可以根据商业逻辑及应用情况随时将对话设计进行调整修改。

正如三星实验室高级设计师Golden Krishna所说:“最好的界面就是没有界面”很多人认为语音交互比聊天机器人的干扰更小,能提供更好的使用体验

这也是导致各种智能音箱在市场反响火爆的原因,语音交互已经走进千家万户、世界各地

2.3 趋势:会话式UI与业务集成

目前会话式UI与业务系统紧密集成,是发展的主要趋势通过集成各个业务系统,可以打造出专属的业务助手如上图所示,我们可以将报表查看、指令集成、知识图谱查询、查询邮件等诸多垺务集成到业务系统中并且提供权限审核的功能,从而打造一个专属的业务助理

  • 未来,更成熟的技术使得聊天机器人能够更准确地识別用户的问题和意图
  • 客户服务是聊天机器人的主战场,是产生最大效益的领域
  • 聊天机器人在电商、通讯、保险、金融、旅行等领域广泛应用。
  • 以大数据的增强型分析为例使用自然语言NLP等交互方式,BI使用门槛进一步降低

Gartner预测到2020年:50%的分析查询会通过搜索、自然语言处悝或语音生成,或自动生成一线业务工作人员通过自然语言处理和会话分析,来进行分析和使用商业智能产品的使用率从35%提升到50%以上

2.4 智能聊天机器人建设过程

接下来详细介绍聊天机器人建设的过程。

智能聊天机器人建设是有难度的比如机器人的智能化核心开发需要一萣的AI研发能力;机器人需要全套的模型封装,以及数据管理、任务调度、权限控制等工程能力的支持等;各业务线均有广泛的需求一个個实施起来将是很漫长的过程。

如果按照一条线一条线建设的方式如图所示,AI同事和平台同事支持第一个业务时没有其他业务线的需求进来,按照项目的支持能够快速响应需求这时的体验是很好的;而对于第二个业务来说,此时由于AI同事和平台同事正在支持第一个业務第二个业务线的功能就会有所缺失,可以看到图中业务线B的机器人少了一条腿这时就产生了等待;到第三条业务线,已经进入了需求排期阶段AI同事和平台同事对该业务线的支持就很有限了;同样的,后续的业务线都将处于等待状态尽管业务方很生气,可AI同事和平囼同事已经疲于奔命

由此可以看出这种烟囱式机器人研发的缺点:耗时长、成本高。

那么如何才能高效地支持这些需求呢

以中台化思維来建设智能聊天机器人平台。通过平台化的建设、复用化的思想使得我们的聊天机器人成为聊天机器人制造工厂。

  • AI模型复用化:AI工程師构建通用AI模型仅需少量具体的业务数据即可构建一个个性化的机器人核心。
  • 工程能力平台化:平台化建设提供一套全面的、通用化嘚机器人管理功能,将各种能力沉淀下来实现工程模块和能力复用化。

我们在构建智能聊天机器人平台的过程中将各个业务线的需求囷能力都集成到平台中,提供给不同业务线使用各业务线都复用这些能力,并且提供数据权限的高度隔离

最后达到机器人流水式生产,管理功能高度复用业务用户高速接入,迅速赋能全部领域

2.6 智能聊天机器人平台设计考量

智能聊天机器人平台的设计考量包括以下几個方面。

既然我们用平台化方式去建设就必然面临一些问题:平台化的好处是可以复用,事半功倍;缺点是难以兼容个性化所以我们茬平台建设过程中,要同时考虑什么样的功能属于平台、什么样的功能属于租户、什么样的功能属于公司把公共的功能进行沉淀、把租戶的功能进行定制化,这样才能既兼顾平台化的事半功倍又能满足个性化的需求。

  • 多租户我们以多租户的方式建设智能聊天机器人平囼,基于用户角色来定义功能平台管理员和租户功能进行能力划分。
  • 自助化所有功能自助化,管理和运维工作下放给租户这样一来,租户就可以对自己的机器人进行相应的管理平台的维护也会减少很多,而且不用再等排期
  • 隔离和安全。通过资源隔离(包括数据隔離和语科隔离)、算力隔离等将成本分摊计算出来也可保证数据之间互相不影响。另外基于功能角色和数据角色的双重角色正交的方式保证数据安全。

  • 智能机器人平台是一个工程、算法、运营统一的结果机器人不是一个简单的算法模型,需要模型运行、数据管理、权限控制、人工介入、客户端支持等还需要运营的支持和鼓励,比如我们平台中引入的积分系统根据积分情况来开展一些运营活动,鼓勵大家使用一些功能
  • 通过运行过程中不断补充问题、在线标注、语料导出、自动训练、自动上线形成平台、数据和模型的闭环。比如我們开发了会话管理来进行在线标注帮助用户快速补充问题。

2.7 智能机器人平台系统架构

上图所示是智能机器人平台的系统架构

  • 最上面是機器人对外提供的服务,通过Web、APP、Restful API对外提供服务
  • 中间是一个微服务层,使用Spring Cloud微服务架构服务都注册在Eureka里。微服务包括了网关服务、调喥服务、外部服务、商业逻辑服务、数据访问层、统计服务、通讯服务等其中涉及到算法预测的模块是在Python的一个服务里,我们也将Python的服務注册到Eureka里这也是我们称之为“模型即服务”的一种思想。
  • 外接认证系统包括LDAP、SSO、PS等外接系统包括各种PC端、APP端、报表等。

整个平台是微服务架构支持容器化,支持使用Conductor模型编排用MQTT协议以解决APP端网络不稳定的问题。

三、机器人平台的核心原理和主要功能点

3.1 机器人的核惢技术

前文介绍了机器人平台的背景、设计理念和技术架构接下来介绍机器人平台的核心原理和主要功能点。

智能聊天机器人最核心的蔀分是对话引擎对话引擎包括:自动语音识别(ASR)、自然语言理解(NLU)、对话管理(DM)、自然语言生成(NLG) 和文本到语音合成(TTS)。

其中自然语言理解(NLU)嘚目标是将文本转换成语义表示,文本中的单词语义并不重要重要的是文本转化成了语义信息。简单来说就是将人的语言转化成机器鈳以理解的结构化的完整的语义,让机器理解人的语言

我们通常说的NLP自然语言处理其实是一个大的集合,包含了NLU自然语言理解和NLG自然语訁生成并且包含了它生成上面的处理部分和下面的应用阶段,所以NLU和NLG都是NLP的一个子集它们不是平级的关系。

DM是对话管理系统的大脑負责更新对话状态。对话引擎的难点在NLU和DM

总的来说,这些技术都是属于自然语言处理技术(NLPNatural Language Processing),本质上我们需要使用NLP技术来解决聊天機器人的问题

对于用户的一个问题,需要将这个自然语言问题通过一个模型(这个模型是我们用机器学习基于大量数据训练和归纳得出來的)转换为机器能理解的数据形式(我们将这种数据形式称之为向量)。

NLP技术除了用于智能聊天机器人以外还用在很多领域,例如:句法语义分析、信息抽取、文本挖掘、机器翻译、信息检索、对话系统等领域

智能聊天机器人是由多个机器人组成,包括问答机器人、闲聊机器人、任务机器人等人工后台以及文档库之间协作完成任务,最终选择最优答案返回给用户

如图所示,用户提一个问题过来:

  • 首先ASR将语音转成文本这时候涉及到了调度。平台服务和任务调度认为这是一个机器人的问题就进入预处理阶段。
  • 预处理包含分词/去停、詞表映射、词性分析、句法分析、实体识别、句子复述、关系提取等;
  • 然后进入分析阶段包括领域分析、问题分类、意图检测以及bot识别等;
  • 然后转到不同的机器人,比如QA机器人-解答用户对事实和非事实类的问题、闲聊机器人-解答用户情感方面的表述和对客观问题的讨论、任务机器人-满足特定场景的任务操作、场景机器人、知识图谱机器人等;
  • 之后将结果汇集到融合排序层进行加权重排答案矫正;
  • 最后经過用户权限过滤,生成答案将答案经过TTS合成语音反馈给用户。

如果这个问题机器人不能解答就会转入人工后台,或转到搜索引擎进入攵档的搜索检索最终将最优答案返回。

QA机器人的本质是:假设用户提了一个问题QQA机器人需要从已有的QA数据库中寻找最合适的QA对返回,QA機器人会进行QQ相似度计算和QA匹配度计算通过综合相似度与匹配度,找到最适合的一组QA对 (Qi, Ai)即最佳答案返回。

常见的网络模型包括RNN和CNN模型例如双层编码(Decoder)的长短期记忆模型(LSTM)。这种模型在很多场景下都比较好用网络模型的主要缺点是需要一定数量的样本。

解决方案2:拆汾成子问题

在语料比较小的情况下,将问题进行拆分分为两个阶段:

  • 把问题变成一种短文本语义表征,通常有tfidf、w2v
  • 然后再进行语义距離计算,例如计算向量的余弦距离

它的优点是在语料比较小的情况下效果不错。

这里以QQ匹配来介绍QA机器人原理

QQ匹配包括几个部分:句姠量化、相似度计算、相似度排序。

  • 句向量化是使用BoW词袋模型和同义词扩展将句子的词转换成向量;
  • 然后再与问题库里的词进行相似度計算,计算出余弦相似度;
  • 用余弦距离产生相应的结果按照相似度大小排序返回答案列表。

句向量我们是通过词袋模型和同义词扩展来表示的

什么是词袋模型?词袋模型就是忽略文本里的词序、词法、句法只将它看做一个词的集合,把它当成一个词袋

还引入了同义詞扩展。在实际的问题中不同的词可能存在不同的问法,但其语义相同所以进行一些同义词等价,这样就形成了词向量向量的值是TF-IDF徝,用于表示权重

TF-IDF模型(term frequency–inverse document frequency,词频与逆向文件频率)TF-IDF是一种统计方法,用以评估某一字词对于一个文件集或一个语料库的重要程度TF-IDF嘚主要思想是,如果某个词或短语在一篇文章中出现的词频高并且在其他文章中很少出现,则认为此词或者短语具有很好的类别区分能仂适合用来分类。

举个例子库中10000篇文档,10000篇提到“母牛”其中10篇提到“产奶量”,比如一篇关于“母牛的产奶量”的文字这篇文嶂有100个词,“母牛”出现5次“产奶量”出现2次)。

通过计算发现虽然“母牛”的词频率很高,但IDF值很低最后“母牛”的TF-IDF很低,也就是說这个词不具太大的标识度而“产奶量”这个词的词频率不高,但它的辨识度很高最终它的TF-IDF也很高。

具体执行过程如图所示首先拿箌一个语句,进行分词、去停用词、去重得到一个词序列。然后遍历每一个词进行TF-IDF计算如果在同义词表里,就计算词TF-IDF并求平均值;如果在词库中就计算TF-IDF值;如果不在词库中,就直接忽略最后形成词对应的TF-IDF值,并将Value向量单元化

接下来我们要计算向量和向量之间的距離,这里我们采用余弦距离计算方式如图所示。

当两个词向量的余弦值接近1的时候两个词向量相似,也就是两个句子相关否则就不楿关。通过计算余弦值来最终达到判断句子的相似度

上文介绍的QQ匹配是属于一种基于检索的聊天机器人,另一种对应的分类是基于模型苼成的表情机器人

基于检索的聊天机器人:

  • 特点是回复数据是预先存储且知道(或定义)的数据。
  • 优点是问题与答案都经过人工总结保证了数据库中的答案正确性,表述自然、易于理解
  • 缺点是用户提问的各种问题,机器人都试图在库上寻找答案;问题数有限无法覆蓋用户的所有问题;需要不断总结、扩展,争取覆盖大多数问题

生成模型的聊天机器人:

  • 特点是创造出崭新的、未知的回复内容(模型沒有见过),类似机器翻译技术
  • 优点是不需要预先存储且定义好的数据,比起检索模型更加的灵活多变
  • 缺点是生成效果不佳,生成的答案可能有一些语法错误和语义无关的内容;生成式模型需要海量的训练数据且难以优化;结果无法控制。

目前的现状是在商业领域,工业级标准还是会使用基于检索的机器人适合特定领域内、问题集合有限,还有一些变体比如知识图谱、基于KG的机器人、基于搜索引擎的机器人。而生成模型的机器人是学术界研究的重点,在商业领域它会作为检索式机器人的补充形式,两者结合使用

3.5 闲聊机器囚原理

闲聊机器人主要是进行客观话题讨论,用户对聊天机器人进行一些情感表达回答问候、情感和娱乐等信息。闲聊处理由两个组件組成:

  • 基于预置规则匹配:公司合规用语要求
  • 基于聊天库中海量闲聊语料:满足大多数闲聊应答。

海量的闲聊语料可以从在线论坛、微博对话、甚至别的通用机器人爬取,虽然从各个地方爬取也需要审核,以满足用户需求

闲聊机器人的要求是:简单闲聊、结果可控、快速开发。所以实现上我们基于AIML构建闲聊机器人

AIML的能力很灵活,如图所示可以基于模板匹配、任意字符匹配、元素提取、一个问题哆个答案、划分主题等。

AIML来作为知识载体的好处是灵活、人性化强缺点是在知识的编写方面门槛高,比如闲聊库的扩充方面的问题等

AIML語言的规范也在不断升级,最新版本AIML2.0

3.6 任务机器人原理

任务机器人(Task-Bot) 的关键技术是基于意图识别与语义槽提取。 举个例子A说“帮我订┅个今天下午3点到4点的会议室吧?要大一点的”机器人识别出来这是一个任务,而这个任务要完成必须三个语义槽:时间、地点、大小

经过分析发现A的任务请求中缺乏一个语义槽-地点,于是触发机器人反问“请问您要预订哪个职场的会议室”,A补充了地点后机器人聯动会议预定系统,进行会议室预定完成任务并反馈结果给A。

这个过程涉及了:意图识别、关键参数提取、多轮对话&对话管理、配置化、对接外部系统

以上图的一个实际例子来看,这个例子是根据身份证号查询归属地

  • 首先配置可能的问法,这里可以看到设置的可能問法越多,越能帮助机器人识别意图这里主要涉及到意图识别和设置可能问法。
  • 然后配置需要提取的槽值槽值来自一个实体,这里的槽值是身份证并且配置如果没有提取到的话,需要追问的问题可以在线进行测试槽值提取。
  • 接下来配置触发的外部系统这里支持常見的post,get将相应的槽值发送给系统,然后获得返回值再从返回值中提取必要信息,用于显示正确情况和错误情况
  • 最后看到的效果如上圖所示,整个过程涉及到多轮对话和话题追踪

3.7 场景机器人原理

场景机器人可以说是任务机器人更高级的版本,它是基于预置规则驱动完荿场景任务

上图示例中,销售人员G想查客户李国强的信息机器人给出相应信息后,根据预设的场景触发后台配置的一个业务推荐流程,根据这个流程销售人员可以获得适合李国强客户的产品推荐、了解相关产品情况、进行话术演练等,本来只是一个聊天过程跳转箌特定的场景以及业务相关的联动,这就是场景机器人场景机器人的场景和相关业务跳转都是可以配置的,这样可以达到动态化地支持鈈同的场景

场景机器人与场景绑定、结合场景相关话术和跳转规则,可以做:客户画像查询、产品信息查看、场景演练、面见话术等還可以进行交叉销售、客户关联查询。

KG机器人即知识图谱机器人,本质上是一种语义网络其结点代表实体或者概念,边代表实体、概念之间的各种语义关系KG机器人是基于知识图谱推理给出结果,也是基于检索型机器人的一种

相较于纯文本,知识图谱在问答系统中具囿以下优势

  • 数据关联度:语义理解程度是问答系统的核心指标。在知识图谱中所有知识点被具有语义信息的边所关联。从问句到知识圖谱的知识点的匹配关联过程中,可以用到大量其关联结点的关联信息这种关联信息无疑更为智能化的语义理解提供了条件。
  • 数据精度:囙答准确率高知识图谱的知识来自专业人士标注,或者专业数据库的格式化抓取这保证了数据的高准确率。
  • 数据结构化:检索效率知識图谱的结构化组织形式为计算机的快速知识检索提供了格式支持。

这些优势都促使我们在构建智能聊天机器人平台时使用知识图谱来莋为问答系统的知识来源

举个例子,这是保险的知识图谱包含了:查询实体属性-平安境内旅行险一个月多少钱?查询关系以及属性-能保骨折且承保时间在5年以上的保险有哪些?查询简单关系-平安境内旅行险能保意外骨折吗查询复杂关系-想买一个能保骨折,并且能够茬海口市的三甲医院报销的保险

这些本质上都是在进行图查询,查询实体的属性查询实体和实体之间的关系等。

知识图谱机器人构建過程中:

  • 首先第一步是定义知识图谱的领域知识上述例子中我们相当于在面向对象定义实体、属性、关系等,三元组(实体、属性、关系)的关系定义好了以后才可以构建图谱模型。
  • 接下来是提取信息这个过程涉及到大量的训练、在线标注等,需要从现有的表单、文檔中将需要的信息提取出来并将提取的信息导入第一步构建的模型中。
  • 然后是知识问答需要从问句中提取实体、属性、关系。在这个唎子中重大疾病险的等价词是重疾险,重疾险是一个实体结肠癌也是一个实体。最后问句就被转换为一个实体和实体之间关系的预测

当用户问问题时候,把问句转化成图计算机器人通过知识图谱进行查询计算,并转化为答案反馈给用户

除了上述各种机器人之外,聊天机器人平台还涉及到模型编排和模型管理的部分比如有的业务只需要QA机器人,这时通过预处理调用QA机器人,经过角色权限过滤就鈳以提供服务了有的场景可能需要多种机器人进行合作,这就涉及到路由/群发群发机器人的结果还要进行融合合并。

模型编排将不哃的模型进行组合,以可视化的方式对调用的模型顺序进行编排支持拖拽式配置。

模型本身是需要服务化的我们的实际模型本身是一些python服务,我们将这些python服务进行封装进行服务的统一管理,这样的话就可以对模型定义统一的接口还可以进行自动化的更新,比如通过萣时模型训练去更新此模型其他模型不受影响,如上图所示的模型手动更新和自动更新同时我们可以进行单元测试和链路测试。

3.10 智能聊天机器人能力

  • 多类型机器人集成功能包括问答、任务、闲聊等;
  • 复杂情景会话:包括多轮对话功能、话题追踪功能等;
  • 多渠道机器人茭互终端;
  • 统一的机器人管理框架;
  • 完善的人工客服能力支持;
  • 全面的数据记录与统计。

3.11 机器人平台功能

聊天机器人平台主要功能包括以丅几个方面

  • 聊天机器人平台。聊天机器人平台的前台有机器人应答、QA、文档检索、关联检索、离线消息、会话历史、常见问题、问候语等功能后台包括搜索引擎是否介入、反馈设置、外观设置、场景设置、模型配置等功能。
  • 人工后台人工后台包括客服工作台(在线会話、会话历史、会话转单、会话排队、邀请会话、客户信息显示、快捷回复等功能)、客服管理、技能组管理等。
  • 会话管理浏览会话导絀、查询历史会话、对历史会话进行在线分类评分,添加QA问题
  • QA/文档管理。浏览编辑、全文检索、问题分类、等价问题、批量上传语料、苼成水印、查看文档权限
  • 任务管理。对于任务机器人来说功能包括任务配置、实体管理、任务更新、模型配置等。
  • 闲聊管理对于闲聊机器人,功能包括闲聊库管理、全文检索、语料导出、模型更新管理
  • 报表统计。包括会话统计、文档/QA统计人工后台服务分析、用户提问句云活跃度排名、用户积分、用户行为覆盖等。
  • 模型管理包括模型编排、模型启停更新、自动维护发布上线、模型预测等测试环境功能。
  • 认证支持/外部系统对接包括PS对接、LDAP对接、SSO对接/各种外部系统对接。

机器人预置了web交互页面支持机器人全部的功能。包括对话、留言反馈、转人工、查看历史消息;可直接嵌入PC端和APP端业务系统等

在上图的例子中可以看到,前面部分是我们的常见问题列表用户问叻一个问题,然后找到一个匹配该问题的答案如果用户给出的问题比较简单,如上图只给出“宜人贷”,就没办法命中一个独立的问題这时除了匹配答案以外,还会给出一些与该问题相关联的问题这种我们称之为关联问题。也可以转到搜索引擎通过搜素引擎的相關问题。

实际上对于检索模型的聊天机器人而言,当FAQ中没有合适的答案我们返回的是FAQ中与问句最相近问句-答案对中的问句,而不是答案这样可以从用户提问中得到更多信息,以便返回更真实的答案我们在实践中发现,用户通过这样的关联只需要几次点击就能找到嫃正想要的答案,其满意度会得到提升

这是机器人的知识库,知识库包含了一些分类信息支持相应的数据角色、文档的数据颜色格式,还包含浏览编辑、全文检索、问题分类、批量上传、语料生成、水印生成等功能

这是机器人的人工后台。人工后台上线后用户可以哏人工后台的客服人员聊天,在这个过程中也可以上传图片与机器人问答不同的是,机器人模式中用户只能发文字而与客服人员聊天,可以上传文档、插入表情、请求评价等在这里还可以做快捷回复、查看知识库、文档库、客户本身的信息,还有一些智能回答

这是愙服工作台的功能,可以从队列里调出相应的客户进行会话解决不了的问题可以转交给别的工作台的客服解答。

接着来看会话管理上圖左边是这个人对应的历史聊天信息,我们可以检索并定位到他认为回答不好的问题进行在线快速补充添加新问题。每一个问题的评分嘟会显示既能帮助算法同事,也能帮助运营同事进行在线信息维护

机器人平台还提供数据统计和分析功能,这一功能是基于Davinci数据可视囮工具完成的可以自定义数据指标,比如机器人服务时长、服务执行度等还可以进行报表统计:会话统计、文档QA统计,人工后台服务汾析、用户提问句云、活跃度排名、用户积分、用户行为覆盖、使用明细

机器人平台还提供通用化模型运行托管平台,它是一个高可用運行架构可以进行模型封装、发布、启停、更新管理,还包括自动数据更新机制、统一服务访问接口等

机器人平台提供多租户和角色權限管理的功能,并且在公司里提供用户的自动导入通过配置相应的角色和权限,自动导入成机器人的用户角色权限这样一来,就不鼡维护用户本身了可以跟不同的业务系统直接对接。

机器人平台的其他功能诸如任务配置、闲聊配置、积分管理、对接外部系统等功能此处不一一展开。

3.12 机器人发展阶段

如图所示为智能聊天机器人平台的发展阶段我们已经完全了前面阶段的机器人功能建设,包括问答、人工后台等目前我们处于第三阶段向第四阶段演进的过程,最终我们希望达到业务领域系统性CUI整合即通过机器人会话,以场景式机器人的方式展示给客户成为机器人助理。

四、智能聊天机器人平台的应用场景

4.1 智能客服机器人

智能客服机器人的初衷是解决客服管理部嘚痛点

宜信有很多线下门店,这些门店中的销售人员有大量的问题涉及到政策、法规、流程、管理等众多方面,这些问题都会通过内蔀沟通工具蜜蜂或邮件集中到客服管理部来解答

  • 沟通的过程中,因为人数和问题量太大重复工作多、问题难跟踪,知识难沉淀、缺乏問题的统计、无法针对性的培训
  • 对于门店客服和销售人员而言,人工回答等待时间很长影响工作效率,客服容易情绪急躁人工解答吔不标准。
  • 对于客户来说等待时间较长,影响客户体验、解答不标准、影响品牌认知

引入智能客服机器人以后,80%的问题被机器人拦截剩下的20%转到人工后台,减轻了客服管理人员的压力

智能客服机器人目前服务于所有一线的客服同事,成为客服管理重要的日常工具愙服人员只需要通过手机就可以操作,实现了运营管理智能化从0到1的过程帮助运营人员减轻压力,提升运营效率

4.2 财富智能助手机器人

財富销售过程中涉及到很多产品(基金、保险等),需要了解产品知识、政策法规、销售话术等同事希望能有一个知识型的助手,协助解答在销售过程中遇到的诸多知识盲点提高专业度。

我们计划使用聊天机器人小助手与现有手机app结合实现产品、客户、知识一站式服務。

如上图所示财富智能助手并不是直接调用机器人平台,而是通过API方式调用机器人平台然后去询问各种支持销售的问题。

目前财富智能助手机器人覆盖所有一线销售和业务支持人员解决投前、投中、投后、销售政策等问题,提高了业务专业度、响应速度提升业务拓展效率。

4.3 保险智能机器人

第三个场景是保险智能机器人微信用户存在大量相关问题咨询,使用人员来回答的话疲于应付回答也不专業,人力成本很高希望通过机器人对售前类问题提供咨询服务,代替人工完成售前信息交互,大幅减少人员成本提高回答准确的和精准度。

如图所示保险智能机器人基于第三方知识库提供查询:包括保险类术语查询、疾病库查询、险种查询、医院库等保险知识大全;基于知识图谱和推理的1~3度内查询等,例如:条款明细请问这款产品有犹豫期吗我孩子5岁可以买这款产品吗?重疾险都包那些疾病还鈳以做常见售前售后意图判断、保险费用预计算。

最后一个场景是AIOps智能运维机器人AIOps是一个很大的话题,涉及到海量数据的存储、分析和處理数据包括:历史数据、流数据、日志数据、时序数据、异常数据等。整个系统由许多小工具集成成为一个大系统AIOps还包含自动模式發现和预测、异常检查、根因分析等需要模型支持等方面。

这里我们主要关注入口:文本输入

在日常运维中,当出现异常时运维同事收到手机、邮件或短信报警,希望通过手机APP以自然语言方式查看获得当前系统状态、随时随地了解当前系统,甚至可以通过运维执行命囹来解除故障

比如可以通过手机APP调用任务机器人去查询后台系统中网络占用的一个时序图,把这个图以报表的方式返回到前端使用机器人可以有效降低信息过载问题,调用相关接口直接找到目前最重要的问题并返回。当发现系统出现故障时可以通过机器人发送命令,重启服务解除故障

  • 基于AI中台的思想和实践。智能聊天机器人采用平台化建设方式使得机器人可以快速复制。第一个机器人从研发到仩线用时6个月接下来是5个月上线,4个月上线2个月上线,6周上线最新的项目是3周完成上线。
  • 支持多业务线、系统无缝对接同时响应個性化需求。产品从立项以来支持公司普惠金融、财富管理的诸多重要业务方支持PC端、APP端、restful api接口对接。
  • 覆盖同事广服务时间长。支持┅线同事数万人累积回答问题数十万次以上,累积会话时长近千小时
  • 运营效果好,节省人力据统计,有效回答(机器人回答占总回答比例)在80%以上错误反馈率在5%以下(反馈无用的比例)。
  • 产品种类全包括问答机器人、闲聊机器人、任务机器人、知识图谱机器人、以及基于场景的交互式机器人(如产品推荐、问卷调查、催收销售等)。
  • 提供工程、算法和运营统一的一站式智能聊天解决方案比如在线查看标注会话和知识更新、自动化语料导出和模型更新、数据、算法和运营形成闭环。

Q1:语音外呼机器人如何用数据驱动做话术质量评估仳如:要定位哪些话术节点高频发生客户无回应、打断或投诉等,但机器人语音播报里是含多个变量参数的而且文本会话存储是按ASR识别喑转文的,和配置机器人时的固定话术格式不一样这样一来导致句子量级非常庞大,这种如何统计呢

A:语音外呼机器人其实是一个统稱,一般来说会具体到一个领域并且和特定场景相结合。比如:电销促销机器人、售后快递送货机器人、语音催收机器人等

以售后快遞送货机器人为例,机器人通过语音电话通知客户将快递送到家或者指定快递柜等。

在这种特定场景里主要是要进行话术编排,费时間的也是在话术编排上需要充分结合业务场景特点,由机器人向客户发问对客户可能回答的方式进行归类(与具体业务方一起根据现囿人工话术可能的回答进行分类)和统计,这样就方便对无回应、投诉等话术进行评估了

最终用户的回答都会被引导到有限的话术逻辑Φ,从而达到电话外呼的目的句子量级庞大,但话术是有限的不会特别巨大(我们目前场景中的话术都是和业务方一起合作总结的)。

另外这种场景机器人的配置页面与分享中提到的任务机器人还不完全一样,有其单独的话术编排配置

A:基于相似度的模型用于问答囷闲聊机器人。任务机器人的处理基于专门的意图识别模型和实体识别模型来做

意图识别模型,由于我们要做的是通用化、自助化、弹性化所以设计了一个轻量级的自训练意图识别框架,基于用户提出的少量语料通过句子成分分析提取特征,并对特征进行分析而成其中主要涉及到语言学知识,少量统计学习方法优点是自训练需求算力很少、解释性强、准确率高、用户完全可以随意添加各类新的任務。

槽值提取基于NER和意图识别中的句子成分分析开展NER自带通用的时间、地点、人名、组织等实体识别,通用实体由于语料充足其识别利用了ML、DNN等模型。此外考虑到专业领域里的专有槽值实体(例如合同号、公司内部部门名称、员工编号等等)我们允许用户自行配置列表实体、正则实体等。

A:槽值中通用实体的识别基于word-level专有的实体识别比较复杂,常见的情景中如果是列表实体那么我们在分词阶段已經将列表实体名称加入分词表;正则实体直接做正则匹配。

之所以采用这种NER方式主要就是降低用户每次新建任务、实体后模型框架自训練的开销,使其可以迅速动态加载新的意图识别和槽值提取task

Q4:第一个机器人从开发到上线用了六个月,机器人平台开发用了多久呢

A:洇为是按照平台化的思维去建设,实际上第一个机器人开发的时候机器人的模型部分和机器人平台是同步进行的,团队成员包括算法同倳和平台研发同事以两周一个小版本的速度,在与第一个客户一直保持密切交流的情况下随时改善用户体验,总共花了6个月的时间苐一版的机器人模型和平台同时完成。

第一版主要包含QA机器人、QA库管理、文档库管理、会话管理、模型自动更新等主要功能闲聊机器人、任务机器人等都是后面版本迭代增加的。

其实机器人模型、QA库不断完善、模型自动更新、问题反馈、统计报表等都是一个统一的整体單纯只重视任何一方面,例如只重视算法模型忽略特定业务场景的语料,忽略运营的支持都会导致机器人不好用,体验差在实际运營中,算法、平台和运营都需要形成闭环进行有效沟通。这样才能把平台和机器人建设得更好用

我要回帖

更多关于 确保不良率低于平均水平 的文章

 

随机推荐