【8:54】数据观:“创新,洞见,2016大数据与传媒产业峰会”即将开始,嘉宾们陆续就坐,【数据观】将全程为你图文直播峰会内容,敬请关注。
(会议准备中,嘉宾陆续就坐)
【9:07】主持人:我们马上进入大会的正式议程,各位领导,女士们、先生们早上好,我是来自中广互联的岳大伟,非常容幸我来主持今天的峰会,也代表主办方欢迎来到爽爽的贵阳。今天是贵阳数博会的第二天,我们开始各项的分论坛,我们论坛是大数据产业的峰会,我们先开始今天的议程。
昨天李克强总理在开幕式上面也有重要的演讲,大家通过不同的渠道进行了学习,李总理也提到了中国错过了很多科技革命,但是这次移动互联网技术我们要迎头赶上,把握机遇,这样才能和其他国家的科技创新站在同一起跑线,无论是电视人来说,还是接受大数据的商业模式,还是认可大数据所代表的广播电视、传媒领域发展的道路,这都是我们传媒行业人能够在这与时俱进的道路上,我们紧跟时代的步伐,我们今天和几个主办方一起做了传媒与大数据的峰会,也是想通过我们峰会的探讨,去梳理我们整个传媒一大数据之间的密不可分的联系,从中剖析传媒人怎么为我们的行业服务。
【9:08】主持人:我先介绍一下我们的嘉宾,我们得到了业界的大咖、专家的支持。今天到我们论坛现场的中国工程院院士中国大数据专家委员会副主任委员高文。中国电影电视技术学会理事长何宗就,北京电影学院大数据研究所所长张锐,北京过双科技有限公司联席总裁续扬,CTR媒体融合研究院秘书长吕正标,广东光电网络副总工程师徐江山等等。
我再次代表主办方对大家的光临表示感谢,下面我们以热烈的掌声欢迎贵州省新闻出版广电局副局长向建军先生。
【9:10】向建军:尊敬的院士、尊敬的何院长,各位领导、各位专家、各位来宾,新闻界的朋友们,大家早上好,欢迎大家来到多彩贵州,来到爽爽的贵阳。2016年中国大数据产业峰会,以及中国创新产业发展峰会,我们有幸邀请到各位专家学者,共同探讨大数据与传媒产业发展的新趋势、新未来,首先我代表贵州省新闻出版广电系统对各位来宾表示热烈的欢迎和诚挚的感谢。
【9:12】向建军:坚守发展和生态两条底线,是习近平总书记对贵州的嘱托,发展大数据是贵州贯彻落实走新路,首先弯道超车的大机遇,从云上贵州到大数据博览会,到今天2月份,批复统一贵州建设全国首个国家级的大数据综合实验区再到今天的峰会,贵州顺势而为,打开大数据发展之门,已经站到了时代发展的潮流,在互联网大数据的时代,无论是主动还是被动,没有任何人任何行业可以置身事外,目前传媒行业是转型时期,得数据者得天下,如今不是简单的新闻信息,而是涵盖了各种各样的数据,这就要求媒体必须适应新的信息的传媒方式,探索为受众和用户提供分众化服务和体验媒体发展之路,大数据的应用可以整合传统媒体和互联网资源,助力传统媒体转型,把危机转化为机遇,同时我们传统媒体也需要在变革中坚守。另一方面要变,就是融入潮流,另一方面是守底线。今天我们将聆听传媒数据领域前沿的声音和咨询,共同探讨传媒在新时代下的整合、发展,聚合新的力量,为推动传媒媒体贡献智慧。最后我们预祝本次论坛取得圆满成功,祝各位专家、来宾在贵州期间愉快顺利。谢谢大家。
【9:14】主持人:非常感谢向建军的发言,刚才的发言为我们论坛定了新的基调,我们再次用热烈掌声感谢向先生的致辞。当前整个传媒环境和科技革命的蓬勃兴起,数据是新的资源,数据也是一种生产力,因为咱们国家是一个电视产业的大国,有海量的传媒广播电视的清楚的数据,挖掘电视产业的数据空间是无限的,推动整个电视传媒的数据的采集、分析,可视化的创新的技术也是我们整个电视行业所期盼的,我们非常容幸的邀请到了中国工程院院士,中国大数据专家委员会副主任委员高文先生,为我们做广电多媒体大数据之若干技术挑战。
(高文主题报告:广电多媒体大数据之若干技术挑战)
【9:17】高文:尊敬的各位领导,各位专家,广电比任何时候机会都好,这可能也是有大数据的潮流,当然和大数据同时来的还有互联网,很多人觉得互联网对广电会有很大的冲击,实际上广电有另外的机遇,这就是我们今天分享的,大媒体这事情上,今天要分享的机遇是什么,面临的技术挑战有什么?
首先这个大数据特别是4K电视,总是带来很多的新的机遇,我认为给广电带来非常好的机遇是4K这个事情,因为4K用上的话,无论你本事再大,没有30兆以上的带宽玩不了,他有效的这种可以稳定带宽供给现在只有KP可以,当然不是说电信没有机会,这次会还有一次大专家,这个专家正在攻关一件事情,就是用广电网通过OTT也可以提供20以上的带宽,所以说现在4K极大的痛点。有人说IPTV怎么样,我的观点是死路一条,因为那个投入的量绝不是现在IPTV系统能比的,但是回收却非常大,所以与其砸钱,还不如反过来说换一个路。那么在个性化广告推送和个性化服务方面也是对广电很大的机遇。那么全世界在VR很热,这也是一个大的机遇。
【9:20】高文:那么抓住机遇需要有一些技术的储备,面临的技术挑战有如果想抓住4K,利用大数据提供个性化,有这样的技术挑战,第一,面向4K的新一代视频编码,这还是得在新的编码系统下,新的编码体制什么时候能够全部就位这是一个挑战;第二,你要想提供个性化的服务,个性化的金融广告推送,你要知道现在放的是什么东西,就需要大规模视觉搜索功能,就能够实时再现的用户在看的是什么,你通过这个来解决用户的问题;第三,4K和HDR(高动态视频)和3D声,这两个技术国外已经有,但是国内还不成熟,今天因为时间关系就讲这几个问题。
【9:22】高文:新一代的视频编码,大家都知道这些,我们央视所有的传统食品编码方法是从信号处理层面入手,以像素、块为表示基础,以前我们是264,国外265已经进入市场,和这个标准相关,国内也有一个标准就是AVSR,我们要想把视频有效的推送到客户家里面,就要进行编码,否则数据量太大,我们现在4K的数据量是8G左右,你一点不压缩的要把这样带宽推到客户家里面是不可想象的,就要进行编码压缩,这以后有30年了,30年下来,我们对一个高清视频可以从1.5G到20兆,高清视频用兆就差不多,是这样的数量级的概念。我们使用了数学的编码工具和算法在里面进行运算,我们使用商编码等,用数据工具组合在一起,做出了MPGE1到MPEG2,每十年性能翻一番,他就是把高清视频压到原始数据的七十五分之一。到2003年就出现了第二代标准,可以压缩到一百五十分之一,这个流程走完,今年已经到第三代标准,可以压缩到三百分之一,就是说1.5G的东西可以变成5兆。
【9:25】高文:这个演进启发我们技术上进一步的细化,编码的摩尔定律可以继续进行下去,那么使用的数学工具是变换编码等这些工具的有机组合。
AVS2目标与达成方面,我们当时就想出了,当时的264很好,后面的265也不错,但是在知识产权方面不是很友好,有极大的不可预测性,所以一定要有自己的标准,这样不受制于人。我们就提出性能不能低于HEVC,面向广电4K的需求,不仅能在国内使用,也可以走出国门,我们有专门的班子,来制订标准,从AVS1到AVS加进行研究,也受到了广电总局科技司AVS技术应用联合推进组,发展的还是比较顺畅。
【9:27】高文:从开始制订计划到定了国标一步一步的走的比较顺畅,里面使的编码效率再翻一番,很多方面都进行了非常细致的技术工作,包括帧的结构,块的结构,变化等,结合在一起就可以翻一番的性能的效果。那么这个性能我们不能自己说,首先就是要测试,那我们就把AVS2参考软件和HEVC参考软件给他们,让他们对这两个进行测试,这就是测试结果,就是针对不同的看两个标准比较起来会如何,负的就是节省了,负的越大越好,如果正的越大,就说明你的效率越低了。我们在应用方面数字电视广播(逐行)、数字电视广播(隔行)、视频监控(非低延时存储)、视频监控(低延时存储)等方面做了比较。所以性能是相当不错的,我们也看了在实时通信、数字电影等方面也做了测试,也是相当不错。最后的结论是AVS2和HEVC相对与源图象质量下降分别为2.9%和3.0%。当时测试的时候采用了民族舞、京剧表演、秋叶、春晚开场、大树和丝带,等等,就是有的是体现色彩,有的是体现旋转的进行测试。
【9:31】高文:对于高清测试也是非常不错的,那么这些测试走完之后,AVS2已经成为广电行业标准,我们可以很自豪的说4K编码已经准备好了,下面就是产品。到时候不管咱们的机顶盒都可以支持AVS2信号源。编码也有一些公司在开始研制编码器产品。所以4K从编码这个角度,到今年年底完全没有问题。我们技术上已经做好准备,未来做技术的角度,我们2023年下一轮要怎么做,国际商ITU做H266的研究,我们国内也有AVS3IEEE1857的研究。这是第一个挑战所做的技术的储备。
第二个挑战是视觉搜索,为了能够精准的推送广告,你要知道用户在看什么,要知道现在画面在播什么,针对用户的喜好,根据现在画面播的内容推送广告,这个就需要视觉搜索。你要有好的搜索方法,视觉搜索中的主要挑战有搜索精度与搜索速度,你现在推出的是包还是游戏机,我们要如何提取具有辨别力的特征;如何高效抽取紧凑视觉描述;如何实现面对海量数据的高效检索;如何满足视觉特征规范化。这就是技术需求,有了这个需求之后,我们可以看历史上有没有相关的工作?
【9:34】高文:其实是有的,在MEPG的大家族里面,我们在座的很多可能会知道MEPG7,这是表述语言,只有表述才可以进行识别、分析、应用,所以从1996年开始做了,做了很多的部分,做了很多PARLS,但是在大规模的系统布局里面用的不是很多,从第一到第五的Parls主要是对对象的描述;到了2001年到2005年做了MEPG7,Parls6到12,当时描述的更具体了,有人脸的描述,再后面2006年之后,对多媒体内容的加密,水印方面的加密;2009年左右,我和一些专家就提出了,今后数字视频的搜索是很大的需求,为了这个需求,特别是移动视频,就是上行的,往上送的东西不能太大,不能把图象拍下去直接送上去,应该往上送的信息很小,所以我们当时就说设计一个东西,我们对于这个CDVS进行研究,到2014年国际标准就做完了,这里面用了什么东西。
【9:37】高文:CDVS的关键技术有五个方面,第一,兴趣点检测,比如说人脸,你怎么把兴趣点找到谁需要算点的操作;第二选择特征,有一些兴趣点有用就要准确选出来;第三局部描述子压缩,就是和我们视频压缩一样,特征也需要压缩;第四局部描述子聚合,哪一些特征更有用,他中间的局部的纹理关系、相对关系是有意义,我们可以通过聚合把有意义的捆绑在一起,这样就更有意义;第五位置点压缩,在图象里面,这些特征相对位置,除了我刚才说的上下左右,另外相对的位置关系也是有意义的,把这些东西也需要保留下来,所以五个技术合在一起,就构成了CDVS的技术。
与SIFT相比他的性能有时有哪些,对于这个加拿大教授发表了一篇论文,后来我们发现利用这个特征有很多问题,过大、过慢,存储的空间也是过大,我们就重新设计了新的描述方法,使得每个性能需要存储、特征大小,1000万幅图象上的特征存储大小,图象对特征匹配、1000万福图象上的检索时间,都可以看到后来的性能改进的对比。
CDVS这个标准也是2014年开始做,全局描述子主要的贡献有北京大学、斯坦福大学,局部描述压缩主要有北京大学、意大利电信以及萨理大学;特征点位置编码主要有华为和一些大学。那么CDVS的应用方面,他已经在百度腾讯平台上使用,而且用在电视节目的摇一摇应用,以前是靠声音判别,只知道你在看,要想推送广告还是有点难的,那么现在只要拍,他马上识别出来你看的什么频道,通过这个可以推送相关的广告问你有什么特殊的需求,可以很好的提供增值服务。APP节目当中优点是据、有综艺节目,有广告方面的应用。可以做智能广告监播的,自动识别广告,监测广告播出。他可以通过这个做监控,通过他可以做大数据平台做个性化的服务,也可以和电商关联。
【9:44】高文:那么在欧盟UHD方面,有的超高的发展和规划,我们拍摄的摄像机的色度空间是比较饱满的,但是以前的显示器是不够,现在随着4K起来以后,人们希望看色彩更鲜艳的东西,以前电视是里面这个小三角的色彩空间地我们希望三角尽可能放大,如果把全部色彩空间覆盖是最理想的,但实际上很难。我们现在具体能做的程度,大家可以看到,我们以后的视频色彩支持到什么程度,这就需要高动态来进行维持。影响现实质量的原因有分辨率、色域、量化、帧速率、动态范围。很多电视也可以支持比较宽的色域,就需要把中间打开,这就需要HDR的技术,原来看的灰蒙蒙的东西,加上HDR就可以看的比较绚丽和真实。现在新投入市场的电视基本上都是4K电视,而且4K电视色域都是比较宽的,总的来讲我们现在就是想能够在发端通过一个变化把很宽色域的东西放到传输通道上进行传输,到显示端再环回去,使得色域的色彩真实的反映出来。国内上五条曲线,由美国的、欧洲的,我们现在想做中国的变换曲线,MPEG和AVS已经开启HDR的标准。
【9:47】高文:今年上个月已经开过启动会地现在HDR专题组已经开始分头工作,除了HDR之外,我们还希望声音是立体声、环绕的,现在的声音还做不到这一点,离3D有距离,就希望做出这样的标准,使4K的东西来了,不仅仅分辨率高,色域宽,这才是比较理想的,我们央视也有一些经验,这些经验都可以帮助我们做出中国自己的3D的技术,涉及广播电视领域三维声节目制作、传输分发、重放的应用,你愿意参与进来我们都是欢迎的,但是得按照组织的规范,我们有不同的组在知识产权方面做了要求。这是整体的框架,这件事情已经开始组织,工作已经开始了,2016年5月完成技术需求、测试方案,工作章程,现在的计划是今年12月份完成标准文本草案,大概是去年2月份就是所有的技术和产品都已经就位。我们大家如果想做这个东西,明年下半年就可以实现了。
VR讨论了很多,投资也很多,这确实是带宽的事,他是以影响的形势模拟现实世界视觉信息,提供用户Anytime等的视觉沉浸感。在细节方面我就不展开了,这里也是有标准化问题,现在也是在进行开展。总结一下,对广电来说,4K是非常好的机遇,大数据可以带来这种个性化的广告推送,个性化的服务,有更多的技术是需要继续研发的,也欢迎大家提出问题,如果需要我们做技术的的人介入可以给我们发信息,我们一定尽量支持,谢谢大家。
【9:52】主持人:非常感谢高文的精彩发言,这两年在我们广电圈子里面有热词是媒体融合,我觉得融合也是大数据的这种价值所在,大数据怎么和媒体和我们电视去做融合,和整个产业做融合,这是我们挖掘大数据的价值所在,只有把这些数据的价值挖掘出来,才可以找到传媒行业这种质量的提升,效益的增加,以及整个传媒产业的转型升级,这是我们开这个会所要探讨的主题之一。下面有请何宗就先生,之前也是中央电视台的副台长,那么在何宗就眼中,大数据和传媒产业的融合点在什么地方。有请何宗就先生。
(何宗就主题报告:媒体大数据价值思考)
【9:55】何宗就:尊敬的各位专家、嘉宾,大家上午好,首先要祝贺中国大数据产业峰会以及中国电子商务创新发展峰会在贵州成功召开,同时也感谢2016大数据与传媒产业峰会组委会邀请,刚才听了高文的报告,确实对我们国家高新技术的应用方面,他们在研究开发了新的压缩编码,为我们未来得编码压缩提供了非常好的帮助,我们多年纠结的就是是用264、还是用265,解决了这个问题,现在我对高文院士和他的团队做出的贡献表示感谢。今天题目选择上我们也是有所考虑,我们请了各专家讨论了一下,究竟我去说什么?他们提出大数据的数博会,同时大数据在点击量和关注度都特别高,所以建议我来说这方面的内容。我在选这个题目的时候,国双的老总和电影学院的教授和在座都是大咖,所以我有点紧张,既然邀请了,我还是把一些体会给大家做一些简要的介绍。
今天讲三个方面的内容,第一是媒体融合发展与新特征;第二媒体大数据的理念与技术;第三媒体大数据的应用与价值。
【9:59】何宗就:我们了解大数据的发展,首先要知道媒体发展的规律和特征。媒体融合已经成为国家的战略,2014年8月18号习近平在中央全面深化改革领导小组第四次会议里面讲了,大家都很熟悉,我就不再重复。我想大家说一下,关于融合媒体的新特征,个性化,用户参与,泛在华,碎片化,去中心化,视频化,移动化,始终在线等,那么媒体经营的重要观念改变有以下几个方面:产品意识,运营意识、用户意识,数据意识和服务意识。所谓的产品意识以前电视台只有内容和节目这个概念,没有内容产品的意识,需要参考互联网他的产品理念和模式。真正打造追求极致的触动心灵的内容产品,我们要强化运营意识,电视台以广告为主的盈利模式是单一,媒体的时代、媒体的经营手段以及盈利模式是多样化的,需要较好的运营意识和经营意识,来长早电视台媒体影响力和商品价值,我们还要建立用户意识,因为我们传统里面,只有观众没有用户意识的概念,我们还要增强互联网使用的电视媒体,真正了解谁是你的用户,所以我们让用户有用户意识,并尊重用户的意见和建议。
【10:03】何宗就:同时我们媒体还要掌握数据意识,大家知道这是数据大会,要有极强的数据意识,数据是未来媒体运营的根本依据,从内容的选择、策划到内容的生产制作,从内容的集成分发到内容的发布与运营,都是要精准的全面的数据来支持媒体周期长的过程。需要对媒体数据有充分的认识与重视,要增强服务意识,大家都清楚,我们的媒体和记者都有一定的特权,社会各阶层对我们很尊重,很尊重我们的媒体,尊重我们的记者,尊重媒体的传媒性,越是这样,我们媒体人就需要有更好的服务意识,服务社会、服务大局,服务百姓,服务用户,在服务的过程中,不断的创造、塑造媒体的新的形象,不断的提高我们自身的核心的竞争力。所以我们觉得传统媒体经营的重要理念要转变。
【10:06】何宗就:下面我还想谈一谈,媒体融合要解决的核心问题。
我们传统是广播电视采、编、播,第二个方面是广播电视节目,最后送达是电视观众,在这样的情况下,传统的方式已经促使我们解决问题,我们首先要解决是广播电视采编播怎么统一汇聚融合生产,我们广播电视节目怎么变成互联网媒体产品,我们电视观众怎么变成媒体用户。要统一的策划集中调度协同指挥,要统一生产与运营,要实现的结点就是支撑媒体融合的技术平台。最终实现组织架构保障,同时我们还要有管理制度匹配,最终实现媒体的综合传播力与品牌影响力。在这样的过程当中,我们要考虑,就是说在传统的媒体上的基础上,要增加新的媒体的手段与方法,并与电视媒体业务的深度融合,构建融合媒体的业务模式。这就是我们要解决的核心问题。
【10:09】何宗就:融合媒体到智慧媒体的渐进演绎这张图,随着数据的积累以及媒体数据的深度分析与应用,媒体逐步走向智慧媒体的新的阶段,从用户行为分析的媒体大数据应用逐步发展到内容深入挖掘人工智能类脑计算,媒体将真正进入高级别的智慧媒体的阶段。这张图对我们未来发展走向很有价值。
【10:10】何宗就:我们想介绍媒体大数据的理念与技术,媒体大数据的使命与核心价值当中,媒体行业的痛点有下面五点,第一,用户是谁?第二,用户在哪里?不清楚。第三,用户要什么,没有信息。第四观众如何变成用户,没有沟通,没有渠道;第五,内容如何准确送达,没有手段,没有平台。媒体大数据能给我们做什么?第一,用户是谁?大数据会帮助广电建立观众与用户的关联,精确的了解用户的特征;第二,用户在哪里?大数据会提供屏幕前、网络上用户行为追踪,全方位定位用户内容消费轨迹。第三用户要什么?大数据会告诉你,基于大数据技术,准确分析用户内容消费偏好,主动推荐,有的放矢。第四,观众如何变成用户,广播与互动融合,双向交互,将单向的观众变为为活跃的粉丝,赋予广电互联网精神。第五,内容如何准确送达?智能推荐,多屏互动,将优质内容高效准确地送达用户。媒体大数据的核心价值实现了创意与节目的匹配,广告与内容的匹配,内容与人的匹配。
【10:14】何宗就:下面了解媒体大数据的服务对象,第一,广播电视台(集团),具体就是新闻、综艺、体育、广告、总编;第二,媒体运营商,有线、IPTV、互联网电视;第三广告行业,广告运营、广告交易、广告投放;第四其他类型媒体,报业、出版、通讯社、互联网;我们最终对象就是用户。
【10:16】何宗就:我们分析一下媒体大数据的数据维度和数据类型,第一内容提供商的内容元数据;第二,媒体运营商运营数据;第三社会化媒体;第四专业数据;第五是互联网数据。那么有编目信息、标签信息、提取信息、引用信息等。引用的信息就是内容的出处等等,我们下面展开数据里面有具体的内容。我们再看看网络运营数据采集对象,里面有互动电视、网络电视、移动电视、传输网络等等;社会化媒体数据采集对象有视频网站,新浪微博、腾讯等;内容提供商的元数据就包括新闻元数据,资料媒资元数据,内容平台元数据,互联网元数据,内容特征提取信息。
【10:18】何宗就:媒体大数据平台参考框架我想谈一下,分三大块,电视台以及相关单位要做的,包括电视台广电网络公司还有其他媒体机构需要考虑推进的工作,首先要把自身业务的系统数据根据应用的场景进行数据的可视化的开发与优化,同时要统一数据接口,为数据的应用奠定基础,要建设媒体自身的大数据平台。行业内建设部署媒体大数据的服务平台,这部分包括几方面;可以充分进入第三方的数据平台,数据处理平台,第三方的数据处理平台的能力。我们就是用第三方数据为媒体技术服务,我们通过企业、公司来推进这方面的工作,更好的服务我们媒体机构。
【10:21】何宗就:关于媒体大数据的应用与价值,我们想媒体大数据第一,广播电视台,包括新闻、综艺、体育、总编、广告;每个分项里面的要求,搜集、汇聚都是不同的,有不同的需求;第二媒体运营商包括有限、IPTV、网络电视、互联网电视等等;他里面的内容基本上都差不多。第三是广告商,广告运营公司,广告交易公司,广告投放企业。他的应用分析是不一样的。
【10:22】何宗就:我们现在举一个例子,就是样式媒体大数据应用实践马年春晚,通过全网、全程、全量、全维度的进行分析和挖掘,大数据有那么多的信息进行作用;央视媒体还有世界杯的报道,做了大量的工作,他们在数据检测、分析报告、节目制作、节目传播、广告检测方面做了多方面的工作,所以我们要感谢国双公司对我们的支持。那么可以总结出来实现了媒体多维度的交互呈现;引入数据分析辅助节目制作;实现了受众精准定位分析,对节目互动进行了检测与分析,对广告传播效果进行监测分析,数据掌握了观众的情感变化,对节目热度进行了追踪与监测,有效的加强节目的宣传推广。
【10:24】何宗就:基于媒体大数据的智能服务平台获得中国电影电视学会科学技术奖一等奖,应用单位是中国中央电视台。所以我们对于企业是非常重视。我们总结起来归纳,国内媒体行业大数据应用的情况,基本包括六个方面,栏目实时收视、终端的概况、每天访问人数、直拨收视分析,点播实时分析,栏目实时分析。在国外媒体行业大数据应用的情况,Netfix公司每天重点是电影、音乐等方面,可以预测观众的流失情况,还可以通过用户的信息来挖掘决定内容再生产,就是看老百姓喜欢什么,通过这样的来生产他的节目,《纸牌屋》是最有影响的,通过挖掘决定他的内容继续生产,现在已经有第二季了。另外通过用户的社交关注来决定内容的引进,李克强总理在昨天讲话的时候就说我这个西装是国内生产的西装,人家就问了,你们通过多少个调研怎么来做服装,中国人穿的服装更加合适,他们说我们通过几千多个进行调研,这个大数据应用的案例和总理昨天举的是一样的,通过我们大数据的调查最生产什么类型的节目更吸引人,通过什么节目收视率最高。最后媒体大数据的建议,现有技术平台加强数据可视化呈现;现有技术平台封装数据交互接口;通过新媒体广泛搜集用户行为数据;规划构建并应用媒体大数据服务平台。以经营基本单元为主体尝试大数据应用;通过媒体大数据实现媒体精准服务。
【10:28】主持人:谢谢何台,我觉得他也是从这些角度,把整个传媒从大数据联系哪些,能够梳理出传媒和大数据的关系,把整个系统进行了阐述,从他的发言当中可以看出,整个传媒的人应该关注的是观众受众的喜好和偏好,只有在碎片化的时代,抓住他们的喜好和偏好,提高传统媒体机构的传播能力,再次感谢。下一个有请北京电影学院大数据研究所所长张锐。有请。
【10:30】张锐:尊敬的高院士,尊敬的何台,向局,还有谢台,各位嘉宾大家上午好。感谢中广互联的邀请,今天的演讲主题做了一个调整,我今天题目是互联网+和DT时代的中国电影产业。
昨天到贵阳看数博会觉得非常可看,在外人看来做大数据不占优势的地方,现在恰恰做到这样一个情况,非常好。在仅仅一百年,犹太人跑到加州发展好莱坞。在这里发展大数据一样的,空气干净,没有雾霾,很凉爽。现在的贵阳有点像一百年前的好莱坞,马云说三十年前应该投资深圳广州,现在应该投资贵阳。未来贵阳是否能够带动大数据的发展?贵州广东能否带动传媒大势的发展?提出这么一个问题,再过几年一起看一下。
主题分为三个部分:一个是我给中国电影产业做一个汇报。第二互联网+与中国电影产业的关系。第三,大数据在电影产业中的应用做一个汇报。
(张锐主题报告:“互联网+”和DT时代的 中国电影产业 )
【10:33】张锐:这个图是中国电影产业的一个产业链,它的主要产业链条结构应该是制作发行和放映,包括一些延伸的东西,这个是主要的产业结构。15年中国电影的票房440亿,今年肯定突破500亿,而且他是增长速度最快的,从10年开始中国电影实际上所有传媒行业当中发展最快的一个板块。我们说影视影视,目前发展最快的还是电影,基本上年均四十,五十,资本市场发展非常的敏感。我们看到电影产业最重要的一个指数观影人次,也是增长非常快,15年是12亿,中国人每个人每年会看一次电影,而且这个观影人次增长50%,还有一个情况就是小镇青年的崛起,还有大学生,90后,2000后,还有一个趋势中国电影虽然增长很快,未来的市场空间依然很大。人均观影的次数来看,北美现在是4到5,我们还有一个黄金的十年。我们看到具体的内容来说,15年的票房排名前十的电影,有一个特点,实效突出的,还有一个就是动作科幻,还有一个是动画片发展也很快。我说一下这个概括,首先是一个朝阳产业,现在中国的资本市场,好的影视实际上大部分是民营企业,很多国有电影长都破产倒闭,完成了一个很好的市场化改革,包括发行方方面也是一样的,完成了一个朝阳产业的转型。第二个行业跨界,美国通过行业学会有一个比较高的行业壁垒。第三个就是在未来它的产业集中度会增加,未来早晚有一天像美国好莱坞一样会变成这种局面,路径肯定跟美国不一样,中国目前还是一个电影和电视分立的局面。第四个就是面临的BAT的威胁。
【10:37】张锐:我们虽然票房会超过北美,但是是一个非常不成熟的市场,中国的国产片子生产质量大部分是靠爱情片,靠一些制作比较粗糙的片子,后期制作很差,还是一个小作坊的,而不是一个大工厂的生产体系,目前的真正机遇还是在国产片,比如说前一段的《北京遇上西雅图》因为它讲爱情,讲感情,这个是我们的强项,科幻不是我们的强项。再看一下这个好莱坞的6大影视巨头,是一个产业结构非常全的,基本涵盖了从平面媒体到广播,到电视,到新媒体,除了硅谷那些公司进不了,跟中国的产业结构完全不一样,中国肯定要走一条跟北美不一样的数据,我认为主要是靠互联网+跟大数据。
【10:39】张锐:第二个部分汇报一下互联网+跟电影产业的关系。这是昨天的一个,克强总理的讲话,现在是国家战略地位,这个不说了。互联网+的几个关健词,中国已经成为仅次于美国的全球第二大互联网市场,跟电影产业是相配套的,而且GDP占比也是越来越大。还有一个问题,我们虽然大而不强,实际上传统产业很落后,改造空间非常大,这个是互联网+的机遇。具体的我们传媒产业看一下,实际上也是刚才何台讲的媒体融合,也是互联网如何+传统媒体,+电影,+电视,+有线。还有我们看到BAT三大公司,从阿里到腾讯到百度,基本上对于产业链的每一个环节都有BAT的身影,这个跟电视环节不一样的。
【10:41】张锐:第二个背景,就是第四次工业革命,昨天听了一个分论坛就是讲工业互联网的,工业4.0,工业革命。然后就是我们面临一个信息革命的大背景,具体到传播来说,传播史面临五个阶段,现在是第五个阶段,从传统的广播电视已经进入到一个互动式的一个新媒介。
【10:42】张锐:还有一个趋势就是移动的浪潮,这个标志点应该在12年的年终,实现从PC互联网时代到移动互联网时代,这个转型不是一个简单的跨越,而是一个非线性的超越,借助互联网进行弯道超车。这个是我们的跨界跟融合,我们看电影,电影的生产已经云化,大量用云计算,管道开始互联网化,第三个就是终端的智能化和多屏化。产业也是发生大变化,以前简单的广播电视升级,未来变成一个移动产业升级。我们将媒介形态发生变化,我们的RADIO变成AUDIO,我们很多通过一些荔枝来收听,这个也是一个重大的冲击,包括未来的车联网对这个广播也是一个很大的冲击。第二个就是TV向VIDEO转变,然后就是媒介的变化平台模式,然后就是电影,他们认为VA,AR会颠覆电影,这个也是一个很大的冲击。这个对整个边界和划分都发生了很大的变化,广电是什么?什么是广电?边界越来越模糊了。
【10:44】张锐:再讲几个趋势,跟电影生产相关的,有将近七个,一个生产是从B2C到C2B的,基础是互联网,互联网+跟大数据对传统经济学,经典经济学的转变等等一个深层次的变革。第二个趋势就是整个电影行业的创作中心在发展前移,这个趋势非常明显,我们看到在电影行业,在电影创作剧本阶段开始介入到一些用户调研,这个趋势非常明显,重心前移,我们拿这个《爱情公寓》当时做的时候关注社交网络来做一个调整。包括现在很多国产剧,包括爱奇艺的一些网剧也是一样根据大数据做调整。包括这个《煎饼侠》取得这么高的票房。第三个就是电影制作进入一个全民时代,跟C2B是对照的。今年的一个最大的热点就是爱奇艺首推的网络大电影,我的学生每个团队都拿到150万来做这个,这个跟以前不一样,这个就是因为他的传输渠道突破了院线发行,有网络发行,资本市场有热钱,一个学生可以拿着100多万的投资可以做一个电影在网络发行,电影制作进入到一个全民制作的时代。还有包括一个众筹模式发生一个变化,这个不再举例。
【10:46】张锐:还有一个趋势就是说,一个现象,这两年的导演,大导演开始失灵,大明星开始失灵,为什么?也是跟趋势相关,很多比如说这些导演,比如说大鹏,从来没有导过电影,一下就十几亿的电影,像一些大导演,大明星的片子反而达不到那个票房,这个是一个新现象,很多东西变得不可预测。生产领域看到,昨天展馆看到很多公司做无人机,包括大小都有的,还有表演的,这个图是我在电影学院门口拿手机拍的。内容生产的智能化这个趋势已经出现,包括VA和AR,很多场合需要机器人的,这个是一个重大的趋势。
【10:47】张锐:第五个趋势我觉得,具体到互联网+的话,对中国电影产业的影响就是,开始从消费互联网到产业互联网的一个升级,这两年我们在电影产业最火的几个领域,电子票务,网络发行,市场营销,每一个电影都经过互联网营销,从消费互联网进行营销和影响,今年看到生产领域也进来了,所以说这个影响,标准是什么?我们从互联网对整个产业的影响,从消费互联网进入到一个产业互联网,昨天专门听产业互联网的新论坛,听到底有什么变化?
【10:48】张锐:第六个影响,就是说人才的影响也是非常大。比如说以前传统的做广播电影电视的人,大部分人从中传,广电毕业的,现在电影学院发现特别明显,单独学这几个专业,未来就业成问题了,需要一个复合型的人才,需要懂这个,还要懂别的,未来是创客和极客是最需要的,包括广电行业,电影制作,爱奇艺都是一样的,包括电影教育也是一个大的变化。
最后一个是探索中国电影的工业化路径,这个是一个非常大的课题,中国的电视肯定做不过美剧,电影也做不过好莱坞,因为你没有实现工业化,什么是工业化?这个是大课题,中国可能利用大数据,利用互联网+进行弯道超车。
【10:50】张锐:第三个部分具体汇报一下大数据在电影项目中的一些运用。这个概念不再累述,在没有大数据出现之前,美国好莱坞重视数据市场,比如说当时《乱世佳人》这个片子,也是通过一个数据来实现一个改变,也是类似于我们的CTR,而且也成就了一个美国的调查行业。在美国实际上除了这个之外,基于社交化媒体的最早的应用就是谷歌,他曾经做了一探索,互联网都有他的公开的文章,学术文章是发表过的,做了一个探索模型。
【10:51】张锐:大数据在电影项目中的应用分几个阶段,一个是投资立项,如果做一个电影项目需要事先经过预测,是否有价值投资,这个对投资人非常有用。然后在创作的时候有很多应用,包括真人秀的一些改变,广告植入,团队的组建,明星的选择,导演的选择都是。这个案例刚才何台讲过,不再重复,这是一个经典的案例,当年是有背景的,他为什么推出这么一个新闻,他是为了做市场,就是为了跟好莱坞竞争,我比好莱坞做得好。然后我们看到实际上在美国的学界,包括06年在美国已经用了这个蒙特卡罗(音)的模型,在中国没有,大部分是靠圈子文化,赌导演,赌演员。
这个案例也是,包括英国很多做项目的,也是靠语音分析做这个预测,中国到现在至少产业界没有人做,做得很少。阿里巴巴的余额宝做过一些探索,实质本身还是一个保险产品,跟后台是脱钩的,阿里巴巴做的余额宝,实际跟阿里影业是脱离的,这不是一个很成功的尝试。包括这个三体也是当时做这个尝试,包括前期给电影起名字都用社交媒体的案例。
【10:53】张锐:电影创作领域,有一些文学改编,包括阿里影业做了一个改编电影,也用了很多数据分析,这个不是很出名。还有一个盛大系统,他是一个最大的平台,用的很多数据在做。我们看到一个成功的案例就是爸爸去哪儿,从典型的综艺节目变成院线电影的案例,当时是北京一家数据公司专门挖掘社交媒体的数据进行分析,分析人群,包括很多的数据,这样的话有什么好处?为排片定档提供很大的优势。冯小刚的电影肯定偏北方,很多明星跟电影的地域不一样的,可以做一些排片,包括地域的偏好。还有一个案例就是《老男孩》改编成一个高票房的电影,也是典型的利用数据分析。我们看到还有一些数据画像,很多大学,公司做这个。我们看到《北爱》这个很多都是做过数据分析,广告植入做过很多的分析。演员的选择和导演的选择都做一些匹配分析,国内做得比较好的还是华策,每个电视剧做之前对所有的主演和角色做数据分析,包括社交媒体,自己数据库的分析,包括出分析报告,最起码可以阻挡一个很烂的片子出现,但是有可能会阻止一个黑马片子的出现,但是会稳当。
【10:56】张锐:这个排档,一个晚上的排片可能直接影响到一个周末的票房,一个周末的排片可能会影响这个票房是一个亿的区别。这个排片非常重要,他们一直在营销的过程当中对数据进行调整,我们看一下这个《后会无期》包括《小时代》也是一样的,95后的,三四线城市的高中女生。这个是社交平台,刚才何台的表格非常清晰,不再展示。很多这些电影都是靠口碑,包括脑残粉,为什么说脑残粉,也是根据数据分析出来的,三四线城市的高中女生,非常痴迷。这个是一个营销模型。
实际上在一个电影项目运作当中,从立项到策划,到制作到排片,到最后的发行和营销,都有大数据的身影,在所有的传媒板块当中,电影行业用得最充分,跟行业市场化程度是紧密相关的。
给大家就汇报这么多,谢谢。
【10:59】主持人:谢谢张锐教授的分享,因为他本身是电影学院的人,所以对广电的东西也比较了解,我觉得从他的讲述里,我听到一些东西,从电影这个圈子里面看,对大数据的应用,要比电视这个行当要应用得广泛一些,因为发现营销里面,都去植入这些东西了,在座的多数这个圈子的人,我觉得在座的更深刻的体会到我们整个大数据这个时代的来临,对我们整个行当的冲击,这种变迁,大家有忐忑,更多的面临机遇,刚才的专家也讲了很多案例,下面就邀请续扬先生来进行发言。
【11:02】续扬:现在媒体分众化,内容开始碎片化,大家在上班的时候,每天坐在一起,看的节目可能不一样,很少有节目能让全家坐在一起看了。同时我们所有的内容在互联网已经出现了,我们有声音了,每一个人都是自媒体。喜欢的,不喜欢的,我们都可以发表我们自己的意见,今天我们都可以采集对我们节目进行回馈。
所以我们今天发现用户圈层化,商业社交化,因为今天我们的用户在阿里巴巴这样的公司,已经产生大量的个人用户的画像,因为我们在淘宝上购物,今天我们买的东西在淘宝上购物,知道你在哪里工作,知道住户的地址,一个家庭消费的用户画像就出来,你家多少钱,你是不是买了理财,你是不是用支付宝,消费能力都可以知道,所以一切都对我们的用户今天数据的信息可以采集,我们可以描绘出我们用户每一个人的行为是什么,这就是我们今天看到的消费个性化,他可以推送给你相关度非常高的商品,这是你在购买的时候兴趣的点。
(续扬:互联网思维推动广电媒体融合)
【11:05】续扬:今天互联网这些企业,他在运营的过程当中,最大化的运用了用户的数据,我们再看我们自己有什么优势,我们的视频、新闻都是我们的优势,因为我们打造了几十年最专业的团队去创造,新闻是立台之本,我们有我们的影响力、公信力,再加上传统广电和媒体融合是最核心的事情。今天我们的传统广电在这个时代,已经服务了很多家新媒体,帮助我们去获取我们用户的行为,去了解用户的需求,用户到底看我们的视频,我们怎么把这些东西和我们今天强有力的竞争力,我们视频的制作,我们新闻的制作融合在一起,这就是我们今天非常重要的课题,所以我们认为传统广电视频为我们的主体,新闻为龙头,最核心的是用用户的行为为中心,核心融合在一起,才可以让我们广电产生第二次的飞跃。
【11:08】续扬:今天在大数据时代的应用跟大家分享,我们到底用用户的数据和我们视频结合起来,让我们视频制作的过程当中能够更符合我们用户的需求?首先我们要感知我们的用户。我举一个最简单的例子,也许在座的女士就在网上买过兰蔻的眼霜,右侧是限时购买,我们用户是不是他所期待的购买,我们今天整个网页上,叠加了用户点击行为的热地图,是左侧,并不是他所吸收的右侧,外国公司进入中国市场,他是不是了解用户的行为和需求?一再申请改版,今天热地图出来以后,同时流量提升三倍,这就是我们今天在以用户为中心,了解数字背后用户需求的时候,你怎么做我们企业的运用。
【11:11】续扬:我下面举一个例子,我们在为湖南卫视《爸爸去哪儿》我们通过互联网的行为,发现很多有意思的事情,在节目开播前,我们知道谁是我们最喜欢的演员,一定是林志颖、田亮、王岳伦,我们拍摄的时候一定会给最多的镜头,在第4期的时候,我们给了很好的建议,在新媒体观看视频的时候,因为你在用手指和内容产生交互,看到张亮的时候大家在回看,同时在互联网上进行热议,这都是今天互联网大数据让我们了解用户的需求,我们剧组实时迭代,立刻调整给他最多的镜头。这就是大数据技术帮助我们节目制作,可以清楚的看到《爸爸去哪儿》他们在观看这个视频的时候,哪些片段是他们喜欢看的,哪些是他们不喜欢看,我相信每一个人都是有这样的行为的,凡是回看的都是跟孩子有关的,拖拽的都是跟父亲有关的,我们导演做视频的时候,靠的是多年的专业,但是有的时候大数据可以应证我们的决定是不是对的,如果验证是不对的时候我们可以用我们的专业去迅速的迭代。
【11:14】续扬:我们再看我们怎么通过用户的需求跟我们新闻融合在一起,首先我简单举例,今天数说新闻的时候,在农业部做了简单的视频,大家可以看到,这是当年全国农业病虫害发布的疫情随着时间推移的过程,所呈现的趋势,在冬季是病虫害低发期,到时间的推移,12月、1月份的时候,江浙地区就开始冬季油菜蚜虫发病期。今天在这里也可以呈现出北方地区下级农业病虫害就开始了,整个今天我们在制作新闻的时候,怎么能让更多的年轻人,更多的受众喜欢看新闻,这是我们今天让国双希望通过数据可视化呈现,把复杂的数据我们处理,前面大家看的时候是赏心悦目的时候,这是传统广电在做核心内容的时候,一定要考虑核心的受众他们的变化和需求。
【11:17】续扬:再举例说,今天做新闻的时候,怎么通过内容来了解受众需要的是什么,做出什么内容能够让他们及时的回馈与交互。当年雅安地震发生的时候,每24小时给最高的领导层上报应急的报告,因为从雅安市政府的网站到国双的代理,成都市都加载了我们数据的代理,所以我们有政府网站全样的数据需求以及互联网的需求。那么在24小时、48小时我们递送报告的过程当中,根据四川省政府开辟了雅安专区,上面呈现最新的内容,如果没有这些报告,我们上面的新闻一定是党政府非常关心的,全国人民心系你们,大家别慌,我们传统的模式就是这样,可是我们数据分析之后,我们实时知道当地的灾区人民,随着时间的推移心理的诉求是不一样,24小时的时候关心的是有没有余震,到哪里避险,48小时道路畅通问题,救援部队的进展问题,那如何我们能够今天通过海量的数据分析出来,我们用户在灾民的心情随着时间的变化可以把握好,我们能够第一时间传递出我们官方的有公信力的,有影响力的内容,他能够接受信息之后,平复自己内心焦躁的心情,也许我们真的预防了很多有可能的混乱和自身灾害的发生。
【11:20】续扬:我今天时间不多就举两个例子,怎么从业务层面怎么通过大数据制作视频,怎么通过用户的数据去制作新闻。那么在管理层面怎么对数据的融合怎么对领导去进行决策的支持,因为领导要面对各种各样的数据报道,每天看得头昏脑胀,新媒体的点击行为等等,今天通过这样的系统能够让大家分层级,每个部门的人观看的权限,实时的让大家看到全台的收视率是什么,每一个频道是不是达标了,我们可以看到IPTV的数据,他是一个大样本,今天我们传统广电提供内容,我认为大大被低估他的价值,因为我们用户被分流了,我今天本本没有在电视上看这个内容,我今天就是在APP上看了一个新闻,所有今天在我们的考核体系里面并没有被加强,我们今天希望通过这样的开放式的平台,让我们的领导层可以有全局的把控,从今天必须的看的,我们如果机制好的话,我们有线电视也可以上,我们可以看视频的数据,微博上的状况。我们今天希望通过用户的数据以及多种多样的数据,聚合在一起,能够呈现在一起我们今天,我们广电内容真实和客观的价值,今天我讲这么多,基本上都是一些应用,更重要的是我要跟大家分享一下,我们一定要有方法论,一定要自己的根。
【11:23】续扬:我们今天在以用户为中心的时代,新媒体给我们产生了巨大的价值,最核心的是要有数据,一定要采集数据,因为今天多个终端,IPTV、APP,需要多种的采集代码,你把地基打好,上层的建筑才会盖好,有了数据之后放到大的数据融合中心,因为这些数据融合进去可以把广告的数据各方面的数据都融合在一起,最后让我们数据产生价值,让业务分析可以有强有力的数据的融合,把我们的数据以及用户进行打通,我们的用户和我们的内容进行打通。我们通过所有的数据再次通过不同的维度让我们台级的领导进行决策,可以瞬间的迅速的了解下一步的方向是什么。同样还是这个数据,因为用户跟我们有更多的内容的交互的时候,我们产生用户的画像,我们描绘出用户的需求是什么,并且可以精准的推荐喜欢看什么,这也是在北美最流行的说法,能够让你个人推送最喜欢的东西,以及我们未来有这么多的数据积累之后,可以为广电做收视的分析。所有一切都应该有方法论,最终实现我们广告的收入整个形成闭环,我们这些数据最后给我们产生什么价值。习主席讲过以新技术引领媒体融合发展,驱动媒体转型升级。所以国双也是这样的大数据公司,我们希望通过创新技术,来助力我们打造新型的主流媒体。
【11:26】续扬:我简单介绍一下国双,我们的CEO只有32岁,但是公司已经成立十年了。国双是分布式的求和的意思,我们2008年的时候,我们为什么进入广电行业,是因为我们2008年的时候就获得了微软的48000家的创业企业的大奖,当时做完之后都不知道去哪里用,当时之后我们知道用到新媒体,2012年国家发改委和国家信息中心和我们共同成立网络政府研究中心。这是我们上个月,通过国双的语音的处理技术,为最高人员法院实现律师做案例判决的时候,进行案情的比对,这是周强院长。同时国双也是超过600家世界的大的平台以及客户,都是我们服务的对象,我们今天有20多家省级电视台,600家商业客户,3500家政府做服务,今天是利用大数据的技术为每一个垂直的行业,提供相应的应用,让大家能够真正享受到数据给我们带来的高效以及智慧。
【11:27】主持人:我们确实还是有像国双这样的落地公司为我们整个行业做合作,CTR在传媒行业都非常了解这家公司,我们非常容幸的邀请到了CTR媒体融合研究院的秘书长吕正标先生,请他为我们做一下媒体的数据能力构建的思考。
【11:28】吕正标:尊敬的各位领导,大家好,站在国双做这个演讲还是比较有压力,因为CTR是公认的小数据公司,我们是通过小数据来进行调查的,那么在大数据时代,小数据公司如何生存,我们今天简单的做一下简单的分享。去年的8月18号,联合成立了一家,站在传统媒体立场上的,专注于媒体融合的研究院,当时最基本的出发点,是我们看了这几年的研究,我们发现有一个现象,是让我们感到不安的一点,就是“唱衰”,甚至来自传统媒体从业者,我个人觉得有两方面的压力,第一是受众的老化、人才的流失等,另一方面是对大数据、对云计算、对互联网所有的技术,传媒认识是不可能在下一个时代拥有的,所以这两方面的反思和恐慌导致我们自己的人对我们自己发展前景的,有人说没落的判断,有人说衰败的判断。这个声音整个业界是非常微弱和微小,所以要站在传统媒体上冷静的思考,到底还有没有别的路径。
(吕正标主题报告:媒体的数据能力构建)
【11:31】吕正标:回到今天大数据的主题,值得反思的问题,传统媒体有没有可能成为大数据的机构?事实上我们认真反思就可以得出另外不同的答案,取决于你能不能获取用户?能不能获取用户数据?能不能拥有数据能力?那么第一个问题传统媒体能不能获取用户?我们觉得传统媒体在用户的获取能力上是不弱于互联网的。电视媒体依然是拥有第一受众群的媒体,当然我们可以反驳它,你的这个数据,你的受众无法获取数据,但是我们必须承认的,全国电视人口约12.78亿,网民是6.88亿,另外网民每日上网时间225分钟,低于电视观众收看电视251分钟。从单体日到达人数来看,电视媒体不逊于互联网平台产品,可以看出,每天的网站可以到达的数据,右边是电视可以到达的数据,单体的电视频道不逊于互联网媒体。从吸取用户、获取用户信息的能力来看,电视依然强劲,在春晚上,腾讯和春晚合作,获得1.2亿人的参与,2000万新增微信用户,1000万新增绑卡微信支付用户。
【11:34】吕正标:那么和支付宝合作,支付宝是为了获取社交关系链,最新的数据表明,在这次2016年的春晚当中,支付宝获得了11亿对友好关系的数据,同样是这是传统的电视栏目。所以我们基本可以看出,现在传统媒体依然具有强大获取用户的能力,当报纸不再是报纸,而是成为一个集成各种生活服务的平台。当跨屏、跨界、多屏、互动已经成为传统媒体标配的时候,我们是不是具有这样的能力。
传统媒体能不能获得用户数据?我们觉得传统依然沿用覆盖思维,而没有建立用户数据思维,我们依然在追求我们是不是到达哪里,我们没有站在互联网的思维上来反思传统媒体欠缺的地方。在单向传播、用户不可回溯方面,相对于互联网是比较大的弱项。大用户给我们的是男女性别、收入水平,是一个群像的数据,那么在大数据方面可以拿到收入信息等方面的信息,所以在这方面还是比较欠缺的。我们现在还在单一接触界面、单一场景数据。
【11:37】吕正标:传统媒体能不能拥有数据能力?这是美国说的一句话,传统媒体在这方面并不低于互联网的方式。我们简单分享一下现在比较流行的大数据方面的反思,比如说今日头条,我个人认为,今日头条给了我们选择新闻的另外一个方式,而不是传播者说什么,我们接受者就接受什么,有一个问题要反思,我看过了,就一定是我下一步想看的吗?我浏览的网页还是我还想流览的吗?今日头条对于你已经浏览过的网页就是你未来想看的吗?第二个新浪微博,你关注人喜欢的就一定是你喜欢的吗?第三就是广告的精准推送,我个人有这样的消费体验,我家里要买冰箱,我及时把冰箱行为买完之后依然还推送冰箱,这样的推送还有意义吗?所以在大数据应用能力上,无论是互联网、还是传统媒体都是起步的阶段。
【11:40】吕正标:我们另外反思的,拥有大数据并不是意味着拥有全数据,都无法解决我们对全量数据的用户需求,摆渡拥有搜索的需求,阿里巴巴社交、移动的需求,腾讯用户关系数据和基于此产生的社交数据,所以全量数据在我个人看来,在一定时间内,只能依赖于抽样调查才可以获得。
所以说我们的抽样数据是模糊的,但是全量数据是局部的,但是真正清晰的用户画像我个人觉得是抽样数据加大数据。
在纸牌屋例子方面,纸牌屋是因为大数据而成功的吗?纸牌屋并没有违背以前成功的法则。在精准传播、精准营销方面,大数据是不是具有唯一价值,这也是我们要思考的。那么在广告、导流、卖货方面是不是只有这三种方式是大数据的变现方式,曾经看过一篇文章,你们不要指望大数据变现,大数据是为了生态做贡献,但是真正的商业不是为了这个而做贡献的。我们一个简单的结论是传统媒体不缺成为大数据共了的可能的,传统媒体确实的是数据思维、数据运营、数据挖掘、数据变现的能力。这方面个人得感受是传统媒体和互联网媒体拥有同样的机遇和机会。
【11:43】吕正标:我们对传统媒体有个人的反思,希望传统媒体要接受渠道的影响力,不像以前那么强的事实,安心的回到内容提供商的本质上面,我个人不这么认为,我从来没有把自己定位在单纯的内容提供商的定位上。我们现在回到商业的本质,或者是传播的本质上,传播真的是因为渠道而决定的吗?我们个人觉得,是不是有另外一种,传统媒体融合发展的可能性方式,我们只抓两头,放弃中间,怎么来表达?原来的方式互联网时代,得用户者得天下,实际上还是另外一句话,得用户渠道者得天下。另外是追求品牌的发展,一线是挟流量以令诸侯,现在是用品牌的忠诚度而令诸侯。我个人觉得更适合传统媒体基因是依赖于几十年积累下来的与观众、受众之间的情感认同与情感联系;依然是民众在重大事件和重大信息发生时的首选信源渠道;依然是最具有公信力、权威性的可信渠道。这是我们最应该去依赖的基础,我们传统媒体来做互联网,到底是互联网重建传统媒体,还是利用传统媒体的品牌资源,按照互联网思维的方法去做互联网,这是两种完全不同的路径。
【11:46】吕正标:所以这是品牌当中有一个观点,未来有可能两种品牌的路线,一种是更多新创品牌的出现;第二是传统的强使品牌通过移动互联网以更低成本与粉丝保持互动,加速品牌的商业民主化改变。我们想一想,第二可能性就是线下数据的信息化,我个人觉得线上数据时机已经过去了,新机会在线下信息的“数据化”,在当前国内互联网竞争的开放程序下,想在大小巨头的产品版图中求生就得靠数据化。
传统媒体的机会还是在自身,一方面是内容,另一方面是用户,在内容方面,从IT到DT,这才是传统媒体要思考的点。
【11:48】CTR用户运营支撑平台,让数据成为媒体核心资产。我们做了一档节目,但是没有想变成自己的用户拿到数据,所以要解决用户获取、用户运营、用户数据、价值实现。通过各种渠道,比如说频道节目官方微博、微信、官网导入不同渠道中活跃的碎片化受众。第二用户的具像化,我们可以通过快速调研,趣味调演,用户活动,粉丝见面会,话题讨论等形成碎片受众的互动行为,增强受众与媒体的黏性,获得用户全面信息以及需求,行为数据。对大头来说,这些数据我们是拿不到的,因为他们认为这些数据是以后的资产,那么我们用传统的方式调查方式,向微博公众号发问卷,给八个问题通过多次的回答,来获得社交信息、购物信息,我们正在尝试,这也是我们愿意用抽样调查的方法用在大数据获取,看能不能有另外一种全样数据的可能。
【11:50】吕正标:第三就是用户的标签化,我们都在做这方面的尝试,在用户画像上或许有更大的人力可以贡献给大家。
第四我们会对用户进行分层,对他们的品牌知晓、品牌熟悉、品牌购买等方面进行分层,我们会通过归群,在线问卷调查,在线零成本的获取方式,从而获得他的基本属性、社会、生活属性,行为习惯等。最后可以给出关联,社交的信息面的关联,这也是我们平台需要重点打造的核心的竞争力。
【11:53】吕正标:最后是价值的多元性,我们在做研究课题,我们目前还没有拿出具体的评价体系来,但是我们认为给出一个保单是最不合理的方式,我们不应该让省级媒体去和中央级媒体去做流量和用户量做对比,甚至不应该拿贵州和湖南做对比,以后用户量是不一样的。我们应该在互联网的时代,能够给用户多维标签化和画像的前提下,怎么不能给产品给出多维标签。最后我要讲作为小数据公司,我们正在强调和呼吁的就是媒体行业数据的融合,“四级混合覆盖”的发展模式正在电视媒体的互联网布局上重新上演;跨屏数据的融合;现在的互联网企业包括传统媒体自身,我们还只占有接触面的一小面的数据,事实上这些数据都是孤岛的存在,所以融合是我们下一步的方向;跨越数据的融合,数据更大的价值在于“外部价值”。数据开放计划,有电视收视率、广播收听率数据,我们内部也在做数据融合项目,是想CSM全国省网样本和全国城市样本的数据进行融合,最终想给传统媒体解决问题,一个喜欢看《爸爸去哪儿》的人买牙膏的时候最喜欢什么品牌,在超市消费的时候,钟爱什么品牌,这样我们希望在广播的前提下,能够提供精确的消费方式。
【11:56】吕正标:我们的数据融合只是一个开始,希望通过这样的尝试发挥小数据和大数据两者各自属性、各自方法的要素,给出一个对于用户和消费者全量数据画像的可能,所以最后有一个呼吁,传统媒体完全有可能成为大数据的公司,但是并不是像成为国双那样的技术公司,但是传统媒体千万不能在用户数据上,或者用户数据运营上假手他人,因为那有可能是我们重新发展的最根本的根基。
【11:58】主持人:谢谢吕正标先生的分享,进入下一个环节。
【11:59】徐江山:各位领导、各位来宾,大家好。今天讲的是广电大数据节目推荐系统算法研究及应用。主要从八个方面,推荐系统总体概率,推荐系统总体架构,用户特征提取,节目特征提取,推荐算法,系统性能评价指标,系统的自学习更新机制,节目推荐系统的实践与应用。
首先是广电大数据节目推荐系统算法研究及应用的意义,当今广播电视正出在数字化浪潮中,视频服务从提供点到多点广播的大众服务,从点对点的交互对等服务到点对点的交互个性化与点对多点广播的窄众的服务。
(徐江山主题报告:广电大数据节目推荐系统算法研究及应用)
【12:03】徐江山:在电子商务、电影视频、音乐、社交网络、阅读都有他的应用。youtube主要是用Google训练推荐算法,从2008年就开始引入视频推荐技术,其60%的视频点击量来自其推荐功能。Netflix深度优化推荐算法,用大奖赛以提高其推荐引擎。Jinni是以色列的公司,基于语义分析技术的挖掘和推荐引擎,从节目的简介、评论中提取节目娱乐基因并以此为基础进行节目推荐。其独有的节目基因推荐算法能够为运营商带来10%以上的额外营收。
爱奇异也用了推荐引擎,在广电内部,深圳天威2008年推出Mytv系统,通过对用户收拾数据的分析,实现了热播排行、当前推荐、全日推荐的服务,杭州华数也是后面开始做的。
广东省广电网络2015年湖东运营平台上线搜索推荐系统,目前服务的用户量120万,可提供个性化推荐服务。
【12:06】徐江山:推荐系统总体架构,我们作为数据电视节目推荐系统,主要是四个功能模块,用户特性文件模块,节目特性文件模块,合作过滤模块,推荐模块。节目特征描述,基于内容的节目特性从节目分类,节目制作信息来定义,节目内容信息、节目播出信息等几方面来描述。用户特征描述,用户特征的模糊表示,初始用户特征的获取,用户特征文件的自动更新,其中有显性反馈、隐性反馈,长期监测他的收视记录,通过算法来汲取他的用户特征。这两个特征是相辅相成的,更多是描述用户长期形成的信号,但是显性特征可以从忽然的转变可以形成的。推荐系统要如何敏感的知道转变,所以要非常明确的显性特征的定义。推荐机制基于向量相似度的推荐,有距离定义、余旋定义。我们推荐的东西是不是用户想要的,所以我们系统性能评价机制当中,有平均绝对误差、标准离散误差、推全率、推准率、ROC曲线的考察指数。
【12:10】徐江山:那么用户特征建立当中,显性用户特征基于分类人群收视率社会调查的特征提取,能够解决用户出事特征的缺失问题,基于用户主动方式的显性用户特征提取。那么对用户特征的定义,可以看出用户对于不同的节目的评分参数,用户的性别、年龄、收入等冷数据,在广电业务中使用较少,因广电运营商主要面向是家庭用户。用户特征的变种,往往能够在某推荐当中可以根据用户的口味进行推荐。通过节目评分功能来直接采集用户的数据,用于用户的惰性,在没有激励的情况下,用户并不愿意主动进行评分,这也会造成用户数据的不全面。我们可以用收视时长和节目的总体时长来进行用户对节目的喜好程度。在家庭中,多个家庭成员共有机顶盒的情况很普遍,家庭用户的特征建模也是有目前业界研究的重点。我曾经做了一个MDS聚类算法的隐性用户特征提取的例子,我从2006年11月1日到2007年4月30日进行的计算,可以看出这个类别是很有效应的,这一家用户经常看的节目的特征。
【12:13】徐江山:我们把每一个团的中心定义完之后,这个中心往外走,三个团的中心可以验证这是不是节目是不是一类的,我们发现有一个是娱乐性的节目,一个法制的节目,一个电视类的节目,这样可以把用户的数据挖掘出来。在节目特征定义方面,可以把节目的名称、类型、导演、演员、关健词等元数据信息,另外一方面对节目特征定义更加精细,通过互联网上的、社交信息来丰富对节目特征的定义。
推荐算法当中,我们可以基于用户、物品的协同过滤,这方面就不细讲了。在推荐过程当中,一定要兼顾到用户的长期的兴趣爱好和突发的兴趣爱好,这就是衡量推荐系统是否合理和准确的因素。这个里面长期和突发的设置也很关键,有一些算法可以算这个权重的。最后在系统的架构上,要保证我们长期和突发喜好的实现,就分为离线、近线、在线计算。那么离线指标里面他的准确率、召回率当中也要进行测试。
【12:16】徐江山:在特征模型的自学习的功能里面,我们做了很多Rankboost的算法,对用户里面的显性特征、隐性特征的权重,是有机制来调整的,来实现你刚才说的指标的最优化。
在天威Mytv系统里面,也有这六个图片,在广电系统也是这个东西。
【12:18】徐江山:最后我想给大家分享个人的思考,作为广电大数据研究应用方向,其实各个专家也提了很多,实际上这里面有一些我个人的观点,第一个,内容个性化服务,节目智能推荐、个性化UI;政府舆情媒体影响力评估,对于重大政策、会议和传播的影响力到底是怎样,可以给政府提供监测的参数;个性化广告,计算广告学,这是2008年提出的,广告程序化购买,这都是比较热的方面;我们怎么样做到用户跟节目之间进行关联,我那个课题已经做了表面的,用户和广告之间的关系到底是怎样,用户、节目、广告之间的匹配关系,你要做个性化的广告推送,就必须知道匹配关系。互联网数据的融合,在公共帐号绑定,大家都想到这个方面,但是是大的方面,我们要采用怎样的手段,来丰富我们用户发展;影视大数据方面影视投资、院线排片等,台网合作方面,融合收视率,能不能把直播、点播、会看、时移做一个联合的收视率,广告到达率、回看快进广告等方面的数据。最后就是经营分析BI市场侧、产品策略、用户关怀、流失预警等方面。最后这是我的联系方式,也欢迎大家来信,谢谢大家。
【14:10】数据观:创新,洞见,2016大数据与传媒产业峰会下午的议程即将开始,尽请期待。
【14:12】主持人:各位领导,各位朋友下午好,上午我们把大数据传媒产业峰会结束,现在下午开始下午的议程,我们行业的大咖、专家来分享他们对大数据与传媒产业的认识和思考,下午我们开场的时候请一位女士来分享美女眼中的大数据与传媒产业,第一个演讲是中国传媒大学副教授、《媒介》杂志的副主编王薇。
【14:13】王薇:大家下午好,首先非常感谢主办方的邀请,有机会和大家分享我们团队最近几年的研究成果,因为有时间比较紧张,我就尽快进入我们的主题,我们是核心关键词是大数据环境下的内容银行。我们从理论到实践的进程,所以几句话介绍我们理论的研究的路径。我们整个的时间有十多年了,从内容产业到平台到银行,我们这个理论提了七年的时间,从2009年开始提,最最初的理论架构,现在是不断的升级,整个的方向的进程也是逐渐的从理论到完成技术体系的开发,我们也是希望这个理论能够从走出去,能够跟业界有实际的可能性,这是我们过去做的基于这个项目做的研究,在去年也召开了整个实验室,我们希望筹划国家级的实验室,我们开了国家内容银行实验室筹建研讨会,各个台的总工和总局的领导都在专家序列里面,今年很重要的任务是推进实验室的落地。
【14:16】王薇:我们研究背景跟大家介绍,我们为什么会提出这个概念,在这个时代,我们认为为什么做这个东西,也是跟我们现在,2009年开始提这个概念的时候,大数据的概念还没有提出,那个时候就是海量数据,走到今天,在数据越来越海量,越来越丰富,大数据的时候及我们内容银行的概念和行业的需求吻合度越来越高。我们提出三大环节的改变促使内容运营进入规模化时代,大家需要做出新的调整和应对,我们从内容的视角观察这个事情,我们发现不管是内容的生产、内容传输、内容的需求都进入越来越规模化的形态,上午有老师讲到说,这个电影的产业,对大数据的需求,为什么电影产业会比电视更好,因为市场化程度,规模化交易程度会更好。
(王薇主题报告:大数据环境下的内容银行)
【14:19】王薇:我们现在看到整个内容生产,交易、传输、需求会越来越多,内容的运营会越来越进入规模化的时代,这个时候对交易的需求,对后台数据的需求量越来越大,在这个时代,变化会很大,整个的环境,生产方、需求方都在发展非常激烈的变化,这个中间问题会很多,其中会关注到非常关键的问题,交易环节的失衡,我们看到版权盗用、版权无序竞争,还有内容免费或价值低估,严重伤害内容生产,免费传输对管道的破坏,因为没有很好的交易标准,我们希望行业能够有比较良性、比较跨越性的发展,是需要能够被整个行业接受的内容交易的体系,我们提出为什么一定要建银行是有这样的背景,尤其是现在数字化的提升,为这个提供了大的可能。
【14:21】王薇:从内容占有、策划、分发和营销推广等环节的创新性运营趋势,都在非常深刻的变革,很深刻的创新性的运营的趋势,这个背后我们会看到都是由这种非常多的数据的支持,上午很多嘉宾新的数据的算法,新的数据的产品,新的理念,我们看到说无论是评估,还是总体的各种各样的工具都在越来越丰富,这样的背景下,我们会觉得说?内容需要进入新的高度来思考这个问题,所以我们从交易的视角出发,把银行的这种体系概念把内容银行的概念打造出来,我们所说的内容银行是什么东西?
【14:22】王薇:内容银行的概念,我们经过好几年的研讨、论证,定义在内容银行是媒体融合背景下,不会说我是电视上的节目或者是电影,我们希望内容交易是通过单一的形态的限制,数字内容产业变革的必然选择,在很多平台上都会传播,所以我们希望内容银行是一个基于海量内容所有建立起来的开放式的内容交易合管理的系统平台,在这个行业里面为整个媒体提供存储、增值的大的机制和平台,通过内容的交易和流通的促进,来提升内容产业的价值。我们在过去几年里面,一直被回答的问题,你们为什么叫“银行”,我们的总体的理念是希望能够对这个行业有更宽阔思维的拓展,所以我们引入银行的概念,我们想强调的核心的观点是说,我们会看到银行的功能是什么,银行自己不生产,但是这个市场没有银行,你的生活会受到什么影响,银行是连接整个社会、机构的网络,占有了商品社会最基本的数据信息,第一时间可以掌握社会工序,充当信息的终结,并利用信息获得利益。这个银行的交易过程当中,有一个东西非常关键,统一的货币单位,中间有统一的货币单位,这个交易才有可能更加顺畅的进行,我们首先是希望建立银行体系,对他进行货币化的评估,有一套能够被整个体系比较公开、广泛认可的货币化评估的体系,所以我们最终还是觉得,是应该用银行的概念重新鉴定整个的内容产业的下一步的发展。
【14:26】王薇:在我们提出这个事情之后,最近这几年,陆陆续续的我们跟业界的交流当中,也会发现,这两年以来,银行跟文化产业的结合,这两年越来越多的被应用出来,2013年做的西部国家版权交易中心,2013年6月份,提出的“版权银行”的概念,2014年“秒鸽”传媒交易网,江苏提出“文化银行”,各家提出的出发点、落脚点都不一样,但是整个行业对于内容的统一交易,和线上广泛的交易平台的需求是不断的提升,银行领域对这个事情是逐步的接受和认可度。现有提出的体系里面,线下有很多版权交易的活动和展销会等等,是线上的翻版,没有评估、竞价、交易管理等方面技术系统开发上有什么大的创新,所以我们在这样的背景下面,我们不断的深化我们理论的深度的认知,我们看出内容银行整个的模式对原来的内容模式是颠覆性的改变,改变原来的线下低效、封闭交易模式和小作坊式的独立创作,点对点传输成本高昂,我们希望通过对内容的云生产、云存储方面,对内容云交易等方面的改变,我们希望通过云评估的体系加入之后,促进内容的流动,我们知道货币的流动过程当中,效率才会更高,流通会促进市长的价值的提升,所以我们希望交易的过程当中,促进内容的流动,进而推动整个生产行业的提升,减少无用的沉淀。
【14:29】王薇:这是我们整个体系的出发点和建构的体系,对内容银行的概念的鉴定,基于这样的理论认知,我们也在最近用两年的时间对他做了系统的架构,去年年底我们整个系统的雏形是全部建设完成,整个城市能够跑通了。这个系统架构里面,我们这个体系里面多方面的,说这个概念开始,怎么让他真正的落脚,做出东西,经过对行业的长期的分析,我们自己技术的探讨我们现在所搭建的系统是这样的架构,我们整个系统整体的架构,在前台是有内容领域的多边交易平台,多方内容可以介入、流通、交易和最终价值边线和总平台,是前端应用的系统,为了实现前端的应用,我们背后做了两套的支撑,一个是大数据下的内容领域的货币化的评估,我们所希望是给定价提供参考和分析工具,我们终极理想是做内容领域实时竞价系统。
【14:31】王薇:我们说的实时竞价的系统,是完全定价、交易和支付的手段,会用他来支持我们交易的实时的进行,把交易从传统内容交易那种都是在数据里面的状态,把他封闭的交易状态变成能够有公开的实时竞价