中国媒介市场圈价格都这么低,根据我对市场的了解 他们平台这样卖基本没有赚钱,跟他们合作安全吗?

首届大数据时代创新与媒介变革研讨会_央广网
[主持人]各位领导、各位嘉宾,2015?首届大数据时代创新与媒介变革"研讨会全部结束,数据引领潮流,科技改变生活,期待大数据与每个行业更深度的融合,期待这碰撞能激荡出更加振奋人心的时代回响!谢谢大家!&[
[伍刚]今天有十多家高校研究机构、包括今天我们的中央的主管机构都来了,搭建的是一个观、产、学、研、资,政府、产业、学术、研究机构、还有资本层面,方方面面的人士共同打造一个适合我们中国国情、适合我们中国未来发展的一个大数据的路线图,尤其是我们的媒介如何在大数据的洪流中不被淹没,依然保持像土地社曾经在100多年前说的,我们的记者就是在这个时代航船中凌霄破浪的、舰首的t望者。在工业时代、农业时代,他能够看出前面的冰川风暴,那么在大数据时代,我们的新闻工作者、我们的媒介工作者,今天正如我们高伟博士组织的青年媒体人我们应该也在这个信息时代的暴风骤雨中依然看到我们时代前进的航标,看到我们的定盘心,看到我们彼岸,我们不被泰坦尼克号的冰川冲垮、坍塌,我们没有恐惧,我们的字典里面没有弱,我们永远自信、我们没有对我们这个国家充满信心,今天恰逢是博鳌亚洲论坛在海南博鳌召开,我们今天的这个大会的全程在同步直播博鳌论坛的同时,大会所有的嘉宾都在央广网的首届大数据时代创新与媒介变革的研讨会的官方网站上时实发布,我们今天会上还同时发布了我们国家社科基金网络文化建设阶段化的成果,全球网络前沿报告,我们期待这次会议完了之后,我们会把各位专家精采的观点、视频、认真的整理,在会后准备出版一本全球大数据与传播报告,另外还预告一下我们准备与河北大学已经达成联盟,还有中国社科院世界传媒中心也期待我们签约的这十多家院校我们搭建一个开放性的平台,想在今年的下半年习总书记提出的818媒介融合的深化体制改革的一周年之际准备召开一个全球大数据和传播峰会,河北大学传播学院今天早晨白院长已经做了致辞,他们已经开始启动这个程序,欢迎各位继续鼎立支持。谢谢!今天的会到此结束,谢谢!&[
[伍刚]我想我们作为世界上第一大网络用户也实际上是世界第一大大数据的用户,如何把我们的大数据真正的造福我们这个古老的中国,让我们这个社会更加透明、更加幸福、更加美好、更加祥和。就像我们当年发明的铁锹、锄头、蒸汽机、电动机、汽车、航天飞机一样,大数据可能会像阿波罗工程一样只一旦启动就会成为我们中华民族创新的新引擎、新动力。正如国务院党中央刚刚通过的创新驱动发展战略,会把我们这一个大数据的国家战略、网络文化强国的战略、网络文化软实力提升的战略落到实处,落到细处,落到我们每一位网络用户、大数据用户的心坎上,落实在我们的行动上。&[
[伍刚]实际上我在过去的一年里在哈佛大学做了一年的中美互联网创新的比较的研究,曾经对话过谷歌的董事长,也问过他谷歌的大数据是否会与个人的隐私相冲突?还有美国政府的首席科技馆奥巴马的首席科技官大数据会带来一个国家5%的GDP的增长,还有我曾经到硅谷、谷歌的总部、Facebook的总部,苹果的总部会探索世界的巨头他们为什么带动这个国家成为世界的强国,我想我们中华民族、我们的中国普通的老百姓、我们中国的网民一点不比世界任何一个国家的人民笨、差、落后。&[
[伍刚]所以我讲今天我们在座的一些人是我们最后把我们这道命题完成最后的士兵突击,完成最后的数字化信息高地的抢占,完成最后的王教授所说的哀叹者。各个数据的全部信息化的制高点的定标、定位、定航。所以说我想今天很感慨,我们在座的这么多,也非常感谢我们央广网产经中心的李春梅(音)为代表的整个会务组的团队,也特别感谢博士生导师陶丹教授不断的督促、催促、督办,因为我们是在业界想做个体研究是没有时间来做的,我们也是不知天高地厚拿了国家社科基金,但是为了不让人笑话,我们做的事情是靠谱的,是有干货的,所以说我们今天请来了很多很多都是业界的大咖,都是有干货的、靠谱的人让大家齐聚一堂、共商我们这个社会未来的能见度、未来如何走向一个更加透明、开放、创新的虚拟时间、虚拟空间、虚拟社会与有血有肉、五光十色的、鸟语花香的社会的融合和渗透,真正的符合我们这个社会。&[
[伍刚]正如去您世界互联网大会我们的央广网的评论员宁静在开幕致词写的评论一样,让中国的传统文化拥抱世界互联网,更好的造福人类,我们虽然说通过一个80后的小女孩说出的话,虽然有点大,但是表明一个80后的小女生她的觉醒,她对这个世界的领域和感悟,所以说我想在这里面,我要真诚的感谢各位从上午一直到下午真诚的聆听。&[
[伍刚]所以我讲今天我们在座的一些人是我们最后把我们这道命题完成最后的士兵突击,完成最后的数字化信息高地的抢占,完成最后的王教授所说的哀叹者。各个数据的全部信息化的制高点的定标、定位、定航。所以说我想今天很感慨,我们在座的这么多,也非常感谢我们央广网产经中心的李春梅(音)为代表的整个会务组的团队,也特别感谢博士生导师陶丹教授不断的督促、催促、督办,因为我们是在业界想做个体研究是没有时间来做的,我们也是不知天高地厚拿了国家社科基金,但是为了不让人笑话,我们做的事情是靠谱的,是有干货的,所以说我们今天请来了很多很多都是业界的大咖,都是有干货的、靠谱的人让大家齐聚一堂、共商我们这个社会未来的能见度、未来如何走向一个更加透明、开放、创新的虚拟时间、虚拟空间、虚拟社会与有血有肉、五光十色的、鸟语花香的社会的融合和渗透,真正的符合我们这个社会。&[
[伍刚]我想,今年两会前夕我们的习总书记提出了在去年12月份提出的四个全面,这里就是说我们要在两个百年这个时期全面建成小康社会,要全面深化从农业社会、工业社会面向信息社会深刻的改革的还要面向从农业社会、工业社会、信息社会新的法治社会、法治市场,融进一个全球化的一带一路全新的新中国,信息化的强国,网络化的强国,在这里面我们同时还要做好一个八千多人的世界上最大的人力资源公司,中国共产党支撑的现代化的治理体系从严治党,这四个全面像我们的动车组一样四轮驱动,像我们的一个全新的追求社会共识的最大四边不等角的最大公约数的定苗、定盘、启航。&[
[伍刚]坦率的说大家都知道中央人民广播电台是一个有着75年历史的在当年延安窑洞的西安弥漫着诞生着中国最古老的媒介,他在拥抱了半殖民地的硝烟,拥抱了建设中国社会主义初级阶段工业化文明脱胎于三千多年的农业化文明,又在这个信息时代三七叠加的矛盾凸显期的时候,我们是谁?我们从哪里来,我们到哪里去。我们这个国家社科基金重大项目网络文化建设研究关于建设中国特色社会主义网络文化强国的对策建设研究,今天在这里应该说还仅仅是刚刚破题。&[
[伍刚]很感慨、很激动,我想坚持到最后的人都是带着一个巨大的问号,大数据时代给我们带来什么,大数据时代将引领我们走向何方?我们从那里来,到哪里去,我们现在都已经换上了互联网+的标签,我们每一个人都被数字化了,都被一个新的工具、新的武器、新的铠甲、新的ID、新的标识、新的符号、新的表达的手段、新的表达的内容全按我们经历了三千年的苦难、坎坷、不屈、崛起、屹立在东方的一个大国,我们要在这个信息时代中依然要继续引领做一个东方的文明大国,在这个世界舞台上面的它应有的使命,职责、威信、愿景。&[
[主持人]至此我们全部的嘉宾分享环节都已结束,现在有请主办方、课题组负责人伍刚总结发言。&[
[褚家炜]伍老师这个问题确实是特别贴近当代的青年,您问的这个问题,习大大交给中央政府是一样的。因为年初内部开会在讨论一个问题,其实就是如何利用将近九千万团员青年在网上的力量,相对来说发出这种正能量、发出好的声音,应该说我们也是期待争当中国好网民。总体上来说,确实有将近一个亿的资源,但是整体上来说还是有青年主体,还是具体在相对来说学校的青年更多一些,可能学校青年作为上网相对来说通过我们的数据分析,还是回到家去上网父母觉得不太好。我们想如何借用在学校以传统的思维,比如初中、高中甚至在小学,少先队的资源,如何建立更好的凝聚性、引导性,这个对于我们中青网来说,包括党中央加给我们的使命,确实这方面我们也是一直在做一个探索。但是我个人觉得反过来说,因为我自己听过这么一个段子,克强总理说过,我们在整个青年网发展中,我们也不但是把自己的眼光主要集中在青年身上,我们也是希望能借助青年继续扩散,青年群体的家庭概念,我们举个例子,一个孩子上面有父母,可能对于他的关注,不只是一个人或者两个人,可能是一个家庭,所以我们希望把我们的视角放在这上面。简单介绍这些。&[
[伍刚]我想问一下我们的同行,中国青年网,我们现在随着数据时代成长的这一代,那我们现在大数据应该说是在全球应该有一个三分之一人口的覆盖,实际上主宰未来的就是我们的90后、00后或者80后数字时代的领导者。我觉得中国共产主义青年团,他在革命战争岁月中,他是有一种的的确确像一种信仰吸引一代人,完成的一个国家的独立,然后带我们的改革开放的年代里边,他也是我们在工业化进行中,是我们这个改革的主力。那么在这个信息社会中,中国的年轻人,中国的年轻这一代如何在世界上实现大数据的虚拟时空中体现中国的独家的这种影响力,或者说软实力,刚才我们吴博士也是在前不久IMIT(波兰)教授我们也讲了就是说我们年轻人在这种现代的全球化的透明的环境中,中国的这种像我们这种官方的背景的、有中国特色的平台,如何向世界发出有影响世界的声音,我想问这个问题。&[
[高伟]感谢王韬宇的分享。当前微信这个已经有几亿用户的传播方式,已经不仅仅是一个通讯工具,而且让我们的移动生活变得更加精采。那么微信的公众号,作为一种全新的媒体形态,正在日益的冲击我们传统的媒体,所以在当下我们很荣幸邀请到了微信公众号的一位发起者,来分享他的经营过程。那么我们今天论坛的第一单元的演讲就到此全部结束了。接下来我们进行第二个环节,就是我们现场的互动环节,有请我们现场的观众来提几个问题,来和我们的嘉宾进行互动 &[
[王韬宇]其实也没那么神奇,原创能力有限,怎么解决这个问题?刚开始的数据量比较小,数据分析可不可靠,怎么来?碰到问题就得解决,刚才老师说的素材没问题,我们通过本身他们有自己提供的一些素材,我们就取之于民用之于民。我组建的这个联盟,最初的想法是大家分享数据,通过这种分享,就可以让这种数据到一定的量级,这样就可以有一个参照性,就可以参考。那所谓大数据,对于我们,可能我觉得从数据的来源来说,没有特别较真的说纸质,这个数到一定的量化以后有一定的规定,大数据时代,我觉得要寻找数据的规律,数据是有规律存在的,如何去运用,不要纠结于来源,更应该是我们青年媒体包括各个行业应该做的,从点滴做起。包括我觉得像每个人对数据的理解应该是排斥的,可能国内的很多技术和信息到达不了相对高的标准,我们可以在这方面利用一定的资源,像我有外国的同学,他们在大学经常跟我交流,像我跟他提出来,说公众号如果发布文章,大家继续关注哪篇文章,我们可以做一些改变,获取这方面的信息,都可以运用。这种大数据的运用,除了媒体的实践,还有人们生活中的事情。生活中可能运动,比如说说的专业化的,可能有些人比较热爱,他们对数据的分析是有独特喜好的。他可以分析到每个球员往哪个方向上走,还有我们的团队有做一个APP是关于网球球员的球路分析,下一次击打的时候,都有计算,这些是无处不在的,只不过是用具体的数字来描述。&[
[高伟]我看百度新闻经常推送你们的消息,如何把自己的信息推送到头条,这是一个非常值得研究的一个课程。&[
[王韬宇]我们团队是五个人,但是我立了一些规矩,就像刚才老师说的,我给他们下了一些规则,我说把数据和指标要求转发率平均高于8%,日均阅读量必须达到五倍,如果没有达到这个标准,有一定的考核。每一篇文章出来以后,对受众的喜好要有分析。我每天就催这些受众的看点,看每天增长3恩%不多,其实这个倍数是很大的。有些朋友可能更专业的一些人士,他们在微信方面专门去做,可能做得更好。我是在这种非常孤立的情况下,团队经验也缺乏,没有专业媒体人的这种加入,我们就凭着自己草根的身份,没权没钱,怎么样去做到相对像模像样,比如说利用大数据。&[
[王韬宇]今天的这个主题是大数据说我运营自媒体的公众号和大数据是息息相关的,我觉得个人觉得跟各位老师比较分享可能还浅薄了一点,大数据在这个时代可能我个人觉得是更多机遇,为什么呢?因为像我们自媒体提供了一个依据,我们有一个对人群的兴趣有一个依据,为什么很多人做公众号几年都增不了粉,获得不了关注,我觉得可能对受众的把握清晰不到位。其实我们从腾讯方面能够获得的数据是非常有限的,一个是阅读数、转发数、时间点就仅此而已,那能做大数据,现在可能整个时代都是一个开关,我们如何利用现有的手头上的数据资源更应该思考。我们首先对这些数据,我们得学会发问。我是把我自己的内容认为是一种产品,就像刚才说的,这种转发、分享到朋友圈以后,它才形成了传播的价值,然后我就把这个分享出来,需要一个时段。所以说我在看这些数据的时候,觉得这个真的是大数据。数据大了,我把数据从死的变活的,这个是最重要的。&[
[王韬宇]和大家分享一下我对于公众号的一些想法,今天说了很多自媒体的事情,好像就我一个做这个的。我们这个团队不大,讲一个例子就是对方提供一个公众号两个月关注度就从零到十万,更好的是没花一分钱的推广,现在正在组建一个自媒体的联盟,这个过程中累计已经超过了500万,每个人的暴光量是千万级的。&[
[高伟]感谢华总的精采分享。华总通过技术层面和企业的微观层面详细的介绍了大数据对当下产业的影响,感谢华海涛。接下来我们有请国民内参公众号负责人王韬宇的分享,王韬宇通过搭建微信公众号的自媒体平台,在当下运营多个微信公众号每日发布消息,解析当代的中国听民生、聚民事在微信公众号上很好的宣传一些内部的信息,下面请王韬宇介绍具体的经验。&[
[华海涛]对精准数据来讲其实我觉得是现在一个最大的应用点。刚才我就从技术的角度说了一下大数据的这些事情。然后总结一下吧:现在我觉得是一个大数据的,我们赶上了这样一个时代确实是,未来可能会像王立新教授讲的非常精采,未来可能会达到那样一个理想的状态,一个完美的状态,就是说我们可以把中间的不对称造成的摩擦的成本降到最低,但是那个时代可能还比较遥远,目前我们能做到的事情就是认清形势,想清楚这个大数据这样一个概念或者一个技术对我们到底会有些什么样实际的应用,不要迷茫就好,谢谢大家!&[
[华海涛]但是这里面一个最大的问题就是刚才上午也有嘉宾分享到了,这里面关于数据的准确性的问题。我们是不能相信的,这里面数据你不知道是哪一条不准确,所以我们认为整体就是不准确的,这里面不能单独的数据清洗,那你凭什么清洗掉某一条数据?它也许是准的也许是不准的,这里面是应用上一个很大的问题。&[
[华海涛]另外我在从业过程中还遇到一个例子,就是说有一个是跟艺术品定价有关系的,当时设计了29个纬度包括拍卖行的价格,包括大家的评价、评论、以及以往所有人的评价,这些东西通通弄到里面去,有不同的权重也不一定是线性的,把这些东西都弄到里面去去做一个应用点在哪里?就是说拿它去做一个艺术品的基础价格的一个估价。因为现在大家都知道艺术品价格是很混乱的,卖多少钱都有,那到底让消费者知道这个东西值多少钱,所以他们想了这个办法。&[
[华海涛]每个人都想去建自己大数据的中心,或者在技术上用了大数据的方法。比如说我们去年上线的味道网是一个农产品电子商务网站,那这个电子商务网站跟其他的很多电子商务网站有共性的地方,那就是我也需要广告,刚才褚总讲的很好,叫整合了各种广告资源同时做时实的数据分析,是我们电子商务网站具体的一个应用点。然后还有一点我们自有数据的积累,积累到一定程度比如想象一下每天如果能产生一万订单,这一万订单量每个人都会有一个评价,如果在评价上再有一个互评的话,这个数据量也是蛮吓人的,基本上意味着可能做一个普通的关系型数据库这样一个查询,一分钟或者10分钟,这样用户是等不了的。可能我们要牺牲掉一些精确性,然后用一些大数据的方法来把它搞定。&[
[华海涛]我经常跟同事或者朋友在一起聊天的时候就说,其实如果是我们讲阿里、京东他们所掌握的中国的消费数据可能比国家统计局的还要准。因为什么呢?因为里面的每一笔订单是谁的,它精确到分,每一分都不会差的。它能够明显的分析出来这里面有男性用户、女性用户,在什么年龄段所以这个是很精确的,然后还有像微博、微信,微信这个事情最新的版本刚刚开放微信的搜索,之前也没有开放搜索,数据在哪里?先存着,现在存储很便宜,他可以搞到这样的数据放在那里,什么时候想分析就可以去分析。所以说这个事情我们老百姓能感觉到跟我们好像没什么关系。但是多少有一点关系,但那个关系什么,我们可以去用,但是用的成本有多少这个不知道。 &[
[华海涛]我先说一下大数据为什么现在我们很多人感觉像见不到它,见到部分到就对了,因为手里根本就没有大数据,大数据在谁的手里,其实就是数据生产者,我们从源头算起,每个人在文本框里输入一个词,那这个词就是精确的,服务器是可以记录下来的。那我们上亿的人甚至几十亿的人在搜索引擎里输入这个数据是非常精准的计算了像百度、谷歌这个数据当中去。包括语音、包括视频然后像电子商务其实最精准的是电子商务。&[
[华海涛]比如说像尿布跟啤酒的例子,好像是这样,这个例子我也是听了十几年了。大数据更多的可能是商家或者国际巨头用于一波又一波的创造新的IT增长点,然后可能很多人也不自觉的就卷到这个里面去了,所以我说我们普通民众是要认清楚这个问题。遇到了什么问题现在我们开始提这个大数据,刚开始讲了查询分析,这里面用传统的模型或者是工具研发解决。&[
[华海涛]为什么会有大数据这样一个名词。是因为就是说现在我们有很多每天产生出来的数据也不过结构化,当然里面也有一些结构化的数据,这些数据其实都是有用的,可能有些是在邮件、附件里面,有的是在数据库里面。他们之间又有相互关系没有办法用传统的关系数据库的方法进行查询分析。之前在2000年前后其实已经有这种概念,就是数据仓库和数据挖掘,非常接近于现在大家讲的大数据,所以说很多人就会在这个上面进行混淆。&[
[华海涛]我先介绍一下我自己,我姓华,华海涛,我是一个比较跨界的人,本科的时候读的是历学,工作之后是软件开发人员,十几年所以对于中国的IT业无论从自身的从业还是从旁观的角度来讲看的也比较多,从我个人的角度阐述一下我对大数据的看法。首先作为技术人员来讲我认为大数据首先要看本质,为什么出来这样一个名词,跟他比较接近的在2000年那个时候大家讲宽带,什么叫宽带,带宽到底多少是宽带,现在发展到了10兆瓦、20兆,刚开始的时候512K那个时候也叫宽带,所以这个事情是不准确的。大数据到底多大才算大,是不是一个GB的数据就不算大,其实我可以告诉大家本质上不是这个样子。&[
[高伟]感谢罗院长精采的分享。罗院长系统的介绍了我们中国新闻研究领域对于大数据时代的一些研究创新,同时也介绍了新闻传播学的领域人才培养有关的与大数据相关的内容,应该说非常精采,感谢罗院长精采的分享。接下来我们请易时科技的副总裁、技术总监、味道网的CEO华海涛先生分享。&[
[罗自文]最后我想说一下我们新闻传播教育大家知道,它是做新闻传媒的门槛很低,所以大数据给我们带来了很多烦恼,但是大数据也同样带给了我们机遇,就因为是大数据我们人人都是记者,但是不一定是好记者,但是对于我们新闻传播教育的学校的这种多年的积累和培养,有可能借大数据的东风我们学习它既要有我刚才说的三个基石,又也专业报道的技能,还有数据的这种挖掘的能力,那么这些显然不是一个普通的公民他的短时间的业务爱好这个层面能掌握的,这样的话我觉得我们新闻传播教育还大有可为,我们得感谢大数据给我们机会,谢谢大家!&[
[罗自文]第二个新闻教育的基石需要渊博的知识,第三块才是娴熟的技能。新闻传播教育在很多情况下是不变的,变的很少。我们知道从新闻报道来说,它很多的情况下可以概括为叫新闻叙事,所以新闻叙事作为专业技能当中是一个基础,无论你是什么时候、无论是大数据也好,还是超大数据也好,那么这种能力它是永远不可缺少的。真正缺少的、真正变化的其实是一种传媒科技,那么传媒科技它的不同的年代、不同的地域是不一样的。由此我们新闻传播教育的一些学者我们继续编讨,我们忐忑的心稍微平静了一些。其实我们面临的环境并不是很完善。我们其实对众多的信息过来大数据把我们压垮了。但是我们经过梳理分析以后其实我们真正需要改变只是我们学生创新的思维和它运用的接受新技术的能力。&[
[罗自文]那怎么样应对这样的挑战?其实,当然今天我们是一个多行业的场合,其实我们新闻传媒教育我们也进行了多次的研讨,我们怎么样应对这样的一种挑战,让我们的学生他们经过新闻传播教育的四年的教育和培养以后,他们能够在将来的数据新闻报道这个领域当中或者是移动互联网这样的领域当中能够找到自己的用武之地。这时候我们就又想到,我们知道新闻传播教育他最早是来源于美国的,美国人他们在很早之前就提到了新闻教育的三块基石,这个其实在我们国家就是说当时我们大学的新闻研究会他们在进行新闻教育的中国化的时候,也提到了生根教育的三块基石,这三块基石是什么呢?第一块基石就是我们新闻教育要培养出具有崇高的新闻职业的理想。有理想、有追求、你干什么事情是愉悦的,你学习的效果和能力成型的时间就要少一些。&[
[罗自文]最后就是说可能机器人新闻,那就预示着可能随着互联网的发展,随着大数据的这种概念和理念的普及,有可能今后这个新闻传播的业态会发生变化,整个产业已经变成机器完全大部分新闻的工作,这是我想跟大家分享的第一点。当传媒碰见大数据会产生一个什么样的共识。第一个共识讲完了,我们作为新闻传播教育者我们心理是非常忐忑的,因为我们现在新闻传播教育碰到一个最大的问题就是我们大家都知道的一句话,就叫计划没有变化快。比如说前几年我们刚刚进行课程改革,当时还是多媒体,然后在媒介融合,在微博、微信、移动互联网,现在我们还没把这个方案弄好,现在来了一个叫所谓的大数据,或者是数据化新闻,或者是可视化报道。这个给我们的传媒教育应该说提了一个非常大的挑战。&[
[罗自文]第二种我们讲的是叫计算机辅助新闻报道,这个它说的是什么概念?数据新闻它和传统新闻在生产方式上是不一样的,那么传统新闻我们生产我们通过比如说记者、人才本身和它的采访、他的编辑和报道进行整合。而现在我们很多的比如说新闻线索的获取、数据的这种挖掘、然后整合都是由计算机来做的。而且我们现在知道有的机器新闻的话它有支撑的记者写好模板,做好相关的关键自带,这样的话产生不同的新闻。最后我们可以看到可视化新闻,可视化新闻它其实说的是数据新闻呈现的方式,但是你不可视化的结果是什么?不可视化的结果是看不懂就不看你所谓的高科技,可视化了觉得很清晰,上面几个专家做的可视化的展示觉得特别有意思,我相信它的传播效果也会很好。&[
[罗自文]我主要从事新媒体和新闻教育,所以我今天想跟大家分享的是当传媒遇见了大数据会有哪些故事,这里面我想有三个方面的思考,第一个就是说当传媒碰到大数据可能会产生某种结果,这种结果对我们从事传媒教育来说是暂时性的。数据新闻并不是这几年就出现的事情,数据新闻可能发生、发展有它的一个前世今生的几个阶段。最早的就是数据新闻它应该是精准新闻报道,精准新闻报道主要是要利用比如说社会科学的一些方法来进行调查分析、为它的报道进行客观、公正的报道的理念。在此之后出现了第二种形态,第二种形态我们叫计算机补充报道内容,我们知道叫CAR,我们知道基础工作在很多行业都有,尤其我们新闻业,在比如说装饰设计里面他这个理念很突出。但是在这里很不一样的就是说早期的计算机并不直接产生结果。第三个阶段就是我们现在目前的这个阶段,我们叫可视化新闻,可视化新闻这个概念可能有广义和狭义之分,广义的可视化新闻可能包括我们的电影、电视,特别是电视新闻的平台,狭义的可视化新闻指的是什么?指的就是我们现在所谓的数据新闻进行视频化。但是现在还有在欧美他们有一些公司从事信息服务和新闻报道,但是它员工实际上有限,但是机器设备很强大,由此就产生了机器人,这个公司90%的新闻都是由机器来产生的,这样的话就是我们可以看到数据新闻它的四种不同的形态,这四种不同的形态每一个原生的形态反映了我们数据新闻的一个侧面特征。讲到精准的新闻它其实说的是数据新闻的价值,它和传统新闻是不一样的,它可能更准确、更客观,更能够被我们的公众和受众所认可。&[
[高伟]中青网过去一直致力于青年的创业和城台,刚才听了褚总的介绍,阐释了大数据领域的实践,对青年人成长有巨大的参考价值,所以感谢褚总编的精采分享。接下来请中国青年政治学院新闻传播学院执行院长罗自文先生的分享。&[
[褚家炜]最后,我觉得大数据时代对于媒体来说是一个好的时代,其实也是我们中央媒体确实面临的压力也是非常大的一个时代。大家看到2012年开始国内两家非常大的视频网站情况如何,而且我觉得大家可以看到在视频网站上片源更多,我们能看到的资源更多。其实背后没有大数据的支撑使它最终得到的还是将近几个亿的用户量,得到了用户掌握了整个互联网的发展的根本。另外,我们可以看到大概在2013年前后我们国内可能说法不是很准确,最大的一家门户网站实行的门户、微博、视频、包括无线端的整合进行网站的全面延展,我想这背后的支撑没有大数据是根本达不到的,最后大数据确实是机遇、也是挑战,所以我们也是抱着学习的态度,也是争取在大数据上收获更多的信息。&[
[褚家炜]第二个你有了方向,有了内容的定位之后需要技术的支持,技术我们在大数据方面对于我们网站来说利用很多方面,一个可能在信息的采纳、收集然后信息的评判,包括引擎的分析、包括资源的调配,甚至我们在绩效考核上都可以用到大数据。然后中国青年网也是今年成立了云计算中心,大家也都知道云计算和大数据基本上是对孪生兄弟,所以我们对大数据这块也是非常重视,我们在云计算这块做了规划未来的发展目标,未来三年终信要建成存储,带宽达到400台速度,我们在技术方面会做很大的投入。第三个方面可能技术上要投入,经营还是要收支挣钱,作为大数据来说近几年BST广告在整个互联网行业蓬勃发展,基本上从2012年整个BST广告快事兴起,现在基本上国内的广告公司都开始积极的发展BST广告,对大数据来分析用户的行为,根据用户的年龄、包括学历包括收入然后匹配相应的广告,在整个广告转化率可以达到非常高的一个水平。&[
[褚家炜]谢谢大家,用半分钟的时间简单介绍一下中国青年网,中国青年网是1999年成立,是中央网站,同时是官方网站,中心网成立十几确实在整个服务青年上做了很多的事情,也给大家分享些数据,在2014年底是中央网站的第一名。中青网这么年的发展,虽然大数据这个概念提出来确实我们也做了一些有利的探索,下面我想从三个方面给大家做一下分析,也就是作为媒体最重要的就是内容为王,从内容上来说,内容如何利用大数据来帮助进一步的发展。而且来的时候也看到一个数据是关于美国的互联网中心,大概互联网新闻网站两年就会翻一番,所以对于互联网站是一个海量的数据。而且在自媒体蓬勃发展的时代,我们舆论场合前几年也发生了很大的变化,任何一个媒体人或者任何一家媒体可能说我可以完全的做到信息的独有,或者说我完全站到信息的制高点。而且作为媒体人来说,任何一个媒体可能它原创的力量或者现场出去采访的记者相对来说人数还是受到限制的。可能新的时代,尤其是作为一家网络媒体如何利用好数据,让后方的编辑更多的利用信息的加工来提取更好的数据可能是我们面临的一个很重要的一个难题。在这儿我们大数据可以帮我们解决很多问题。首先我们可以了解到用户的诉求,另外我们可以根据用户的诉求把它提供相对来说精准的信息服务,我想大数据在于中国青年网未来的发展确实在一个摸索的道路上,同时我们的技术相对来说发展的也不是很快,所以刚才听了前面几位专家的讲述确实我自己受益颇多。&[
[高伟]尊敬的各位嘉宾、朋友们下午好,根据大会的安排我们现在进行我们第四场的论坛,我们第四场论坛的主题是大数据时代中国青年媒体人成长论坛。我们论坛的主题是着眼于大数据时代中国青年媒体人的学习、成长、成才。那么大家都知道,大数据时代彻底的颠覆了我们传统的社会,那么在今天的社会形态下,大数据就是带领了随着我们社交媒体和各种数字技术、信息技术广泛深入的发展带来的一个新的概念,那么在这个概念条件下我们中国青年媒体人如何适应这一特定的技术环境有效的认识大数据时代的种种机遇和挑战呢?今天我们有幸请到我们四位嘉宾对大数据时代中国青年媒体人成长成才的问题进行有利的探索。希望他们能够分享出有益的答案。我们中国青年媒体人成长论坛接下来将进行两个单元,第一个单元首先由我们的现场的嘉宾对刚才我们说出的问题就是大数据对于青年媒体人的成长、成才的机遇和挑战这一基本的主题来进行一个有利的分享和探索。第二个环节将与现场我们的朋友们来进行互动,进行一个提问环节。首先有请我们开始第一场,首先有请我们中国青年网副总编褚家炜先生精采分享。&[
[主持人]感谢各位专家对大数据技术的观点分享。接下来,我们有请、北京大学公共管理中心研究员高伟主持"大数据时代的中国青年媒体人成长"论坛。嘉宾有中国青年网副总编辑褚家炜、中国青年政治学院新闻传播学院执行院长罗自文、国民内参公众号负责人王韬宇、味道网CEO华海涛,有请各位上台。&[
[秦雯]谢谢四位专家,我们刚才最后一个问题是讲切入点和切入方式问题,我觉得四位专家都已经谈到了,切入点的话有两种模式。一种模式就是现有用户的用户需求。当然还有一种更创新的模式,也更革命的模式,更能让王教授激动的模式是创新应用,因为从零开始,怎么站在基于大数据来思考或者说基于用户的个性化需求来思考,去创新应用,我想这两点的话,对我们在座的今天在媒介的这些企业来讲的话肯定都有借鉴的。但是从切入方式来看,大数据一定是跟网络密切相关的,我们今天在谈互联网,其实我们以前谈物联网,现在更新的说法是万联网。在那个时代,可能数据是无处不在的。另外一个就是交互性和全过程,这三个网络化、交互性和全过程,我想这三个关键词对我们真的能够赶上大数据这个时代、这趟列车是非常重要的,也希望这样的讨论,能对大家有借鉴、启发这样的意义。谢谢大家!谢谢四位专家!&[
[吴昊]因为我们好贷网是一个新兴的行业,是起一个牵线搭桥的作用。因为本身我们在刚开始成立的时候,我们对大数据还没有一个我们自己的概念,因为我们觉得把搜索做好就好了,但是后来发现我们的客户包括我们的用户在服务过程当中,他们会有一些痛点,所以对我们来说,要做就专门解决这样的用户的问题。其实对我们来讲的话,切入点就是用户的需求,一方面是我们之前做的不足的地方,另一方面是整个市场大的机会。比方说我们现在在大数据的应用方面,一上来比较浅。就是说这需要什么样的数据,那我们想办法帮他去挖掘这一块的数据,或者调用这一块的数据,那不同的信贷机构,他不可能每一家都建立专门的机房的服务器做同样的事情,所以我们会搭一个平台,对他提供一个统一的集中化的应用,免除一些所有接入的成本。当然在后续的运用成本我们也做相关的事情,整个偏小额的消费信贷的发展的方向,还是说由机器自动判断一个人的信用状况,然后最终做出一个信贷的决策。那国内和国外也有部分的公司实现了这样一个初期的效果,但是我跟大家分享一个比较有意思的案例,就是说之前我们的合作公司来联合做的维期几年的数据,就是在谷歌上面搜索借钱不还会怎么样的,搜索这个信息的客户,按我们逻辑上来推理的话,你都有这个心了,说明你是动这个脑筋的,应该说风险还是比较大的。他们做了一个比较长期的统计来看的话,有搜索这块内容的和没有搜索内容的,实际上坏账率基本上是一样的。所以可能很多一些跟一个人的,比如说跟他的社会行为,包括他的一些社交或者在电商上面的行为,到底能不能真实反映他的还款的能力,或者还款的意愿,这个我们现在还处在一个探索的阶段。但是对我们来讲,现在当务之急是解决掉,尽我们最大的能力,从某种程度上解决信息不透明的这样一个状况,我觉得这是我们用户最大的看点,我们以这个角度来切入,做大数据的研究。&[
[朱垒磊]就像刚才老师说的,如果把媒体,像电视媒体传统的可能大家是回归这样的数据,但是我觉得电视媒体比如说现在你的电视媒体是在小米电视上放的话,其实你知道是哪个用户什么样的习惯的人在什么时间段看哪个节目的,这个要比靠调查的那一万个用户来的才是真正意义上的大数据更全面。所以我觉得对任何一个媒体来说,他的大数据的第一步就是有一个详细的信息和机制,刚才说的是电视媒体。那如果是像央广网这样的网络媒体,当然就是它的后台的所有每一个页面、每一个点击、每一个用户的行为都要记录,如果是APP端的媒体,那自然也是他的每一个按纽、每一个频道的浏览,在这样的基础上才能做个性化的推荐或者是广告结合的操作。&[
[钟宏]我们公司主要是电视媒体比较多一些,中央电视台、北京电视台,像电视台的话也是和新媒体融合,重点还是在传统行业那一块。在传统问题上,因为传统媒体它主要是商业说的网络,搜集数据是比较困难的。我想大数据的这个特点在于偏智能,以前他获取数据都是抽样的。应该是新媒体和传统媒体融合点在哪,通过新媒体融合,来解决大数据传统问题上的弊端。&[
[赵勇]其实我非常赞同王老师王立新的观点,现在的大数据时代就是王老师说的你要做一个企业、做一个项目,你是不是能够获取数据、获取用户,第一个切入点是获取用户和数据,第一个我们面向的是教育,因为教育是所有人的刚需,我面向中小学,我们的切入点是什么呢?当前教育最紧缺的实际上是教师资源,现在所有在线资源的产品,我把老师的课件放在网上,我把一些习题、答案放在网上,他是打通你学生和老师、答案的边界,他能快速获取。但是他没有解决老师时间不够用的问题,没有解决孩子时间不够用的问题。我们现在采取的方法是能够逐步用机器来替换技术方面高端的人才,以前是机器向工业革命,用自动化的程度的提高来替代简单的劳动力,我们要替换高级劳动力。我们的教育产品,我可以替换高级的老师来给孩子做主观题的角色,不是填空题的形式。我可以把机器做推导,我能逐行来批改习题,这样解放老师不用改卷子了,可以针对学生做个性化的辅导。同样我们做一款中医产品、医疗产品也是,我可以用及其逐步来中医或者是西医代替它的智能,可以给每一个病人去看病,提供个性化的健康辅导,所以我讲了两个关键切入点,第一你要获得用户和数据,第二是个性化,现在00后、90后要追求自己的个性、发扬自己的个性,那我的大数据最终就是要很精准的数据从每个用户的需求,从生活、工作的需求,像亚马逊的总裁,他说未来亚马逊的方向是为每一个用户建立一个亚马逊的网页。我就说这两点。&[
[秦雯]非常好,其实我们看到这个讨论过程当中,一个最大的特点就是其实技术是和应用,是大数据一件事的两面,它是不可分的。但是在这一点的话,我也是在行业里边经常以批评的态度,在说一件事情。就是我们很多传统的IT所谓供应商、ISV,他们华丽变身变成一个所谓的大数据公司,他们实际的目的就是想卖他们的服务器或者是卖他的软件。其实这样的我觉得是不可取的,真正所谓的大数据应用,因为技术是来实现应用的,一定是跟业务密切结合起来的。那我想我们再来问最后一个问题,因为今天的会议时间比较长,刚才北邮的王老师给我们描绘了一幅非常美好的蓝图前景,最终是达到共产主义,但是那个我相信离我们比较远,因为事情还得从脚下做起。我想请四位专家,因为我们今天的主题是媒介变革,作为一个媒介,媒介现在非常泛滥。作为一个媒介的话,如果我们真要能够抓上大数据时代的尾巴,赶上这趟车,切入点是什么?你们有没有好的建议给大家?或者是切入的方式。我们用这样一个大家的献计献策我们来结束我们今天的讨论,请赵总开始。&[
[赵勇]我们接触这个行业比较多,我们一方面是国企、央企、政府部门,他们才有大量的数据,另外我们还有很多的消费者的数据,我们全国有十几亿的人口。那像央企和国家部委的难点前面几位都提到了,用户需求还有用户对大数据的理解,这方面还不稳固。举一个例子,比如我们给民行,我们做数据挖掘。他说请你帮我们挖掘一下有价值的用户,我说什么叫有价值的用户?你们怎么定义?他说我们也不清楚,需要给他梳理整个的业务数据、业务流程、跟用户的交互,梳理出几十个特征,在这里面去摸索。第二个难点,他现在从传统的IT架构从大数据架构来说不是一蹴而就的,他需要有一个过程。但是很多企业和行业都是拿到方案,比较特别成熟,而且能够在很短的时间内能够实施,这个实际上我们需要综合的来评估,在企业里面去实施,它的关键业务比如国家电网做调度性,因为它沉淀了几十年的东西它确实需要改造,但是我们首先对业务不了解,其次你做的不好,全国的公输电就瘫了,所以我们从基础的用电信息采集这方面条件来做,所以它实际上也个切入过程的成熟过程。第三方面的难点,像现在你比如说咱们的平原城市,然后还有机场,一个机场监控,我有一个朋友告诉我说北京机场可能有几万个摄像头,真正在看摄像头的工作人员有几个人。他对机器化程度和实时性要求非常高,这种系统不是一下子就能搭起来,它需要很多个面向不同渠道的大数据过程。不是我拿个大数据产品我就能解决所有行业的问题,我需要结合许多大数据才能给他提供解决的方案。&[
[钟宏]我想我们做大数据应用的时候,我们需要解决应用价值,因为做一个大数据应用系统的话,需要做很多的数据。那么它从以往应用说话来讲不太一样,以往的应用跟用故需求比较清楚,用户他也知道流程是什么样子的,数据是什么样的。那大数据的话,往往用户他不太清楚这个应该怎么去做,那就是需要我们的技术人员对用户的业务上有非常深刻的影响,要深刻的理解,这样的话才能够充分的认识这个问题。因为有许多的用户目前的话他可能往往有特殊情况,有跟风,就是说大家都在回答问题,但是特并没有想好怎么好去做,做不好的话你可能花了很多的钱,但是没得到很好的反馈。所以你要正确的去引导,让大数据发挥真正的价值。&[
[秦雯]好,谢谢&[
[朱垒磊]第一个解答可能就是刚才信息孤岛问题,就是具体到某一个行业里面其实数据更多在被某几个媒体或者某几个大公司或者是在任何一个行业,也就是说我们整个市场上,大数据还缺更多的平台型的产品,平台型的产品打通了某一个行业里的数据壁垒,才可能有更多更丰富的数据出现,所以这个回答里面也包括了我启动的第二个问题是行业性的应有更少了,我觉得大数据通用型解决方案更多是偏架构层和可能算法层,但是应用层一定是到具体的行业。比如媒体大数据领域这种,很多其他的领域可能大型的汽车领域、金融领域像好贷网这样的民营企业,还是有很多细分的领域,准确的说需要更多的数据平台的出现,才能够打破技术的需求和应用之间的壁垒。 &[
[秦雯]请朱垒磊&[
[吴昊]是&[
[秦雯]或者说资源的丰富性。&[
[吴昊]我觉得其实整个从信贷行业的角度来讲的话,其实信贷行业最核心的东西就是风险太紧,其实就是信贷的本质就相当于两个互相不认识的人之间要发生金钱的这样一个关系,在这样一个过程当中,就涉及到需要资金的一个需求方,需要提供他的一些信息或者他的一些数据,能够便于资金的供应方更好的了解它,并且把这个钱顺利借给他,这就是一个大概的过程,一个逻辑。在这个过程当中的话,就会存在信息不对称的问题。包括像我刚才举的法律诉讼的问题,如果说信息的需求方不把控,把他有被别人告多少次的数据提供出来的话,那作为信息的资金的供应方来说还是比较难以判断的。当然我们可以通过自己公开的法律判断,对这个问题进行一个解决。但是很多数据它是非线上,比如说他在民间借贷这个领域欠多少钱只有他的心里是最清楚的。当然还有小的贷款他没有办法获得央行征信的报告,也就是说信息孤岛的状况,其实是在信贷方面比较严重的一个情况。当然从技术上来讲的话,对于不同信贷机构之间,或者说对于信贷领域的不同细分的参与者之间的话,我觉得从技术上是没有太多的问题,因为本身这个领域跟营销不一样,这个领域都是一些偏结构化的数据。所以主要问题还是对信息不对称这个问题的一个解决。&[
[秦雯]谢谢,实际上这个讨论已经从技术范畴到了应用范畴,因为大数据实际上最终体现价值还是到应用,所以咱们在谈技术的时候,其实是刨开应用的。我们把下一个问题再集中一些,就是在你们四位,你们自己在做大数据的应用过程当中,你们觉得技术的难点或者痛点主要在哪方面?因为我们现在在说,因为我们公司也是做大数据的,经常听到两边抱怨。应用那边老抱怨技术老不到位,反过来技术那边老说需求过不来,老有这样的矛盾。所以听一下你们的看法,难点和痛点在哪?你们有没有好的解决方案?还从吴总开始。&[
[吴昊]大家下午好,我是好贷网大数据这块的负责人,我叫吴昊。因为刚才几位老师讲的对大数据这一块的认识,我还比较想说,从我们好贷网自身的角度来谈一下我个人的看法。是这样的,我们好贷网是做贷款的垂直搜索的平台。我们在对客户来提供信息的一个匹配的这样一个服务过程当中,我们也会发现客户的一些痛点,比方说我们在把贷款的搜索者就是所谓的借款人匹配给不同的信贷机构的时候,我们把关联度作为一个问题。可能比较优质的人,他会选择的地域,比较低的信贷机构,这样的话信用状况还有整个资质稍微偏低一些的话,他可能希望去选择地域稍微高一点,但是也能给他批贷款的这种。所以在这样的匹配过程中,我们会帮助客户来做更好的匹配,这是第一个领域。第二个领域就是我们在跟我们配合的现在全国有七千家在跟我们合作做配合,在配合的过程中,我们除了给他提供数据之外,我们也提供一些风控相关的数据的服务,打一个比方,比如说一家企业申请一笔贷款,这家企业可能带不同的地区,它跟别人都有法律的纠纷。但是,如果是让这家信贷机构自己去在全国的几千家、上万家的法院的网站上面,一家家查是完全不现实的。我们现在就有提供一个,我们搭了一个"云风控"的平台,也是基于数据应用方面的一些服务。这个平台就可以提供我们基于可以把它说成是一种数据挖掘,就是全国所有的网站上面,抓取的一些公开开庭的记录,包括现在这些网站上放的记录都是新的,开庭以后这个案子结了信息就撤下来了,但是我们有办法把数据存储下来。存储下来之后,我们就可以看到现在有没有法律的风险,还有过往会不会对别人产生一些产量质量方面的纠纷,这个直接对他的履约能力、还款能力有非常直接的关系的。还有包括借款人他有没有在互联网上频繁的申请贷款,这也是反应他资金紧缺的状况。那么他借了一笔钱之后,这样我们也有一个方式能够把这一块的数据做一个整合。如果说他出现了一些非常高风险的行为的话,我们还可以针对信贷机构设置的一些规则,能够对他们的风险进行一些揭示。因为我们主要还是服务于一些信贷机构,我们对信贷机构提供的是基于数据的这两个机构,这是我对信用模式大概的介绍。&[
[朱垒磊]刚才各位老师也说了,大数据的应用体现在说有大数据的架构、大数据的存储、大数据的采集和大数据的分析,那我们公司夏唐科技包括今天我们在这研讨会的主题,可能更多的是针对咱们的媒体数据以及咱们的商业消费领域有哪些大数据,在商业消费领域的大数据的应用上,我们觉得企业它在正常的生产经营过程中会产生各种维度的数据,其实这个数据的量就像王立新老师说的,不能说一个TB叫大数据,或者一个更大的量是大数据,可能每个企业面临的情况不同,不同媒体所能产生的大数据的样子也不同。可能对于像百度、新浪这种级别的大数据的媒体平台来说,它的大数据的量级,如果不用大数据的规模,而是用实力的数量多少来论的话,可能每天都要上几十个亿的浏览或者几百个亿的资金,考虑到大数据的当量。但是对于很多企业内部的生产、运营的数据来说,可能一家传统企业,可能在十几年的工作中积累百万级或者几百万级的用户的人的数据,它已经是非常宝贵的一个价值了,可能后面好贷网是一样的。我相信不是一个度量上上亿级的,而是百万级的甚至几十万级的。就类似像今天早上咱们有保时捷的朋友,那如果说全国跟保时捷的用户相关的数据,百万级是非常不错的数字了。所以就是说这个是对大数据数据规模上的理解,我们在分析里面会牵涉到企业的营销数据,营销数据可能更多的体现在网民上网浏览的数据,也包括有企业在它的市场活动中留存下来的数据,包括我们叫消费者在他的网站上在他的点上网站上搜集来的消费者真实的数据以及包括我们今天的渠道数据。也就是说在媒体变革的今天,可能不只是一家两家媒体能够成为一个对企业有价值的渠道数据,它的渠道数据的量本身可能就是有几千、上万甚至是上百万的级别,如果我们把每一个零散的微博自媒体、微信自媒体、APP自媒体都看成是媒体的话,那么渠道本身的数量也是可能是百万级的。所以说在这样一个背景之下,业内包括我们公司可能更多的是从事的服务,就是如何把一个企业它的市场数据和它的营销导向的营销数据,中间做一个勾连。也就是说对于企业来说,它有不同类型的数据,我们在这个领域里,我们其实都是结构化数据,但是我们把它叫做一元的结构化数据,也就是说叫做(英)结构化数据。那么这个一元的结构化数据对于任何一个企业来说,它要想建设这样一个(英)平台来管理的话,牵涉到很多应用层的困难,应用层的整合困难。那么,在这个意义上,我们最需要梳理的其实就是两种类型的,一种就是我认为刚才提到的基于Cookie的经销数据,一种是基于人的市场数据。那在这两种数据之间,其实我们提供的不仅仅是数据服务,甚至是依附于数据的运营和人的智力性数据,这样才有可能让这样的数据真正形成一个起作用的闭环,让系统软件、数据和人的智力在一起,才能够形成一个商业价值。在这个里面,也牵涉到刚才提到媒介本身也会成为一种数据形态,社群也会成为一种数据形态,这就是我大概的理解。&[
[钟宏]我是北京中视广信首席架构师钟宏,那我们可能跟许多单位不太一样的,我们是一个公司,今天来了很多单位大多数都是学校科研机构,一般的话大家认为公司有很多项目,但我们公司的话就是做信息的研究,我们专门有一个新技术的研发实验室,专门对新的技术进行研究,包括大数据等等,这里面大数据这方面,我们很多专家都作了很多解释。我想从它的技术区别稍微说一下。现在就是说我们一谈大数据,就介绍一下应用的案例等等,我们往往看到似乎像是统计的应用或者数据挖掘的应用,好像分不清楚到底这个区别在哪。其实我想说统计的话,它主要是针对大的数据,比如说我的企业或者交易所,它产生大的数据,得出来一个总量的数据,通用于各种各样的方式。那像数据挖掘、数据仓库的话,它的数据主要是来自于结构化的数据,那么它就不像统计,统计主要是多了一些数字性的统计计算,那数据挖掘的话,就是我们在数据库里面的数据,比如说这样的一些东西,就是文字的这样一些信息进行挖掘,还有它们之间的联系。当然这些数据在数据库里面,也是提了提,我们往往在结构化。大数据的话,它主要是来自应该是一个互联网方面的应用,它的数据是基于互联网发展的。而且它的数据是非结构化,就是大数据并不排除数据挖掘,它里面包含了很多数据进一步发展,那么它应用到许多统计学里面的,还有数据挖掘等等这样一些东西。当然他说分布式的技术,分布式计算来对这个问题。总体的区别差不多就介绍这些。&[
[赵勇]我是清华大学大数据处理中心的赵勇,我们这个中心实际上是在2012年就成立了,可以说是国内比较早的从事大数据平台行业应用的一个机构,我们这边对大数据的理解,我们把大数据技术分成五个层面,最基础的就是我们叫基础架构支持,那么包含现在的数据中心、服务器、存储网络等等,这是最基本的。再往上就是数据采集,当然大数据的起点就是把大数据拿到,如果没有数据,大家说大数据就是空对空,拿过来以后就要存储。其实做存储大数据世界上有很多的公司做这个很多年,它对规模和存储的时效性、吞吐量这方面都有很多的要求。数据存下来就要进行处理,绝大多数做大数据是在大数据处理层面,包括分析、统计、查询、商业智能包括现在最新的深度学习、机器智能这方面都属于数据计算和数据处理。处理完之后,拿到这结果,就需要进行结果的展示和交互,那么以前像图表,还有现在比较流行的信息图,再有最深的像这种增强现实,体感交互,这些都是大数据最终的展示和交互这方面的技术。那么具体的,我们做得比较多的中间层面就是大数据处理,我们又分成三个部分。首先是离线,就是P处理,特别大量的数据不可能一秒钟就处理完,可能要几个小时、几天甚至更长的时间。那么现在随着信息爆炸的年代,对于数据处理的要求有时效性的要求越来越高,大部分像类似数据库的查询,我们要做交互式的。也就是说我问一个问题,我希望几秒钟或者一秒钟之内就能得到回答,交互式的处理。要求最高得有电网和平安城市实时监控,数据要马上实时的能够得到反馈,这是第三个层面。我们对大数据的一个相关理解。&[
[秦雯]大家下午好,听了一天了,也是比较累。听起来,咱们这个环节好像是最抽象的,所以我们尽量跟嘉宾一起,用一种深入浅出的方式,来分享一下对大数据技术的认识。一会儿,我为了节省时间,我就不给各位嘉宾介绍业务的时间了。待会儿请各位介绍自己正在做的业务或者项目讲一下大数据的技术。首先还是从一些基本面入手,我们知道,大数据这个概念已经火了好几年了,昨天我看到有一家新华社发的新闻,国内一家做服务器的公司,号称要做中国的数据网络。其实在我看来的话,它有点偷梁换柱的。所以我觉得,我们今天还是有必要去跟大家一起,我们不一定是澄清,因为可能这个事情每一个人有不同的看法,就是提供更多的角度,来谈究竟什么是大数据技术,就是跟大数据相关的技术有哪些,这个范畴是怎么样的。咱们要么这一轮从这开始,请您先讲好吗?&[
[主持人]感谢各位专家对大数据时代的版权管理的真知灼见。接下来,我们有请缔元信.网络数据CEO秦雯主持"大数据技术"论坛。嘉宾有好贷网CEO 李明顺、北京中视广信科技有限公司首席架构师钟宏、清华大学苏州研究院大数据处理中心技术官赵勇、夏唐科技CEO朱垒磊。&[
[郑铁男]所以对于编辑人员的培养,对于文科专业的学生我自己认为就是编辑在大数据时代、在移动互联网时代你们的培养的就是什么?你们就是一个产品经理。什么叫产品经理?你就要自己去想一个产品如何去做,如何进行设计,如何进行推广,它的定位是什么?如果你能做成这样的产品经理,你可能就会在移动互联网时代就不会被淘汰。好,谢谢大家!&[
[郑铁男]第四个是数字出版人才的培养,我觉得大家都知道这个软件Axure
RP,可以帮助我们编辑出版文科类的学生去画一个图,我们尤其是学编辑的学生大部分都是文科生,发散式思维,所以你说出来这个产品想做一个东西你跟技术人员交流其实是经常听不懂,你会觉得我怎么是这样想,为什么他做不出来,而开发的软件公司运营商会觉得你提的太发散了,所以这个软件可以训练我们学生的逻辑思维能力,可以把你的想法,比如说你从这儿跳转翻阅旋转效果中间有几个键完全用这个软件从那个图库里面选出来,就不用IT的人员给你做出来了。所以它有个好处就是帮助你理清你的逻辑思维能力,第二个不大依靠技术人员就能够把这个产品设计出来。所以我有幸去讲课的时候,我的PPT被一个研究生拷走,就在北京找到了工作,落了北京的户口。所以它不是一个纯技术软件,所以在网上也有很多可以去下载一下。&[
[郑铁男]大家看到的这是我们给一个出版社做的关于教学的辞典全部的维护,包括它的词组、人称代词。这是国外的标准体系。大家看到的是从一个词到列外一个词,其实计算机不知道你这个是什么词,能分析从这个词换到另外一个词,我想刚才北大的老师已经讲了李彦宏的做法,其实看看这个表就是你要找的中间那个总的结构,其实通过别的一些词都可以转到这个词,所以对于你来说就用大数据的时候把这些知识点、关联体系要建立起来,这个才是我们要做的,从大数据变成小数据,把这个知识体例建立起来就会提供精准的服务!&[
[郑铁男]给大家举个例子。这是人民卫生做的医学数据库,然后有参考数、有病例、还有药物指南、有视频等等,它就是把它的内容碎片化处置。然后你打一个高血压可以马上找到。然后你找到高血压之后大家看到右边是高血压相关的药物都是什么药跟高血压有关系,症状是什么?然后相关手术操作怎么去操作,动手术,怎么样去做相关的疾病,还有相关的实验检查,只有这种服务提供给客户,客户才会为此付费。并不是说大数据时代我们数据就要大,而是通过数据创建一个小的数据服务。这里面因为时间关系就不再细讲了!大家看到也可以进行跨部检索、语意检索,知识关联然后进行知识提取,通过这样的服务就可以赚到钱,可以给客户提供服务。这就是我们创业的技术平台,如何去创建这样的知识库,可以对知识点进行标引、加工,然后建立节目、录像、建立词表,建立他们的分类体系。&[
[郑铁男]第三个非结构化的数据都是零散的数据,没有组织性,客户需要吗?我们现在这种模式就是这种检索的模式,搜索的太多了,这个时候也不是客户需要。所以客户需要是什么呢?在短的时间内为客户提供的内容是他需要得到的,所以我们还是需要把非结构化的数据变成结构化的。也就是说我们要利用大数据的这样的技术提供小数据的服务。只有提供小数据的服务客户才需要,才会为此付费,完全的海量数据像百度搜索一样其实客户是不会为此付费的,所以我们要设计这样的产品。&[
[郑铁男]有的时候我们经常会讲中国要有自己的标准,在互联网上中国不需要自己的标准,为什么?因为互联网是美国人搞的,我们建了标准是自欺欺人。所以第二个信息化要求的是信息共享和分享,我们建了自己的比的东西跟别人交换我们就很难,所以要采用国际上通用的标准体系去建立出版业的标准,所以在前段时间中央出版社转型的时候都开始采用国际上的通用标准。这个XML就不讲了,今天也不是讲课。大家看一个片断,这就是我们的一本期刊或者图书,大家看有蓝色、绿色、黄色,我们把它碎片化处理之后,大家看就是把所有的蓝色聚集,黄的聚集,然后还可以进行重组,形成新的产品。这个产品也许是个卷子,也许是一套题,也许是一个手册。同时,我们看到现在的所有的电子书京东、亚马逊所有的格式都是基于XML转出来的,这些都不讲了。当当、京东亚马逊这些格式我就告诉你所有电子书的格式都是基于XML转化的。所有我给大家介绍的数据库、知识库都是基于他们企业的一个XML的标准然后生成出来的,所以我们需要把我们原来的数据从结构化的数据要变成非结构化的数据。&[
[郑铁男]所以要把我在其他的行业里面讲的时候,大家都知道xml是什么?我们的纸书,我们其实是个馒头,但是我们现在客户变了,像王老师这样喜欢手机的人,那他需要的是饺子,需要的是面条,如何馒头变成饺子,如何馒头变成面条,那馒头永远不会变成饺子,怎么变成饺子?那就是先把馒头变成面粉然后再加一点馅和调料,XML就是面粉,所以要把我们原来纸书期刊的内容变成面粉,因为时间关系看的是国外的数据库产品都是基于SML做的,大家看到国外很出名的Springlmages,它这个有数据库,这些东西这些产品都是把原来的期刊、图书碎片化之后然后抽取形成这样的知识库,这个知识库要比原来贵很多。然后还有这些国外的图书期刊数据库,所以我们可以看一下第一个建立碎片化的标准,所以在国外出版集团十几年前就已经把内容进行碎片化,把他们的内容变成非结构化的数据,它也有自己的标准,所以很早以前我们提出来有些行业的人提出来没有标准,那是因为不懂,在国外已经有很多出版集团建立了数字出版标准,而且国际上也有同样的标准体系。&[
[郑铁男]再看国外的同行的一些期刊、图书他们都变成了专业知识库,他们也都在手机上进行了服务,我们这个同行尤其出版很多人自杀了,大家也都知道不堪重负,一个是纸质的急遽下滑,跟互联网是有很大关系的,如果没有互联网他们可能不会自杀。第二个从结构化的数据到非结构化的数据。我们以前出版物出版的图书期刊其实都是一个产品,你拿到一本书要考试,拿到一本期刊跟下一个期刊之间的关联关系等等都已经做好了索引,其实它都是结构化的数据,有正文、作者、标题等等排序,然后有第一章、第二章、第三章,还有引文等等,其实完全是结构化的,它已经在编辑里面在编这个产品的时候已经形成了一个思维逻辑,所以它是一个结构化的事情。但是这样的产品如果我们做成电子书一样,那实际上已经不一定适合新的手机上的阅读方式,所以需要把这样的产品把它碎片化,变成一个非结构化的数据。所以,凡是不管是编辑出版这方面的学生,不管是研究生、本科生、博士生我觉得你们学点技术不一定要完全掌握技术。&[
第一个就是互联网数字出版等于互联网,大家看到这些是我去年还是前年做的一个APP客户端的列表,你看见大家在手上拿手机去看查数据这个已经出位置,整个阅读也进行了分支,有社交、阅读、个性化服务的都会有,这样把这中间我创办的曾经有一个翻书网1.6个亿卖给百度了,现在已经不见了,这是行业也是变化非常快的。所以叫什么叫数字出版,看这几张图就知道了,出版加上互联网,所以就是数字出版。&[
[郑铁男]第一个我在就任从学完之后,让我去从事互联网出版的时候,对于数字出版我们的行业还在讲双重PDF的时候我就提出来了数字出版等于互联网加出版。很荣幸,我正好跟着现在天天讲的互联网+,+什么,可能+到一块去了。所以我当时在做数字化转型的时候就把我们集团所有的期刊、图书都碎片化了,然后重新组织新的产品。第二个就是从结构化的数据到非结构化的数据,要把我们以前出版的图书、期刊这些结构化的产品变成非结构化的。第三个其实非结构化用一个检索郑铁男这个词就有价值吗?也不是。所以第三个还是要从非结构化、碎片化零散的数据要变成一个结构化的数据。这个国外很多出版集团都已经开始转型,转向了数字出版。它同时由出版商向信息服务商转型,第四个就讲一下数字出版人才的培养或者是叫大数据时代我们这样编辑、出版专业的学生你们以后培养成什么样的人才能找到工作。&[
[郑铁男]很多前面的专家讲的不太一样,我一直从事于数字出版和互联网行业,我从96年开始就接触互联网,然后组建过国家五大重点新闻网站,今天也很荣幸是央广传媒来做这个节目。你们的领导都是我以前的同事,所以后来我有兴趣转到出版行业,去做数字出版,我自己本身是学出版,有兴趣去读书,然后我们单位把我送出去的时候我还不太清楚,因为我一直做管技术、管金融做的挺好的,后来把我送到那去读书,在飞机场上下了飞机还没有到单位,领导就给我打电话说你不用中国网报道了,不用去搞互联网了,去做数字出版,集团要成立信息中心你去当一把手,所以我就被迫从看不起互联网的人就变成了出版人,变成了数字出版。我今天更多的是讲一些技术和盈利模式还有就是如何什么叫大数据,什么叫小数据,我觉得可能都不重要,最重要的是我们怎么去做产品。尤其是我们像河北大学这样的新闻出版学院这样的学生你们如何能变成一个产品经理,从这几个角度去讲可能会更好一些。这是我个人的观点。&[
[祝金甫]还有一个发行风险,我们最直接的形式是什么呢?电视剧播出之后我首先想到我和哪个电视台台长比较好,还有上千个屏幕你到底卖给谁,央视、卫视我们能否通过数据的形式,你题材适合的区域、受众比较喜欢接受的方式匹配和分析。数据化的形式。最终银行给企业贷款的话,它比较采取传统的方式抵押贷款,所以很多的传统金融机构丧失了很多机会,那是因为它对轻资产的制作和发行并没有进行风险把控。那么如果在生产过程当中,这个企业得事前事中事后进行整个的分析,然后就知道这个项目到底多少?这种情况不需要抵押贷款。我就不多说了,纸牌屋是用经典的大数据分析,剧本是预测和分析。还有一个通过大数据分析你知道小时代,喜欢小时代人群到底具备什么特点,能否根据这些特点受众人群再拍出类似的电视剧和影视剧。还有一个最终产业的繁荣肯定需要影视数据和金融,所有产业发展需要金融资本的支持,谢谢大家!&[
[祝金甫]还有一个,通过收集数据的形式,我们把每一个数据进行分析,你这部电视剧的作品我能不能抒情的展示给你,谁喜欢播、什么地区的多大人喜欢看?曾经有一个卖方便面的老板找我去,我的方便面想卖给北京养生堂,到了北京养生堂收视率比较高,因为价格比较贵,我就问他一个问题,你这方便面让谁吃的,不可能本来深养生的给60岁以上看的还让他吃方便面,通过所有数据搜集发现,在18-24岁,34岁之间他们观看北京卫视的节目是军情解码,所以我们看到精准的数据分析对植入广告也是有价值。还有一个剧本的风险,所有的影视作品剧本都是我们能否利用深度学习的形式,把整个的影视作品进行深度分解。那么同类型题材我也拍一部谍战戏和美国和中国的相比较你有什么优势,你的题材、你的人物、你的结构、你的发展点到底有多大优势,能否用展现出来?还有一个你的人物的发展,是比较平坦的发展还是跌宕起伏的?我能否用数据的形式来表现出来?再一个,传递的优势。我拿到剧本的时候能否对将来电视剧的发展提供准确的预测。还有植入广告。还有明星,我们都知道中国的一部影视剧成本影星占了60%-70%,其实比较合理的方式是25%到30%,在中国是并不合理的。那是为什么呢?我们在选择影视的时候,能否进行价格档期,比如作品收视率,甚至这个人他和他的作品是不是相吻合?而很多情况下这个影星的价格往往是开拍前的价格,我本来拍部电视剧,别人说了,我非得让吴秀波来演,当然吴秀波演的戏适不适合他?都可以用数据来展示出来,现在之所以出现这个现象是因为劣币驱逐良币,信息不对称造成的。还有一个生产贡献,投资人最担心的是什么呢?我投资一部电视剧花了五千万,拍着拍着忽然钱没有了,那你是继续拍还是不拍?那么我能否对投资方式进行时实的监管,了解每一分钱和整个生产的进度,并且用数据可视化时实转给投资者和生产者。&[
[祝金甫]我们再看一下在新媒体时代观念已经变了,大家看一下最多的是通过笔记本,通过手机是22%,还有喜欢的电视剧类型是53%,职场偶像剧是34%,去年在春剧会上,整个参展是700部偶像剧,但是真正通过市场需求数据要达到34%的市场需求,而实际的供给量只有40%左右。大家都知道神雕峡侣翻来覆去的翻拍,还有故事情节,第三个是人生观。还有一个电视剧产业偏好,在新媒体最受欢迎的还是美剧,然后才是国产局,那么港据现在不像以前了,还有植入广告的,54%是在意,45%并不在意。也就是说你的植入比较好的话,别人可能也是能接受的。往往在一部电视剧里面明明是个富二代非要开一个破桑塔纳,那这样把整个的剧情都弄的不匹配、不合理了。&[
[祝金甫]那么上马一个项目之前能否用数据的形式了解你上马这个项目有多少,潜在的压力,生死线还有受众平台,假如我想拍一个谍战题材的电视剧,那么数据能告诉你,这个市场库存谍战有一百部,今年计划三十部,拍出来二十部,已经播出的十部谍战里面进入前五名的只有三部,如果你在向投资人说拍一部影视文化作品谍战题材的,前有堵截,后有追兵,你到底投不投拍?即使你投拍谍战题材的话,那么你与其他相比较,你是投资多,剧目优势还是导演优势。如果把所有的数据整合在一起并且能够表达出来这个时候对投资者的风险是能表达出来。这是第一点市场风险。&[
[祝金甫]第一个,有没有整合数据的能力,垂直纵深。还有一个,有没有挖掘数据的能力。我们看一下影视文化作品来说,之所以现在数据量非常大,我们始终喊着大数据时代,2013年大数据元年,2012年美国把大数据作为国家战略计划,那是随着硬件和软件的发展,人在手机包括PC终端,在网络的痕迹存储也成为一个大数据。当然85%是非结构化数据,并没有处理,视频、文字并不容易处理。15%是结果化数据,这就不多说了,体量大、价格大,这是比较官方的说法。还有一个,现在近几年的数据量90%是近几年产生的,也就是软件和硬件的发展。在2020年,整个数据量达到35G级,这是什么意思呢?就是3500万个亿这个G,就特别特别大就是和地球的沙子数量差不多。还有说了,数据光大没用,要进行。第一个是啤酒加尿布的故事,还有一个是塔吉特怀孕少女的事件。因为塔吉特是美国的一个超市,忽然有一天,一个中年男子闯进了超市,向超市的经理大吼大叫,说为什么往家庭里不停的寄送怀孕少女需要的物品。当时这个超市忙于道歉,回去之后进行分析,他对每一个超市的顾客进行综合分析,他发现这个顾客喝的全是怀孕妇女买的物品是相关的,所以不停往这个家庭里面寄送怀孕少女的东西,后来他的父亲来超市道歉,因为他的女儿确实怀孕了。也就是说,超市比这个少女的父亲更早知道这个少女怀孕了,这因为什么呢?数据的挖掘。第一个,塔吉特超市可以挖掘数据进行分析,所以数据光大没用,一定要进行挖掘分析。那么对影视作品来说,我们能否从全产业链的角度,来整合每一个环节的数据,然后进行分析和挖掘。那么第一个,我们在做一个影视作品的时候,首先分析一个市场风险,因为每一个制片人,他在投资或者销售自己作品的时候,都说自己的作品是最好的。就像每一个家长一样,都说自己的孩子是最漂亮的,每一个家长都是这样的,但是能否用数据的形式来策划你的孩子到底长得漂亮还是丑。&[
[祝金甫]最近影视剧蓬勃发展,很多卖烟花的、卖猪肉的,包括卖石头的全都进了这个行业。当然中国的影视剧跟美国好莱坞相比较差别非常大,之所以差别这么大,是去年的影视收入是296亿。但是为什么差别这么大呢?是因为资本或者一个影视文化没有很好的结合,就是影视文化属于轻资产,它是一个特点,但不是弱点。之所以大规模的资本不能进入这一个市场,那是因为什么呢?轻资产存在着一个风险评估的问题,总而言之就是一个版权定价的问题。因为它的文化艺术是感性的东西,它和其他的东西像实物房子它是看得见、摸得着的,它是可以定价分析的。我们今天讲一下,我们能不能从数据的角度,把文艺的东西,能否用数据化表示出来,来进行定价。我们大数据的时代,不是说数据越大越好,看数据有没有价值,不在于大而在于有没有价值。所以对一个大企业公司来讲,一个数据公司有几个特点。&[
[]还有一个信息网络传播权的保护条例里面实际对这个数字教材教辅的版权保护还是不到位的,还是有一些地方,有的地方明显钻了空,我就反复剪多段视频,每段视频我都加评论,所以说用各种方式来避开版权这种资源形式的缺陷。消极的一面一方面被传播容易侵权。另外还因为多媒体的作品制作带来许多困扰,就是说海量作品的版权的追踪,报酬的支付这些问题,这个里面网络版权的论纲里面分析的我感觉是挺好的。数字教学的应用,还插入多种媒体的场景。电子教材加工以教材为核心进行资源组织的过程可能也会造成侵权,重新处理这些资源。那么我们如何应对大数据背景下教材的版权问题,一个是完善法律法规,二是配套相应的数字数据的,登记版权归属。第三也是上海虹口进行电子书包实验的时候建立统一的资源鉴定平台,资源版权建立的平台。第四是利用大数据技术及时预测技术来进行防止侵权行为。谢谢大家&[
[李林]大数据刚才各位教授讲的很深入也非常好非常精采。大数据在很多人的眼里可能首先感觉这是个技术,这是一个积累记录,然后有这个定义是资产,环境大数据的环境,还有它是一个处理速度非常快。还有一个是过程方法和手段,处理数据的方法手段。那么大数据的版权有什么影响?一方面它有积极的一面,通过数据的分析、积累、挖掘、有利于教学和学习进行个性化、精准化、精确化的教学支持、学习支持的一块。另外也可以根据学生的比如说小学一年级到小学六年级它的学习过程出现了问题。然后随时的诊断反馈,也可以在他快要毕业复习之前给他出一本书个性化的教辅特别是高中到他毕业之前快要考试的一两个月针对他自己的个性化教辅。&[
[李林]上面五种处理方式。这是上海市的数字发行以及管理平台。这是对北京中小学教学资源网学习客户端,它是云端的数字教辅的延伸资源的版权问题数字教辅资源的版权问题分为数字教辅教材延伸内容资源的版权问题,首先是数字教材教辅的版权问题,数字教辅与纸质教辅的教材都是从辅助教材版权延伸而来,一般情况下本版的数字教材是代表自家辅助教材的版权提供,但是民营机构出的教辅就容易与教材的出版社之间产生纠纷。这个问题主要在哪呢?主要在教材的独创性的结构,任教授的语文和苏教授的语文签订的目录,各种情况齐全,就是它的独创内容。还有一个就是说我们常满的教学讲解是直接用那个内容这是侵权的,像同步教辅是用了教材的体系结构造成侵权的,还有用教材里面有原创的内容有非原创的内容,有公版的内容是没有什么事情的。就是非原创内容但是不在出版了,那这个也是有问题的,教材本身原创的内容也是容易造成侵权的。这个有时候开发的数字教辅的开发机构也是采取定制的模式,提供服务避开版权。其次是数字教材延伸内容资源的版权问题,这些延伸的资源包括图片、音频、视频动画、这些内容也可以分为独创性内容,和公版内容这一方面分别处理。还有再次数字教材配套应用软件的,我做的是软件,软件的数据库能潜入到别人教材的体制结构这也是有问题的。&[
[李林]第二种情况就是版权问题,民营数字教材开发机构开发基础教育出版社书教材的版权解决方式就有以下五种解决方式:一是直接与出版社签订数字化的授权,像民国教育等,例如宁波签订了30多家基础教育教材的数字化的版权。第二点是通过与基础教育教材出版社合作产品共同采取的版权,约定相应的利益分享方式。三是承担基础教育教材出版社的出品无偿开发,然后出版社默认开发者获得该产品的复制权包括延伸资源进行市场销售,四是由数字教材加工工具及承载系统但不具有数字版权的数字出版公司,学校及教育局提供加工定制服务的名义,帮助学校及教育加工上传数字教材,实际上这也是有问题的。第五个数字出版公司为具有数字版权的机构提供数字教材的加工机制流程标准制定与管控服务,帮助组织开发数字教材发行平台,数字教材的资源平台及客户端,数字教材内容管理平台并提供相应的运营服务。这一块我们在做整个上海市的和北京市的电子教材服务这一块。&[
[李林]数字教材的授权这一块它的解决方式。因为现在数字教材从2010年左右开始掀起制定电子课本数字教材的标准,到上海、北京都在北京市开发电子教材,它的这个版权的解决形式依然是一种一体化的形式,就是它的数字教材和纸质教材出版都是一个机构,本身它是不存在版权问题的。二是基础教育出版社数字教材的版权自然归属,比如说上海的整个基础教育教材就是上海市教委他出的数字教材不牵扯版权问题。然后像北京京版教材现在2011年审定的叫新京版教材,它的版权规北京教育科学院所有,所以这里面开发数字教材也不会遇到版权问题。&[
[李林]在这样一个格局下,进入数字教材,数字教辅的发展比较快的时期,跟在线教育的未来也是紧密相承的。版权配套的教辅一开始2010年出版总署对教辅的定价是非常高的,现在定本版教辅价格已经限制它了,但是走市场化的教辅这个价格限制还是不大的。这样就是说教辅出版机构往往有的是出版社本身,有的不是出版社本身。那是出版社它出版自己教材的教辅和别人出版他的教辅就冲了市场,这样首先以一家民营的教材出版社,他来保护自己的版权,教材的版权是用了非常强烈的手段来保护,由它来引起了整个基础教育出版社教材要求加工他的教辅,后来包括数字教辅,有教材的授权。&[
[李林]在我们这个新媒体互联网的迅速发展这种背景下,教材教辅的呈现形式、传播形式更加复杂化,版权的保护的复杂性就大大增加。首先我们看基础教育的纸制教材的。2000年前基础教材主要是上海和北京有自己的教材,2000年之后,2001年新教材标准实行之后教材是一标多本,就一个课程标准,一部课程标准多个教育出版社都可以出教材,是这样的一个情况。然后上海属于一个特别独立实验区,它有自己的课程标准,就是独立于教育部的标准。它的教材体系相对的比较封闭,北京当时也有自己的21世纪的实验教材,也有一套自己的实验教材,但是他也用别人的教材,但是上海是不用外地的教材的,就是在十多年的实践里。就是这两个直辖市形成了封闭和半封闭的教材体系,整个的教材在新课标里面形成三级教材,国家地方校本教材。 &[
[李林]感谢伍总,感谢陶教授的邀请。我介绍这个大数据不像咱们教授说的那么严谨,可能是融入、氛围、场景最综合性的东西,最主要是对基础教材的思考这一块。国际电子教材发展进入了这样的几个阶段,标准的分布阶段,盈利到信息化的阶段,早期市场阶段,实验阶段。我们可以给他分为三类的国家和地区发展的情况,第一类国家和地区美国和韩国发展的比较早,然后欧盟、新加坡、日本、第三类国家地区就是以色列和中国。这个是一个大的背景,然后我们看我们中国的基础教育教材市场的份额,教材有狭义和广义两个含义。一个是讲我们手里拿的最基本的教科书,如果把这些教材教辅都归纳到里面是广义的范畴。在我们国内基础教育教材教辅这一系列占我们整个的出版文化产值的2/3左右,教辅教材版权问题是在2001年之后这一块越来越激烈,版权的纷争方面。最主要的是教材教辅巨大的利益,因为教材本身它有法律的指导意见,中小学的教材,狭义教科书比较低,教辅可以高定价,这样它的利润空间就比较大。&[
[杨再石]下面再讲就是现在大数据比如说十万张图,四个大毛,10万张图由计算机学习,计算机归纳出这个图,因此猫的概念是计算机自动生成的,我想这个大数据时代的想法的变化。最后,我想我讲每个人都可以用计算机来分析你的照片和分析你的视频。这是我分析我自己的让计算机来分析分析出来之后英文我翻译成中文,首先说我是个男人,第二这是个肖像,第三是男子汉,下面一层就讲是个男孩、牛仔,戴帽子我没有戴帽子风吹起来了。第四层是个孩子,最后说一个人来,所以分析是完全正确,这个大家完全可以做。第二还可以做视频。这个是我自己的一段讲的超导体,这个是悬浮,现在可以悬挂,这个不演了,然后我让计算机分析出来以后,每一秒钟这个里头内容的大概什么都可以推算出来,已经到这个水平。而且这两件事情我们在场每个人都可以用。因此,我感觉到今天大数据不是不接地气的,是我们完全可以去用,我的发言完了。&[
[杨再石]第二个,要简单一点,时间关系。第二,因为有了这样,我们计算机今天已经达到通过计算机来识别图像,而且造出来,那么我想举这个例子,这个是一个图片。它是用了深度神经网络这个神经网络进行分析,神经网络在分析的时候是自我学习,一共学习9层,什么学习我今天不能讲了。学完了以后它提炼出了概念,用适量来表示。然后这个适量代码输给了语音生成的网络,他就把这个适量转成文字,因此我们看到计算机分析这个图片里面一群人在露天市场购物。第二句话在果蔬摊上有许多水果这个完全正确,我想已经达到这个水平了。&[
[杨再石]我讲的大数据第一个概念大数据是数字能源,因为对火箭来讲燃光有燃料是不能起飞的,必须有发动机,因此大数据的第二概念必须由算法,如果没有算法我们没用的。第二大数据要扁平化,每个人都要用,大数据是用出来的,而不是我们想出来或者搜集出来的。那么我想,我为了参加这个会我准备了一个可以讲40、50分钟的内容。我先讲一个最简单的一个东西,大数据刚才讲了一个是全数据,不能是抽样,抽样是人工干预客观数据,属于我们许多作假就可以在抽样里面作假。那么第二个概念,我想我简单一点,我想讲相关性。我们不讲逻辑,首先讲大数据时代的相关性。什么是相关性呢?我给大家大数据相关性,就是国王和王后。K是国王,M是男人,F是女人,Q是女王。那这个相关性是什么意思呢?我们看国王,全世界人都认为他是这个国家的男人,那么国王减去男人,剩下来的就是正国级的人。那么正国级的人加上女人就等于正国级的女人,因此最后正国级的女人就是王后,因此我们说的关系式就是国王减去男人加上女人等于王后,这是我们大数据时代,用到语言翻译的时候,是一个基本的假设。就是刚才我讲的这个关系,对世界各国来讲,一看就明白,不需要用语言去解释,因此语言翻译就可以用个适量来表示,这是第一个。&[
[陶丹]咱们这个叫大数据的版权管理,我们这四位专家所发言的内容都跟应该来说跟版权还是有相关性的,据我所知咱们李林专家好像就是做教材版权经营吧?一方面是教材版权,还利用教材版权来进行经营活动,所以这个是更高形式的版权。那我们郑铁男先生做的数字出版达到了很高的技术水平,我知道的杨再石教授一会儿要演示,刚才我们说了大数据看不见,一会儿杨教授计算机里面的就是一个大数据的网,用的是大数据的软件,他展示的就是一个大数据,大家看看他是怎么样在用大数据。还有我们祝金甫先生。杨先圣先讲。看看他怎么样运用大数据。&[
[主持人]感谢王教授,非常感染人心的一段报告。那也感谢其他两位专家的精采分享,下面我们进入到论坛讨论的环节,我们首先有请河北大学新闻传播学院教授、博士生导师 陶丹主持"大数据时代的版权管理"论坛。嘉宾有中文在线副总经理李林、高等教育出版社原副总编辑杨再石、北京工商大学副教授祝金甫、北京(山东)斯麦殖霭婕际跤邢薰径鲁ぶL小S星敫魑唬&[
[王立新]所以,做风投的人,做金融的人对这个很感兴趣。有两个工具我觉得很重要,第一个当然是业内的非跨界的比如说中国移动曾经让我操盘过一个应用。最后讲一个故事,如果我是张瑞敏,怎么改变海尔冰箱利用大数据赚钱,所以那一台冰箱生产成本1200元人民币,最后的利润只有38人民币,如果用大数据赚钱我的口号第一句话海尔冰箱不要钱白送,第二句话在海尔冰箱里面加两个功能,第一个加信息扫描系统扫二维码,第二把这个路由器装在冰箱里发送到海尔的云数据库,永远不赚消费者的钱,冰箱买走。第二句话,你要买东西不要去商场直接给我打电话有人给你送。第三价钱便宜一半。第四冰箱里面的食品过去了,永远免费提供预报、信息化受众。只要落到这四条所有的家庭主妇都愿意接受这个。而这时候你可以采集大数据,这里面家人买了什么食品、牛奶放在里面喝掉多少,耗掉多少都知道,所以掌控了这个需求就很高兴,通知汇源果汁、通知可口可乐、通知青岛啤酒,然后打压他们的生产成本。这样的话假设一个家庭一个月用两千块钱的放在冰箱里只赚10%就是200,6个月收回冰箱的制造成本。10年可以赚15000多元纯利润,你是卖冰箱的38元的纯利润还是想在未来十年赚到一万到两万的纯利润呢?就是采集数据、精准匹配、拼公司、平台化反向收费永远代表用户的利益,免费,谢谢大家!&[
[王立新]把吃喝拉撒睡全赚了,这就是BAT模式,看到了吧。一群人分析他的全数据让王立新玩游戏、买淘宝、看新闻、所有的需求玩迪斯尼,看迪斯尼,旅游迪斯尼,总而言之就是要赚你的钱,第二就是输入汽车两个字就可以看到12亿人、13亿人最近有哪些在谈论点击或提到过汽车,这就是大数据垂直的模式。第二个功能是什么?永远只赚一种需求的钱,但是是满足所有人。如果我建立一个汽车数据库,我就能赚汽车行业的钱,这叫垂直的满足所有人。第三个是什么?IPO孵化,通过大数据来风险精准投资,孵化应用,去上市骗股民的钱。&[
[王立新]所以,大数据正在成为未来媒体的最核心的最有价值的内容本身,第二大数据本身又帮助媒体去实现私人定制。所以我特别想去注册私人定制。冯小刚拍一个电影最后被工商局驳回。第二个问题就是大数据的平台应该怎么样,第一个实现功能,第一个是输入对象的IP地址和省份,姓名或者电话号码就能看到这个人最近几个月到底浏览过什么?这叫基于个体全数据分析的运营。输入王立新,王立新过去三个月当中所有吃喝拉撒睡,所有的信息都能看到,这样的功能的结局是什么?永远赚王立新所有的钱这就是第一个商业模式。&[
[王立新]第三个什么叫新媒体,数字化、互动化这些我觉得都是表象,新媒体我用一个词来把它概括叫个媒体时代,新媒体的本质是个媒体,两个方面定义,每一件被智慧化、被芯片化的物体和人都成为一个独立的媒体而融入物联网、云计算和移动互联网。包括媒体浏览、每一辆车、每一个井盖你给他加了RFID的芯片它就是一个自媒体,所以媒体在不断的向世界发售他的信息为容,这些内容对很多人是极其有利的。比如说我们的井盖公共设施经常被人半夜偷掉,如果这个井盖被智慧化、芯片化之后只要有人动它那就发出一条信息,我是长安街7号井盖,正在被人往西南方向移动。所以相关的警察和市政部门就会向西南方向挺进。反过来,你们家的酸奶,比如王立新家的孙奶是有生产和保质期的。王立新在这儿讲的热闹,手机响了,"主人,别讲了,我是你们家的第四号酸奶,再过俩小时你不喝掉就过保质期了。"所以从战略意义上来讲所有的媒体都会被物化,从这个意义上来讲媒体的新概念,第二个是媒体的消费一定是按需的。比如说王立新喜欢看什么?所以以后一个大的业务是什么?除了新浪、微博、微信的自媒体,还有就是品牌。习大大的媒体关注,习近平同志最近几天他浏览过的新闻信息排行榜是什么?各个省委书记一定愿意花大价钱来看这个排行榜,王立新最近看什么不值钱,习主席在看什么值钱。&[
[王立新]但是供过于求造成经济危机的浪费,所以在1945年芝加哥两个研究生利用两位大师的论文终于制造出了人类第一台计算机。据说当时老总听他儿子说这个事情的时候,说这么庞大的笨重的一个东西全世界总共能卖7台就不错了,所以到2010年为止全世界一共卖出了41、42台计算机,当时只有7台。所以计

我要回帖

更多关于 中国媒介市场 的文章

 

随机推荐