想配‍资有跟训视资管炒股的吗,不知道风控怎么样

看到很多人都回答了,忍不住手痒回答一下吧,尽量撇掉技术细节,让大家都看得懂。&br&&br&先反对一下排名第一同学的回答(在我点了一个反对后该答案神奇地跌出了前三……知乎权重算法威武),事实上支付宝和微信的“当面付”产品,是一款联机在线支付产品,所以不允许双方均离线的场景下支付(这一点和公交卡圈存支付不一样,公交卡的近场支付事实上允许双方脱机)。&br&题目中所知的支付宝和微信没有网络,指的都是消费者客户端没有网络,而不是双方都没有网络。&br&严格来说,当面付产品(特指商户主动扫消费者钱包客户端上的token码进行支付的形态)必须要商户在线方可进行联机交易,原因有以下两点:&br&&ol&&li&支付公司为了保证资金安全必须要确保每笔用户的支付行为背后都真正发生了资金扣款,所以在线联机确保支付成功是必要的。&b&(这里解释了为什么不允许双方脱机)&/b&&/li&&li&商户为了确保用户的支付结果可信赖,必须要自己的终端或者系统从支付公司获得支付结果,而不能以消费者的支付结果凭证作为结论。以传统POS业务举例,你可以认为你的刷卡信息等同于支付宝的当面付码,商户必须要看到POS机打出支付成功单据后才认为支付有效,如果POS支付超时没有回执,光凭客户手中的银行短信通知是不会让客户走的,而是会冲正掉上一笔交易让客户重新刷一笔。&b&(这里解释了为什么要选择商户必须联机的方案)&/b&&/li&&/ol&那么,我们来看看一个标准的当面付产品的信息流是什么样的(原谅我草草画了一下):&br&&figure&&img src=&https://pic3.zhimg.com/50/v2-17cfb71bb42e941c85920f_b.jpg& data-rawwidth=&928& data-rawheight=&284& class=&origin_image zh-lightbox-thumb& width=&928& data-original=&https://pic3.zhimg.com/50/v2-17cfb71bb42e941c85920f_r.jpg&&&/figure&&br&我们可以看到在这个图里红色圈圈部分,商户系统和支付宝系统是对接上的,所以商户系统是联机的——而用户的手机,在展示code的时候,我并未强调是否和支付宝服务端联机。&br&事实上,不论是微信还是支付宝都支持两种用户码生成模式,即在线码和离线码。&br&在线码其实很容易理解,用户目前是登录钱包的状态,只要点击【付款】按钮,客户端就向支付宝的服务端申请一个针对这个客户账户的支付凭证码并展现到客户手机上。&br&这个支付凭证码在支付宝的服务端会有一组数据库记录其与真实客户账户之间的关联,并且这份关联的有效期为60S,超过时效即便商户上送这个码,支付宝也会认为这是作废码而不予处理。&br&用户每次点开【付款】、等待超过60S、主动刷新付款码,都会触发客户端向服务器申请一个新码的请求。&br&这个方案的好处是:&br&&ul&&li&&b&相对&/b&安全,每次码都是服务端生成。&/li&&li&业务灵活,即便对码的安全算法等进行较大的调整,也不用升级客户端,因为是服务端发码。&/li&&/ul&这个方案的坏处也显而易见:&br&&ul&&li&用户的手机客户端必须在线联网,如果没有网络则无法获取付款码&/li&&li&用户即便在线,如果网络连接不好,也会出现点了付款等好久才看到码的情况,体验会不可控。&/li&&/ul&&br&为了解决在线码方案的问题,离线码方案就出现了。&br&离线码的基本技术原理其实也不复杂,可以参考 &a data-hash=&64f9cf48a297bf3d6dce037c07d79e96& href=&//www.zhihu.com/people/64f9cf48a297bf3d6dce037c07d79e96& class=&member_mention& data-editable=&true& data-title=&@反方向的钟& data-hovercard=&p$b$64f9cf48a297bf3d6dce037c07d79e96&&@反方向的钟&/a& 的回答,比较简单的实现方式是: &br&用户登录后,服务端通过可信网络向用户客户端发送一个&b&种子数据&/b&(每个客户的种子数据唯一,换用户登录后销毁原种子,重新下载种子)本地保存,当用户点击【付款】时,客户端利用这个种子数据+时间戳+一套安全算法可以生成一串数字,即离线码。&br&当用户使用离线码支付时,服务端通过一定算法校验这个码的确是来自于这个用户,随即确认用户授权完成支付。&br&离线码的好处不言而喻:&br&&ul&&li&用户无需在线,就算在地下室等没有网络的场景一样可以使用&/li&&li&由于不依赖网络,所有码本地生成,所以客户体验很好,一点付款码就能出来&/li&&/ul&那离线码的劣势呢,我们看看:&br&&ul&&li&用户root/越狱手机后,保密存储的种子数据有可能被不法分子利用恶意程序获取到,导致离线码被随意生成用于消费。&/li&&/ul&恩……怎么说呢,毕竟现在不是发烧友主动root越狱的用户并不多,这是其一。&br&即便是root越狱,如果用户使用手机的习惯良好,被恶意程序攻击手机的概率也很低,这是其二。&br&每家公司都有自己的安全团队去保障自己客户端的数据安全,并不是说root的用户就只能坐以待毙了,否则微信和支付宝早被搞破产了,这是其三。&br&&b&当然从我个人的角度来说,普通用户我都不建议去root或者越狱。&/b&&br&这个问题最粗暴的方案就跟反方向的钟所说的一样,监测到系统被root了就对用户限权(很多银行的客户端方案都是这么搞的)。&br&作为直接面向消费者市场且充分竞争的产品,微信支付和支付宝断然不会采用上面那个方案的。&figure&&img src=&https://pic1.zhimg.com/50/v2-8aaea65ffb418_b.jpg& data-rawwidth=&64& data-rawheight=&61& class=&content_image& width=&64&&&/figure&怎么能又开放离线码给用户,又能确保用户支付安全,本身也是支付公司安全竞争力的一部分,这里就省略几万字了。&br&&ul&&li&数据碰撞可能导致A用户的码扣到B用户的账户&/li&&/ul&恩,这里涉及一些算法问题,业务上就是碰了巧了A用户码算出来和B用户码一模一样且都有效(两个客户端都没作弊)。&br&在线码之所以可以避免这个问题是因为在线码是服务端发的,可以控幂等。&br&离线码是客户端自己根据算法生成的,所以没法控。&br&其实原因和哈希算法的数据碰撞类似,是个小概率的纯技术问题,就不展开赘述了。&br&解决方案:优化算法(确保碰撞概率低到一定程度甚至杜绝),如果真的出现就认栽给客户赔钱(赔多了技术部门老大就肯定痛定思痛优化算法了)。&br&事实上这个问题发生的概率极低极低,所以可以忽略不计。&br&&ul&&li&算法调整不如在线码灵活&/li&&/ul&因为离线码生成逻辑都在客户端,所以通常来说安全算法升级会导致客户端升级,比在线码升级更影响用户一些。&br&&br&分析到上面这层,各位产品经理相信应该就知道如何做方案选型了。(装个逼,事实上我觉得了解到上面那个层面是支付行业产品经理的基本素质)&br&&br&后话:&br&我在写这个答案的时候其实都在刻意回避公司实现这些业务的具体逻辑和算法。而我个人并非当面付产品的产品经理,所以大家放心,这篇文章不算泄密。&br&写这个答案的目的是希望能尽量站在产品和业务角度还原业务原理,希望更多的非行业内的知友知其然,也知其所以然。&br&答案虽然写得有点乱,但也好歹花了一个小时,看在这个份上,大家多提提意见和指正错误,少些喷喷。等我有空了再改改用词和排版,争取让大家读起来舒服点。&br&闪了。&br&&br&哦,对了,一如既往地。支付宝国际事业部招聘靠谱产品经理,请用简历把我砸死吧。
看到很多人都回答了,忍不住手痒回答一下吧,尽量撇掉技术细节,让大家都看得懂。 先反对一下排名第一同学的回答(在我点了一个反对后该答案神奇地跌出了前三……知乎权重算法威武),事实上支付宝和微信的“当面付”产品,是一款联机在线支付产品,所以不…
&figure&&img src=&https://pic2.zhimg.com/v2-bee0d7c6f4cd2e65ca9ac9c95dc3cf45_b.jpg& data-rawwidth=&1068& data-rawheight=&645& class=&origin_image zh-lightbox-thumb& width=&1068& data-original=&https://pic2.zhimg.com/v2-bee0d7c6f4cd2e65ca9ac9c95dc3cf45_r.jpg&&&/figure&&p&Transformation 是本次 Werner Vogels keynote 的主题。为了契合这个主题,他还穿了印有汽车人标志的T恤上台演讲。这个 keynote 非常值得反复观摩 —— 整个 keynote 的表面上的核心是:我们如何通过 development,data,compute 上的革新来帮助客户成为 internet scale 时代的 transformer,但细思下去,这是一个 aws 架构蓝图和产品路线图的一个回顾和总结。&/p&&p&Werner 把这总结分成了三个部分:development,data,compute。&/p&&h2&Development&/h2&&p&internet 时代的软件开发有很多挑战,尤其在运营(运维)上。软件需要构建,部署,监控,动态伸缩,保证安全性等等。&/p&&p&之前 aws 对于运维的支持主要体现在各种产品,从计算到存储到数据库到消息队列等等的 scaling 上,几乎所有的工具都具备 internet scale 的能力。然而,由于其它运维工具的缺失,用户不得不采用第三方的工具:监控使用 new relic / datadog / ...,构建使用 travis / codeship / ...,日志处理使用 loggly / splunk / ... 各种各样的第三方工具增加了额外的研发开销。&/p&&p&所以,很自然地,amazon 将触角延伸到了这个领域。之前的 codeCommit,codeDeploy,codePipeline,opsWorks 等只是序曲,今年发布的一种服务,让整个运维的拼图更加完整:&/p&&ul&&li&&p&AWS OpsWorks for Chef:Chef 的支持装进了 OpsWorks&/p&&/li&&li&&p&Amazon EC2 Systems Manager:对于 EC2 从软件安装,系统更新,资源配置等一系列运维活动进行管理。&/p&&/li&&li&&p&AWS Codebuild:在 codeCommit 和 codeDeploy 中缺失的环节终于被补齐了。直接对现有生态圈中的 travis 等构建工具造成威胁。&/p&&/li&&li&&p&Amazon X-Ray:千呼万唤始出来,aws 终于有了自己的 APM 工具。new relic 们要当心了。&/p&&/li&&li&&p&Personal Health Dashboard:这个貌似是对服务状态的一个监控,让你了解你自己的软件是否处在一个健康水准。&/p&&/li&&li&&p&AWS Shield:在不同的层级上对 DDOS 进行自动防范。DDOS 已经成为 internet scale 时代的一个公害,最近对 DNS 服务的 DDOS 让包括 github 在内的很多公司都吃了瘪。&/p&&/li&&/ul&&p&这里面,最振奋人心的是 X-Ray 服务。分布式系统的调试和性能监测是个复杂的问题,传统的 APM 只能通过在目标机器上装 agent 来收集代码运行的状况。如果目标系统无法安装 agent,则无能为力。在 aws 的 serverless 架构下,lambda,dynamodb 等都属于性能监控的黑洞。而 X-Ray 由于是 amazon 自家的监控产品,自然能拿到第一手的可信资料。&/p&&figure&&img src=&https://pic4.zhimg.com/v2-d82a87ac9fded6243aefe40fe32acd64_b.jpg& data-rawwidth=&1600& data-rawheight=&1200& class=&origin_image zh-lightbox-thumb& width=&1600& data-original=&https://pic4.zhimg.com/v2-d82a87ac9fded6243aefe40fe32acd64_r.jpg&&&/figure&&h2&Data&/h2&&p&Werner 在这个环节里在玩一个拼图游戏,他把数据分析的工作分成了十个部分:&/p&&ul&&li&&p&automated and reliable data ingestion:数据的收集目前有 S3,Kinesis,snowball,dynamodb streams&/p&&/li&&li&&p&perservation of original source data:源数据的持久化可以通过 S3,EFS,EBS,dynamodb,RDS 完成。&/p&&/li&&li&&p&lifecyle management and cold storage:S3 / glacier 提供了完整的数据 life cycle —— 热数据到冷数据的全部方案。&/p&&/li&&li&&p&metadata capture:&/p&&/li&&li&&p&managing governance, security privacy:这是 aws 的强项,aws config,cloudTrail 进行配置和监控;KMS 对数据进行安全保障(confidentialality,accessibility,consistency)。&/p&&/li&&li&&p&self-service discovery, search, access&/p&&/li&&li&&p&managing data quality:elastic mapreduce 可以对数据进行处理。&/p&&/li&&li&&p&preparing for analytics&/p&&/li&&li&&p&orchestration and job scheduling&/p&&/li&&li&&p&capturing data change&/p&&/li&&/ul&&p&然而,如上所示,这个拼图只完成了一半:&/p&&figure&&img src=&https://pic4.zhimg.com/v2-52bdcc7f0f4b8_b.jpg& data-rawwidth=&1658& data-rawheight=&938& class=&origin_image zh-lightbox-thumb& width=&1658& data-original=&https://pic4.zhimg.com/v2-52bdcc7f0f4b8_r.jpg&&&/figure&&p&因此,新发布的 AWS glue,通过 data catalog 和 ETL 支持,把另一半也囊括了:&/p&&figure&&img src=&https://pic3.zhimg.com/v2-393fb7de0dcf3d75fe8ec1_b.jpg& data-rawwidth=&1842& data-rawheight=&958& class=&origin_image zh-lightbox-thumb& width=&1842& data-original=&https://pic3.zhimg.com/v2-393fb7de0dcf3d75fe8ec1_r.jpg&&&/figure&&br&&p&由此,我们可以拥有一个完整的数据处理架构:&/p&&figure&&img src=&https://pic4.zhimg.com/v2-fd4a074f2b59be0db2d6_b.jpg& data-rawwidth=&1600& data-rawheight=&542& class=&origin_image zh-lightbox-thumb& width=&1600& data-original=&https://pic4.zhimg.com/v2-fd4a074f2b59be0db2d6_r.jpg&&&/figure&&h2&Compute&/h2&&p&2014 年,aws 发布了 lambda,作为其计算架构的一个补充。自此,数据库有了 serverless 的 dynamodb,计算方面又有了 serverless,pay as you go 的 lambda。一个应用程序,可以通过 S3 web hosting(SPA) + API gateway + lambda + dynamodb,不用任何一台服务器搭建而成,且能够满足海量的访问,基本不存在任何 scaling 的问题。某种程度上,lambda 是 aws 有勇气自我革新的一大佐证。在使用 lambda 之后,原先很多 EC2 / ECS 使用的场景可以被取代,用户可以用更小的花费完成更多的工作。尤其后来 API gateway,dynamodb stream,s3 event 可以触发 lambda,更是让 lambda 的使用场景大大扩展。下图是 EC2/ECS/lambda 的一个对比:&/p&&figure&&img src=&https://pic2.zhimg.com/v2-4c480cd0c04dbbf759b65e8c9aa58c5f_b.jpg& data-rawwidth=&1600& data-rawheight=&632& class=&origin_image zh-lightbox-thumb& width=&1600& data-original=&https://pic2.zhimg.com/v2-4c480cd0c04dbbf759b65e8c9aa58c5f_r.jpg&&&/figure&&br&&p&在 aws 的计算版图中,lambda 的地位越来越重要。此次发布的 AWS step function 和 lambda@edge 几乎预示了未来 internet scale 应用的发展方向。&/p&&p&先说 lambda@edge。对于这个无比重要的功能,Werner 几乎是几句话带过。&/p&&figure&&img src=&https://pic2.zhimg.com/v2-397eab1daa4b5ab4bf51a2e_b.jpg& data-rawwidth=&1600& data-rawheight=&936& class=&origin_image zh-lightbox-thumb& width=&1600& data-original=&https://pic2.zhimg.com/v2-397eab1daa4b5ab4bf51a2e_r.jpg&&&/figure&&br&&p&aws 把 lambda 放在了 CDN 中!&/p&&p&aws 把 lambda 放在了 CDN 中!&/p&&p&aws 把 lambda 放在了 CDN 中!&/p&&p&这画面美得不要不要的!以前 CDN 只能分发静态内容,或者对要分发的静态做一些预置的处理,比如说图片的 resize。lambda@edge 把对内容进一步处理的选择权交给了用户 —— 应用程序开发者。使用 cloudfront + lambda@edge,突然之间,我们有了把处理能力部署到全球(暂不包括我大宋),到离用户最近的地方。&/p&&p&我举个栗子。客户端访问 CDN 上某个视频。根据 user-agent,lambda 可以把对这个视频的访问 rewrite 成另外一个 url(比如 appletv 提供 1080p 的视频,iphone 提供 480 的视频)。这对于像 tubitv 这样拥有十几种客户端平台的应用来说,可以对外只使用一个视频 url。&/p&&p&再举个桃子。客户端界面的 A/B testing 可以在 CDN 上完成。lambda 可以解析 http request 里面的 cookie(或者 query string 里的 device id,authorization header 里的 token 信息),来确定访问者的身份,从而为其提供合适的 A/B testing 资源。&/p&&p&甚至,我们可以对图片 / 短视频 / 语音资源 进行 on-the-fly 的 transcoding。比如说对于一个视频广告平台,其广告是动态获取的,为了适应不同的平台访问,需要转码。如果这个操作在 CDN 端完成,而非 CDN -& origin -& transcoding -& origin -& CDN 走上一大圈,那么第一次访问(广告还没有被转码)时的用户体验会大大增强。&/p&&p&再说说 step function。它把 lambda 的能力大大提上了一个台阶。连 Werner 本人都说,这是本次 keynote 最重要的产品发布!&/p&&figure&&img src=&https://pic3.zhimg.com/v2-c952fbb74daaa7f6c8862ec_b.jpg& data-rawwidth=&1600& data-rawheight=&958& class=&origin_image zh-lightbox-thumb& width=&1600& data-original=&https://pic3.zhimg.com/v2-c952fbb74daaa7f6c8862ec_r.jpg&&&/figure&&figure&&img src=&https://pic1.zhimg.com/v2-f7b31d4d_b.jpg& data-rawwidth=&1600& data-rawheight=&573& class=&origin_image zh-lightbox-thumb& width=&1600& data-original=&https://pic1.zhimg.com/v2-f7b31d4d_r.jpg&&&/figure&&p&我们知道,lambda 虽然有按使用次数付费,几乎无限的 scaling 能力,但限制其大范围使用的一个很重要的原因是不好管理和协同。每个 lambda function 都是一个松散的,事件触发的微服务,如果要让多个 lambda functions 协同完成一个复杂的状态机,开发和管理起来会非常痛苦。拿最重要的同步来说,目前我们的方式是:function chaining,database 和 queue。这些方式都各有优劣。&/p&&figure&&img src=&https://pic1.zhimg.com/v2-90f0a310efea98fce5c97c_b.jpg& data-rawwidth=&1600& data-rawheight=&723& class=&origin_image zh-lightbox-thumb& width=&1600& data-original=&https://pic1.zhimg.com/v2-90f0a310efea98fce5c97c_r.jpg&&&/figure&&br&&p&我们希望有一套更好的控制流程来管理和同步 lambda,并且将这个流程可视化,让一个状态机的处理一目了然。step functions 提供了这种可能:&/p&&figure&&img src=&https://pic4.zhimg.com/v2-c81c9cacd516_b.jpg& data-rawwidth=&3038& data-rawheight=&1540& class=&origin_image zh-lightbox-thumb& width=&3038& data-original=&https://pic4.zhimg.com/v2-c81c9cacd516_r.jpg&&&/figure&&br&&p&把 step function 和 X-Ray 结合起来,lambda 协同困难和调试困难的局面将得以大大缓解。以后等我实验过 step function 后,再详细讲讲它的能力和不足。&/p&&p&以上是我对 Werner 的 keynote 的一些我认为重要的功能的解读。完整的 keynote 已经在 youtube 上可以访问,墙裂建议大家去看看。&/p&&p&细心的读者看到这里,心中可能存疑:本文的标题是 primitives not framework,文章都快收尾了,怎么这句话提都没提?&/p&&p&这句话出自今年早些时候 Werner 的一片博文(&a href=&https://link.zhihu.com/?target=http%3A//allthingsdistributed.com& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&allthingsdistributed.com&/span&&span class=&invisible&&&/span&&/a&):10 Lessons from 10 Years of Amazon Web Services,当时我甚至为此写了篇解读,只不过自觉质量不高,狗尾续貂,就没好意思发出来。&/p&&p&翻看当时的文字,其中有一段,我是这么写的:&/p&&blockquote&&p&Primitives not frameworks —— 醍醐灌顶。当 Google 意识到这一点,废掉 GAE,祭起 GCE 反攻时,为时已晚。从战略的角度,IaaS 以一种传统 IT 企业,IT 人才都懂的方式(computing,storage,database,IPC)提供乐高积木,任由这些对新生事物还缺乏信任的人们以其熟悉的方式灵活构建或者重塑它们的系统。这个过程漫长一些,但稳当。而 PaaS 则试图一步到位,提供一个优秀但固化的架构,把一切统筹起来。表面上看,PaaS 怎么看怎么比 IaaS 先进,但由于步子迈得太大,学习和迁移成本过高,传统企业用不了(跨度太大),创业公司用不好,反而败给了看似更落后的 IaaS。当 amazon 把 storage,computing,database 这些 primitives 构建完善,客户用得得心应手后,顺势切到 PaaS,提供各种各样的高端功能,才是正确的方式。&/p&&/blockquote&&p&从 2006 起,aws 就一直在稳稳当当地提供云时代的 primitives:&/p&&ul&&li&&p&计算:ec2,ecs,lambda&/p&&/li&&li&&p&存储:s3,s3 infrequent access,glacier,snowball,snowmobile&/p&&/li&&li&&p&数据库:rds,aurora,dynamodb&/p&&/li&&li&&p&消息队列:sqs&/p&&/li&&li&&p&大数据:kinesis,redshift,emr,elasticsearch service&/p&&/li&&li&&p&安全和身份识别:iam,sg,kms,directory service&/p&&/li&&li&&p&网络:route53,vpc,cloudFront&/p&&/li&&li&&p&运维:cloudWatch,codeCommit,codeBuild,codeDeploy,opsWorks,X-Ray&/p&&/li&&/ul&&p&这个家族从起初的几种核心服务,一路狂飙到现在的几十种服务,涵盖打造 internet scale application 的方方面面。它提供了足够的灵活度:你可以自己在 EC2 上构建一个 machine learning 的系统,也可以使用 EMR 专注于你的模型的打造,甚至,如果你想处理图片识别或者语音识别,你还可以直接使用 Rekogniton / Lex 等工具。它们构建了一个无可匹敌的 herd,一个互为支援的航母战斗群:&/p&&br&&p&而它的老对手们,已经被甩得越来越远。&/p&&p&&br&这是好事,也是坏事。衷心希望 azure 和 GCE 能够大踏步追赶,让这个领域始终保持充分的竞争,这,才是用户,甚至整个行业的幸事。&/p&
Transformation 是本次 Werner Vogels keynote 的主题。为了契合这个主题,他还穿了印有汽车人标志的T恤上台演讲。这个 keynote 非常值得反复观摩 —— 整个 keynote 的表面上的核心是:我们如何通过 development,data,compute 上的革新来帮助客户成为 in…
“互联网金融”的热度正在快速退潮,当然如果是那些P2P之类,已经是2015年就已经开始走上这一条长长的下坡路了。&br&&br&就单从互联网技术的应用来看,实际上很早就开始武装传统金融行业,例如证券交易、ATM机、POS机等等。但这一些互联网技术手段的应用通常不被认为是“互联网金融”的范畴,所谓的互联网金融,可能主要拥有以下特征:&br&&br&一是去中心化,通过技术手段保证可信,而不需要一个最高权威的机构。比如中央银行的货币体系和区块链数字货币,比如众筹相对于传统证券基于监管机构、券商、交易所的中心化发行渠道等等。&br&二是去媒介化,纸币可能是第一个被消灭的东西,互联网金融宣称未来要消灭的包括银行线下网点、理财顾问、券商保险经纪人等传统金融机构的实体触角。&br&三是算法化,做到极致的就是芝麻信用分,一个人等于一个数字,具体不展开了。总而言之就是通过“大数据”,对在经济社会活动中留下的碎片化数据和线索进行收集整理,推断出个人的消费偏好、行为习惯、支付能力等指标,综合评价风险。通过一系列的算法,辅以积累的天量用户数据,风控可以不接触客户而“凭空”得知客户的大致资信状况。&br&&br&由于互联网金融具备的以上主要特征,曾经被寄予厚望可以去“颠覆”传统金融机构的垄断,并且也曾经受到了诸多政策层面的扶持和鼓励,然而到2016年底的今天,互联网金融已经成为一个贬义色彩的词汇,而P2P等更是开始与诈骗、传销之类挂钩,成为人人闻之色变的东西。那么究竟发生了什么?先聊聊几种主要的业态的现状,当然肯定没法做到客观完整,欢迎补充指正。&br&&br&&br&一、互联网金融的旗手P2P旗帜落地&br&&br&P2P曾经设想的是用户通过外部输入的数据,主要基于用户的网上行为数据并且结合一些可信机构提供的线下数据,和持续的借贷行为数据形成信用评价,并且根据这些数据能够形成风险控制模型,优化借款人的授信额度,从而实现贷款利率可以覆盖风险成本和运营成本。在这个设想中,相比银行,P2P网贷公司不需要线下信贷员,不需要庞大的风控团队,不需要开设笨重的营业网点,存款和贷款可以直接导通。这是最早人们对于Lending Club惊艳亮相时的美好期许。&br&&br&但是这个方案的致命缺陷在于,一方面,不是只有一两家P2P平台,而是最多的时候有成千上万家,这些平台之间的信息流动速度和质量均非常差,虚报信息、欺诈、重复借款等行为无法互联互通(缺乏信任或没有利益分享机制),而相较传统金融机构,有一个中心化的央行征信系统来解决前述的信任和分享机制的问题。很多借款者根本没打算积累信用,赚一把就走。&br&&br&另一方面,由于传统金融机构在数百年的时间里面不断传承完善,从服务质量的角度而言,远非新生P2P可比。因此最优质的客户早已黏在传统金融机构的实体组织包括网点、信贷经理、私人银行顾问等之上,导致P2P的实际用户群体主要来自传统金融机构无法触达或者拒绝服务的资金需求者。因此P2P的借款端实际上是次级的客户,对应更高的风险,需要有更高的利率来覆盖,而利率相比基准利率高到一定程度,超越绝大部分理性的资产回报率的时候,将会扭曲借款者的选择。前来借款的人要么是绝望,要么没安好心,并导致前述效应恶性循环;&br&最后,新生的P2P缺少银行的强势政治地位,合法的追讨手段较少,如果做坏事却没有办法施加相应的惩罚,将会出现借款者的道德风险,即老老实实还高息贷款,变成补贴那些违约的不诚信者,那么诚信者会越来越少。&br&&br&所以基于上述原因,刚开始想当个好人的P2P网贷公司,要么死于坏账损失,要么进行自融向着非法集资的道路越走越远,要么蜕变成为传统金融机构,搞线下团队进行展业和风控。可见传统金融机构的业务模式仍然难以撼动。&br&&br&另一头,风险事件和宏观经济形势导致合规监管压力越来越重。层出不穷的诈骗组织打着创业创新的旗号,以便利的互联网金融组织方式行传销诈骗之实。由于前期监管的覆盖盲区,最终出现了巨额旁氏资金崩盘,导致恶劣社会影响的后果,这又以P2P为重灾区。中国的金融监管机构在2015年出现险些动摇整个金融秩序的股灾之后,当前的首要任务是防止出现系统性风险,去杠杆。因此对于P2P的态度从鼓励转向剿灭,先期只是发一些规定例如不得自融等,后需要金融机构托管,这是实实在在增加成本的措施,最后干脆必须银行托管+地方金融办批文,实际上接近于禁止新的P2P进入市场。&br&&br&二、股权众筹,曾经被寄予厚望,但已麻烦缠身&br&&br&曾经我个人也对股权众筹有着也许可以成为一个新兴股权投资业态的方式的期许,我个人曾经想过众筹能不能成为一种为标准化股权产品如定增等提供快速私募募资、降低上市公司定增投资门槛的一种新模式,并且投入了不少精力进行研究论证。&br&&br&但遗憾的是,股权众筹如果定位于目前这样对接早期项目和散户,这条路是很可能走不通的,主要原因包括:&br&(1)早期项目风险极高,不适合散户的风险偏好,&br&(2)早期项目需要通过投资组合来平衡风险和收益,投资单一项目几乎不可能成功&br&(3)质量上佳的早期项目需要的是投资机构的战略资源和服务,资金本身并不是主要关切,这也意味着没有大品牌背书的众筹机构不太可能获得较好的投资项目。反过来说,大品牌的投资机构也不担心融资的问题,而在乎LP是否符合投资机构的风格和偏好,能否带来一些额外的资源和帮助。因此在资产管理这个相对面向中高端客群的行业&br&(4)去中心化的募资代表无力管理风控,对于早期股权投资这种信息极度不对称的行业,众筹平台无法同时扮演存在潜在利益冲突的财富管理者及投资银行或FA的角色,而这对整个商业模式是灾难性的。&br&&br&从2014年末到现在,股权众筹平台由于传统金融机构毫无兴趣,主要由一些互联网公司推动,几乎没有例外地遇到众多麻烦,主要原因也可想而知。&br&&br&三、互联网保险,风还没吹起来&br&&br&保监会条线在金融监管御三家中相对最为宽松,因此也诞生了不少新的玩法,例如一些车险比价平台、基于用户行为模式的UBI车险、互助保险等等。保险行业我不是特别熟悉,就从我粗浅的认知来看,相对标准化的产品主要是车险和场景保险(例如旅游险航空意外险之类)。但车险似乎对于保险公司自身而言,某种程度上也是为带动盈利主要来源的非标人身保险所做的引流产品。因此对于车险分销体系而言,类似保险比价等“创新”,实际与保险公司的利益存在直接冲突,且对外供应的常规车险产品往往有着刚性的底价,因此如果平台需要招揽人气,往往将渠道费用全部让利甚至额外补贴给车主或中介,导致失去盈利模式。&br&&br&UBI车险面临的主要问题可能是中国的法律法规对于人和车的绑定关系不严,数据采集的准确性受到制约。同时对保险公司而言,UBI目前接受程度还不高,没有太大的动力去做,因此虽然UBI有一定的前景,但可能风还没吹起来。&br&&br&类似地,互助保险可能会像是最接近“取代”传统保险机构的一种业务模式,但是保险,尤其是标准化程度较低、以及受众、销售方式与传统产品不同的保险产品,可能会出现定价和赔付率等精算模型预测错误,导致无法承担赔付责任的情况。需要时间去检验和积累经验,前景还算是谨慎乐观的,但在近几年要有大作为恐怕非常困难,需要长期坚持和探索。&br&&br&四、移动支付,大干快上,世界一流&br&&br&这几年互联网金融的最重要成就是移动支付的推广。可以称得上是一个标志性的巨大成功,在微信和支付宝通过线上手机红包/转账、O2O打车软件、线下便利支付这三个重要演进节点后,在短短的2年时间里面(想想就在2014年初的时候,移动支付还没怎么铺开),在大中城市已经距离完全的无现金社会越来越近,直接跳过了POS和卡片时代,可以毫不吹嘘地说真正领先全世界。在一些新兴的收单服务公司的积极推广下,移动支付使用打印的二维码+手机即可收款,门槛比安装上千元的POS机低得多,非常适合小金额货品的商店甚至是地摊,完全无需准备零钱或担心收到假钞。&br&&br&最后,中国的移动支付体系出现随着中国海外游群体,向发达国家逆向输出移动支付技术的趋势,在巨头的带领下,微信或支付宝有可能成为一种可以与VISA/Master平起平坐,甚至取而代之的国际清算体系。跨境支付是在境内支付手续费统一,竞争趋于同质化白热化后的一片新的疆域。&br&&br&不过支付是一种非常中心化、受到严格监管、技术水平要求高的行业,尤其是涉及到类似跨境支付等。对于创业型公司,几乎没有涉足移动支付行业核心区域的可能性。&br&&br&五、数字货币,帝王游戏平民勿近&br&&br&比特币已经成为一种公认的洗钱工具,我不看好比特币成为全球性货币的前景。主要原因在于主权国家不可能把货币调控大权让出来。尽管央行已经放出信息研究基于区块链技术的数字货币技术,但是距离真正的大规模应用恐怕还要很长时间,而且这类产业的核心部分在中国肯定将会是央行主导,玩家群体严格限定的方式。个人认为初创企业不要轻易涉足这个领域。&br&&br&六、大数据征信,鱼龙混杂&br&&br&大数据征信通常是通过积累的天量数据资产,进行建模和标签化等一系列虽然不太明白但是应该很厉害的操作,最后可以得到金融业务所需的征信评级/分数或其他推断结论,当然,适当地针对性改造一下,也能成为精准营销的利器;或者往另外一个方向改造一下,就成了某些岛民们的捞钱利器。因此大数据征信是一把双刃剑,在提供更好更精准的信用评价和服务推送时,是以大众隐私作为代价的。即便在《数据安全法》推出之后,这个行业仍然充斥着各种对个人隐私信息的滥用。尽管法律对一些最底线进行了划定,例如禁止企业间的数据明文交易、规定受到法律保护的关键隐私信息等。很难保证说个人隐私虽然在小企业间传递受到了阻碍,在单一大企业集团内就不会被滥用。&br&&br&但无论法律如何限制,对商业利益的优化和提升是永远存在需求的,未来这个行业就商业前景而言,前途无量——如果能搞定牌照成功上岸的话。&br&&br&七、消费金融,其实大多数做消费金融的不算消费金融公司&br&&br&消费金融牌照申请的苛刻程度可能仅次于银行保险证券公募基金牌照,具体条件可以搜一下。因此绝大部分做着消费金融业务的公司,其实是小贷公司。而消费金融简而言之就是给提前消费创造条件,比如有一些给没有收入来源的群体做分期,商业模式建立在透支亲情的基础上:大学生想要高价3C产品但是每月生活费只有1500而且家长不允许买?没问题,分个期,每月还700还12个月就行了。什么?还不起了?那不行,找学院领导,找家长,不把这钱还上就去法院起诉,让你毕不了业,上征信黑名单。绝大部分家长只好出来兜底。&br&&br&通常资信良好的人群,有一种金融服务叫做信用卡,可以提供大多数分期消费的需求。因此消费金融面向的客户实际上是信用卡部门未能主动覆盖甚至拒绝的次级客户。听起来又回到P2P的老路上去了?恐怕普遍如此,从目前的情况来说,消费金融普遍坏账率较高。如果试图以更高的利差覆盖坏账损失,恐怕只会让客户群体留下那些从一开始就没打算还钱的那一部分。&br&&br&因此消费金融的业务模式出发点可能仍然和P2P存在同样的缺陷,而且针对那些次级客户,鼓励他们超前消费,带来的可能不仅仅是坏账的问题,还可能引发一系列社会问题和道德问题。比如某家邪恶公司推出的邪恶产品(严肃脸)。并且随着消费金融行业交易额增速放缓,一期期的还款违约概率将会不断上升,坏账率可能会比现在公开报道的数据要高很多。&br&&br&消费金融未来的出路至少包括:(1)信用卡未能覆盖或者用户体验的较差的地方;(2)廉价的资金来源;(3)精准获取更优资信的客户。但看起来哪个都很难达成,前路漫漫。&br&&br&&br&小结&br&&br&互联网金融作为一个整体,已经随着宏观环境监管风向,以及前期暴露出来的高风险低回报特点,在2016年开始“由盛转衰”。大量所谓的“互联网金融”企业,比如只是个披了个P2P外衣的高利贷甚至欺诈的公司死亡退出市场,对市场环境是一种净化。&br&但是互联网金融作为金融科技应用的主要新方向、新前沿,在回归常态以后一定可以重新出发。作为相关领域的投资者,我们也在不断的寻找那些具有长久生命力的产品。
“互联网金融”的热度正在快速退潮,当然如果是那些P2P之类,已经是2015年就已经开始走上这一条长长的下坡路了。 就单从互联网技术的应用来看,实际上很早就开始武装传统金融行业,例如证券交易、ATM机、POS机等等。但这一些互联网技术手段的应用通常不被认…
&p&一年前蔡文胜告诉我,“做三四线城市用户的产品,创始人一定要有这种生活经历,要懂这些用户,目前市面上有三个产品做到了,GIF快手可以算一个”。&/p&&br&&p&蔡文胜说话这会儿,GIF快手在几家境外美元基金那里已经估到了10亿美元。媒体上却没有几篇报道,称得上是中国最低调的独角兽。&/p&&br&&p&但是端午节前X博士一篇《残酷底层物语:一个视频软件的中国农村》让GIF快手终于赢得了和它用户量相符的舆论影响力。&/p&&br&&p&&b&天通苑的张小龙&/b&&/p&&br&&p&GIF快手的创始人程一笑09年之前在惠普大连工作,09年到11年在人人网做iPhone客户端开发,之后从人人网出来创业的时候要做GIF图版的美图秀秀,公司注册在昌平,办公地点就在天通苑的东小口镇一带。&/p&&br&&p&天通苑是一座典型的三四线城市。&/p&&br&&p&这座城市把程一笑养得越来越胖。2012年春节过后,创业半年还没什么苗头,他开始立志要跑步减肥,他第一天跑完买了煎饼回去吃,第二天买了小笼包,然后第三天……就没有然后了。&/p&&br&&p&买了早饭回去,程一笑就开始研究老上司许朝军的“啪啪”、舶来品“图钉”和美图秀秀,一边开发用图片合成GIF的简单方法。&/p&&br&&p&他很多次孤独地把合成好的GIF图转发到微博上,无人喝彩。这时候中国已经有几十家号称要做Instagram的图片社交拿到融资。&/p&&br&&p&GIF快手当时真得很穷,一个创业者说花10万块钱推广App都能让程一笑“吃了一鲸”。因为快手“全部的Cost只有10万元”。&/p&&br&&p&2013年,“啪啪”的有声图片火了之后,程一笑开始测试在GIF图中添加音频。但是这种玩法很快就过时了,GIF图和图片社交好像没有任何化学反应,女生还是喜欢美颜,文青还是喜欢滤镜。&/p&&br&&p&用GIF图的屌丝最喜欢的是表情包,那些抄袭微博段子做表情包的大号,接着微信的东风,流量大得不要不要的。&/p&&br&&p&所以这一次程一笑好像还是没有捞到什么人关注。&/p&&br&&p&2014年,程一笑放出了一张GIF快手Android版在三星Galaxy S3上的截图,上面满是他自己对着自己电脑桌测试的视频。从此之后,GIF快手的界面就几乎没有变动过:第一栏是关注,第二栏推荐,第三栏同城,双击点赞,下拉看评论。&/p&&br&&p&这两年中国的图片、视频社交App们可能已经改版过一百种信息流的排列方式,增加了一千种滤镜。但是GIF快手的更新说明永远是&/p&&blockquote&“BUG修复、性能提升、优化用户体验”&/blockquote&&figure&&img src=&https://pic2.zhimg.com/50/c37ede7c1cbeae185231a_b.jpg& data-rawwidth=&1470& data-rawheight=&1282& class=&origin_image zh-lightbox-thumb& width=&1470& data-original=&https://pic2.zhimg.com/50/c37ede7c1cbeae185231a_r.jpg&&&/figure&&br&&p&GIF快手可能是中国移动互联网有史以来最克制的产品,比号称克制的微信还克制一百倍。&/p&&br&&p&程一笑的定力和Foxmail时代的张小龙还真有得一拼。&/p&&br&&p&&b&铁岭独角兽&/b&&/p&&br&&p&他的定力终于等到了回报,2014年春节后快手的流量开始井喷。而让GIF快手沉淀下今天产品气质的决定性事件,是2014年大批东北人入驻快手,之后快手就越来越“山炮”了。&br&&/p&&br&&p&程一笑本人就“来自大城市铁岭”,是赵本山的老乡。他从小就有经商头脑,小时候把学校旁边漫画室的借阅证收过来,坐地起价卖给同学,兜里揣了30多块现金,激动地睡不着觉。&/p&&br&&p&从小他还有创作天赋,为了给自己挣去网吧的钱,他四处投稿,写童话和科幻小说。终于发表了一篇,拿到了200块钱稿费,让他有钱泡了一年网吧。&/p&&br&&p&不知道是不是在漫画室和网吧里,程一笑频繁接触到下岗潮后遍布东北大地的“社会人”,为GIF快手后来的发展埋下了伏笔。&/p&&br&&p&中国的社交,有三股势力。一股是金沙江创投的朱啸虎发朋友圈说的,“张小龙、唐岩都是湖南人,投社交就要投湖南的产品经理。”&/p&&br&&p&一股是在线秀场,六间房、9158还有今天大红大紫的映客,都是从杭州杀出来的,杭州电商孕育出来的网红基因功不可没。&/p&&br&&p&最后一股就是东北人,从春晚到直播平台,从YY到映客,娱乐得东北人者得天下。作为一个合格的东北人,过去在三亚要有一套房,现在在网上要有一个直播间。&/p&&br&&p&但是东北人做互联网创业,却没有太多成功的先例,早年的戴志康做Discuz算是一例。还有一个就是罗永浩。目前罗老师收购苹果的志愿迟迟无法达成,快手现在是东北人互联网创业的唯一一匹独角兽。&/p&&br&&p&但是独角兽现在已经不是什么好听的词汇,去年那些张牙舞爪的独角兽,今年普遍遭遇了估值对折,增长乏力,数据滑坡。&/p&&br&&p&&b&不差钱,不挣钱&/b&&/p&&br&&p&快手还没有遇到这样的烦恼,但是至今这个日活两千万的平台还没有实现任何商业模式。和那些有十万粉丝,一万阅读就敢开始做“中产阶级生活方式电商”的前媒体人相比,快手的用户无法吸引高端广告主,也不符合什么“消费升级”的趋势。&/p&&br&&p&快手还在烧境外基金在资本泡沫时期给的美元,但是快手捧出来的网红已经可以挣屌丝微信钱包里的余额了。X博士那篇文章日到的“搬砖小伟”,说他&/p&&br&&blockquote&“坐拥100多万多粉丝,但是他在大众视野内的曝光度几乎为零,能掌握的资源能力几乎为零。他的影响力还是在那一百万的乡村粉丝中打转,并不会对主流世界产生一丝波澜,更不会像papi酱一样获得千万投资快手网红。”&/blockquote&&p&但是其实“搬砖小伟”已经登上好几档综艺节目,他也像明星大V一样开起了网店,做起了微商。&br&&/p&&p&X博士提到的拍自己胖儿子“抽烟”、“吹瓶”的母亲,也在快手上给“朋友卖的组装苹果手机”打起了广告。&br&&/p&&br&&p&从让大V挣钱到让自己挣钱,微博经过了差不多三年的痛苦摸索,才在去年年底结出了果实。&/p&&br&&p&快手说不定需要更长时间。因为和绰号“曹会计”的曹国伟相比,程一笑明显不是挣钱的那块料。程一笑毕业一年就开始买黄金、炒股、买理财,结果遇上08年之后漫长的熊市,一直赔钱。2011年人人网的市值跌破现金储备,程一笑还想抄底老东家。幸亏他当时不知道怎么开美账户,否则恐怕连后来创业的10万块钱也要赔进去了。&/p&&br&&p&这一点,程一笑又和张小龙撞上了。2000年张小龙还在做Foxmail的时候,人民日报写了一篇《免费软件饿着肚子挥洒冲动》,说张小龙“知名度越来越高,用户越来越多”,但是就是不知道怎么挣钱,“是个悲剧人物”。&/p&&br&&p&这篇文章发表5年后,张小龙依旧不知道怎么挣钱,但是马化腾大笔一挥拿下了这个团队并且安排到广州研究院鼓捣QQ邮箱。再五年之后,微信横空出世,张小龙封神,为狗日的腾讯续了一命。&/p&&p&现在天通苑的张小龙已经摆在这里了,就缺一个想续命的马化腾了。清河的乔布斯、酒仙桥的红衣大炮还有西二旗的厂长,你们离得都不远,有空过来瞧瞧吧。&/p&&br&&p&&b&本文作者老编辑,原文首发于微信公众号老道消息(laodaoxx),原标题《天通苑的张小龙》,老编辑的团队正在招募一个想红的产品经理,萌妹子外表汉子心,边做产品变拍戏。简历发送到 4@&a href=&//link.zhihu.com/?target=http%3A//bushangban.com& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&bushangban.com&/a&&/b&&/p&&br&&p&&a href=&//link.zhihu.com/?target=http%3A//weixin.qq.com/r/zkPbw8zENJFLrYig9xbc& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&weixin.qq.com/r/zkPbw8z&/span&&span class=&invisible&&ENJFLrYig9xbc&/span&&span class=&ellipsis&&&/span&&/a& (二维码自动识别)&/p&
一年前蔡文胜告诉我,“做三四线城市用户的产品,创始人一定要有这种生活经历,要懂这些用户,目前市面上有三个产品做到了,GIF快手可以算一个”。 蔡文胜说话这会儿,GIF快手在几家境外美元基金那里已经估到了10亿美元。媒体上却没有几篇报道,称得上是中…
&p&下图非常之经典,到处被转载,最早似乎出现自IT橘子。它基本展现了中国和美国的二手车模式及布局,也基本回答了题主想要的交易模式。在做传统的模式划分以及模式解析中,往往使用的维度是:是否为实体?ToB还是ToC?&br&&/p&&figure&&img src=&https://pic1.zhimg.com/50/33dfdf0ef8c9_b.jpg& data-rawwidth=&918& data-rawheight=&315& class=&origin_image zh-lightbox-thumb& width=&918& data-original=&https://pic1.zhimg.com/50/33dfdf0ef8c9_r.jpg&&&/figure&&br&&p&所以大体来讲二手车的交易平台模式就只有这几种:B2B、B2C、C2B和C2C。谈及这几种模式的优劣,普通吃瓜群众或者高屋建瓴的投资人,往往有这几种印象:&/p&&ul&&li&来自于C端的车,往往价格更有优势而且质量会略好,因为不会在车商之间反复倒腾。然而为了出业绩,平台以B端车冒充C端车的情况,屡见不鲜&/li&&li&卖给C端的车走利润,卖给B端的走数量,因为B端和C端的诉求不一样。然而因为现实所迫,把卖给B端的车也可以算作是给卖给C端的车,更有甚者,x2C的平台之间互相倒车,基层员工拿走提成、车商拿走补贴、平台拿走业绩……&/li&&/ul&&br&因此这几种模式看似分得楚河汉界如此干干净净,现实却是如上面所述的那样骨干。举例如下:做B2C的优车诚品和做B2B的车易拍最近整合在一起了;优信拍是集齐了B2C+C2B+B2B三大模式;做帮买帮卖的看看车被易车收购;……&br&(这几大动作被下面的动态模型部分预测出来)&br&&br&如此混沌的原因一方面来自于资本压力,为了业绩增长然后去资本市场圈钱,哪管那么多模式、哪管那么多车辆的来源和去处……正所谓为了业绩无所不用其极。另一方面来自于上面的划分维度看似有理然而却比较静态,从来丧失对动态环境的预测性。比如以是否实体为例:58同城本是纯线上的信息平台,但是2015年开始也在二手车交易市场中建立服务中心,与二手车交易市场一起来提高车商的服务水平,同时也通过检测提高C端用户的体验;优车诚品本是纯线下的门店模式,也在建设网站及各类信息服务,也通过微信的各种活动与用户互动。&br&&br&因此,在专栏文章中(&a href=&https://zhuanlan.zhihu.com/p/?refer=hemingke& class=&internal&&二手车敢问路在何方? - 数据冰山 - 知乎专栏&/a&)曾试图用新的维度来探讨二手车的模式及未来,而这些维度更多涉及到企业及团队的基因和基本价值观。&br&&ul&&li&第一个维度,是否依赖于中间商:是否承认中间商的价值,是否愿意与中间商共赢;还是不让中间商赚差价?&/li&&li&第二个维度,是否控制交易。有彻底闭环与用户完成交易,保证最好的体验,但是服务范围或宽度有限;也有半开半闭通过检测及POS机刷卡撮合交易;也有彻底开环得只提供信息不管成交。&br&&/li&&/ul&&br&&p&下图是根据以上的两个维度重新划分了大部分二手车公司:其中加黑框的表示已经成为先烈的公司(比如平安好车和帅车);箭头表示了这些公司未来可能移动的方向。&/p&&figure&&img src=&https://pic4.zhimg.com/50/f6bdeb7176aafc_b.jpg& data-rawwidth=&687& data-rawheight=&657& class=&origin_image zh-lightbox-thumb& width=&687& data-original=&https://pic4.zhimg.com/50/f6bdeb7176aafc_r.jpg&&&/figure&&blockquote&从这张图来看,大家就可以从另外一个角度理解最近发生的二手车行业的一些重大事件&br&&ul&&li&优车诚品和车易拍合并:中间态往更加控制交易的方向移动&/li&&li&优信集齐B2B+B2C+C2B各种模式&/li&&li&神州租车在全国大几十个城市布点,开售二手车&/li&&/ul&&/blockquote&&br&&b&&u&首先是依赖于中间商的模式,中间商为其商业模式中的重要一环,中间商在整个从终极卖家到终极买家的过程中,拥有库存、承担风险和提供服务。&/u&&/b&&p&&b&依赖中间商的开环模式。&/b&主要是信息平台类的公司,以向中间商提供客源和车源作为盈利点。国内主要是58+赶集、汽车之家及易车的二手车频道,其中58同城通过与赶集的合并,成为信息平台中的绝对垄断者,流量及信息占到60%以上。这个模式在美国也同样是被两三家大平台垄断,翘楚是Autotrader,2011年营收和利润就分别接近10亿和1亿美元,虽然仍没上市,但是美国市值最高的二手车平台,超过100亿美元。&/p&&br&&p&&b&依赖中间商的半闭环模式。&/b&主要有B2B,B2C,C2B以及帮买帮卖四个模式。这四个模式看似不同,但其实都通过车辆检测或交易撮合等半闭环的方式绑定中间商,并为中间商服务。这些模式或多或少都处在二手车行业变革中的中间态或者不稳态。&br&&/p&&ul&&li&拍卖B2B/C2B,前者的代表是优信拍、车易拍以及博车网,通过从4S店等处拿车源信息撮合交易卖给中间商;而后者的代表是天天拍车、车置宝和快停掉的平安好车,通过从个人手中拿车源信息撮合交易卖给中间商。这个模式在美国的标杆是Manheim,COPART和KAR,也是被这几家所垄断。Manheim是美国最老牌的汽车拍卖平台之一,距今历史超过70年,横跨全球。2012年,Manheim近800万二手车,超过500亿美元价值的交易额。主要的车源来自于租车公司和政府的处理车辆。因为是私有公司,根据其交易额估计市值也在百亿美元左右。COPART是全美最大的事故车拍卖公司和最大的事故报废车连锁站,车辆主要来自于美国各保险公司的事故处理车,1994年在NASDAQ上市,当前估值在43亿美元。KAR,主要在美国和加拿大,车辆主要来自于租车公司及保险公司的事故车,当前估值在45亿美元。&/li&&li&新型B2C的代表是优信二手车和车猫,不是车商胜似车商,剑走偏锋取巧劲而利用车商的库存、场地及资金占压来向用户卖车,卡在车商与用户中间,提供检测及POS机刷卡等服务。严格意义上说,美国和日本都没有对标的模式。&br&&/li&&li&帮买帮卖的代表是看看车和车101。主要是通过绑定中间商,帮助中间商拉来客源并在看车过程中提供较浅层次的服务,促进成交。在美国和日本没有完全对标的模式。&br&&/li&&/ul&&br&&p&&b&依赖中间商的闭环模式。&/b&其实就是传统的车商,俗称开店模式,新时代下升级为连锁及搭配网站推广,其中的代表有优车诚品和车王。这个业态在美国占到70%以上的主流销量,但极为分散,其中的顶尖企业是CarMax,标普500成分股,但市场份额尚不足3%,足见其分散程度以及需要区域性的落地运营。同时也证明,这个行业的公司拿到1%的份额就足够撑起十亿美元级别的公司。&br&&/p&&br&&br&&u&&b&其次是不依赖于中间商的模式,整个价值链不存在中间商的价值定位。&/b&&/u&&p&&b&不依赖中间商的半闭环模式。&/b&当下闹得最热烈的C2C或者P2P卖车模式,其中的代表为瓜子、人人车和好车无忧。虽然平台不拥有车,但是通过撮合个人对个人的交易,收取佣金。在美国整个C2C的交易占到30%左右的份额。而平台介入的C2C模式,又称P2P二手车,在美国的领导者是Beepi,也是这个模式的开创者。根据2016年2月的消息,在2015末年的新一轮融资中获得7000万美元投资,融资总额达到1.5亿美元,此轮融资的领投方是上汽集团。同时,Foundation Capital、Sherpa Ventures和红点投资也参与了此轮融资。估值约在4亿美元左右。这个模式目前在美国是一家独大,未来也不会有超过两家的平台存在。&/p&&br&&p&&b&不依赖中间商的闭环模式。&/b&主要是租车公司以及大型的4S店集团,主要代表是自建二手车店面的神州租车以及积极尝试二手车业务的广汇及永达等4S店集团。他们虽然仍是建店直接卖二手车,但是却有其核心资源(比如:自己的车源或者新车带来的客源等等),所以他们不算是纯粹的中间商,因此被称为新型的车商或者大型车商+。美国的对标模式为Autonation,标普500成分股。Autonation的主营业务是新车,占到收入的57%;而二手车销售,占到收入的21%。主要是利用其客源复用、广告复用及店面借贷的优势,以更低的成本销售二手车。即使如此,Autonation在整个二手车盘子中的份额不到1%,可见这个模式仍然是非常分散的格局。&/p&&br&——————————展望未来的分割线——————————&br&&p&按照成熟国家二手车对新车在3.0左右的比例,未来中国二手车市场的稳态水平至少将能达到5000万台/年左右。相对于目前的不到1000万台的基数,二手车的发展仍在初期。加之海量资本的涌入,将会推动这个行业发生巨变,这也是为什么目前二手车的各种模式百花绽放乱人眼的原因。要看清未来,必须要抓住变革中的力量或者不可逆的过程,这种变革的力量最终反映的是商业本质或经济驱动:&/p&&ul&&li&半闭环一定会转换到全闭环的交易控制,而没有中间态,如同不连续的量子态。不控制交易的玩家一定会为了更高的利润而控制交易,而且不会存在半闭环的状态(只控制检测或者POS机刷卡)。道理很简单:搜房会牺牲房产广告平台业务去做经纪人业务,而链家不会退回来去抢安居客的广告平台业务。纯开环不控制交易的模式不转换为控制交易的模式只存在一个关于利益的理由:全开环的玩家,在目前状态获得足够大的利益。比如:安居客和58同城+赶集的房产收入在2016年会超过整个搜房的广告收入,因此它们不会牺牲如此大的利益去做闭环的中介人交易。&/li&&li&有车源资源以及线下资源的模式必将向闭环交易转换而成为大型车商+。比如:优信,坐拥B2B的车源、B2C客源以及控制了车商的检测和POS机刷卡,很有可能尽快完成摇身一变成为超级车商+;神州租车,坐拥天然的车源以及线下门店和客源,正在快速成长为超级车商+。&/li&&/ul&&br&&p&根据以上描述的推动力量,中国二手车将变革,会转化为如下的格局,达到一个类似于美国的稳态,而不是目前的混沌状态。将主要会有如下五种模式的角色:信息平台、拍卖平台、传统车商、C2C平台以及大型车商+。&/p&&figure&&img src=&https://pic2.zhimg.com/50/f68828badf38a268e4659_b.jpg& data-rawwidth=&770& data-rawheight=&657& class=&origin_image zh-lightbox-thumb& width=&770& data-original=&https://pic2.zhimg.com/50/f68828badf38a268e4659_r.jpg&&&/figure&&br&&br&&b&信息平台。&/b&最像互联网的模式,为上述的各个角色以及买车卖车个人提供信息,考虑到网络效应及流量成本的最优化,必然是赢家通吃,最后一两家平台垄断90%以上的流量,目前的领先者是58同城二手车和二手车之家。&br&&p&这个模式的核心就是流量足够充分、心态足够开放,要与各种模式和各种平台共赢,而提供水电煤等基础设施。盈利模式为从B端收费,收的是水电煤的通道费,如果商户愿意为一台车付出500-1000元的推广费用,那么这个市场的收入规模为500-1000元 x 5000万 = 250~500亿元/年。&/p&&p&(以下的收入规模计算,均考虑差价及毛利润而不是毛收入,且按照类似的公式来进行。)&/p&&p&&b&拍卖平台。&/b&会有人走、会有人留、会有人新来,比如中国目前还没有巨型的COPART类公司(博车网刚开始不久)。而优信会走,凭借其在优信拍的车源优势以及优信二手车的客源优势,必然向控制交易转换而成为大型车商+,实现更高的利润。这个模式最终还是会被几家定位略有不同的平台给垄断,在车源提供上占到30~40%,假设其5000元左右的差价,规模大约在~1000亿元/年。&/p&&p&&b&传统车商。&/b&就是标准的中间商,没任何资源,就是靠运营、经验、资本等来赚所谓的差价,但其实承担了金融风险和服务成本。虽然目前处于很low的状态(大金链子小金表),但是随着资本的涌入,吸引了越来越多高素质人才加入(比如优车的创始人要么毕业于斯坦福要么是上市互联网公司的前CTO),这些分散的车商最终在零售领域可占到~60%左右的份额,但这是一个极其分散的市场。不过,这个市场规模至少在几千亿元/年(假设每台车1万元的差价),根据美国的情况,做到百分几的市场,就足以进入标普500成分股了。&/p&&p&&b&C2C平台。&/b&C2C交易本来无需公司或者平台介入,但是随着C2C平台的出现,瓜子等公司冲入了这个市场。在美国C2C交易占到30%左右,但是考虑到中国的城镇结构及社区关系更不利于个人之间的交易,所以估计中国C2C交易在20%左右。如果C2C平台(或P2P二手车)实现50%的渗透率,最终达到10%的零售覆盖率,考虑其收取平均2%左右的服务费,整个市场规模在100亿元/年左右。&/p&&p&&b&大型车商+。&/b&这一类模式来源复杂:有传统的4S店连锁(比如广汇)、有租车企业(比如神州租车)、将会有目前风风火火融资烧钱的各创业公司(优信、阳光车网、帮买帮卖企业等等)火线加盟。他们最终都会靠着各自在车源、线下门店及客源整合等多方面的优势,不成为中间商而成为直接的大型车商+,从传统的中间商那里抢一份羮。其中优信的优势会很大,因为凭借其前期与车商的合作,把握住了车商的部分核心资源,从传统车商处抢夺车源和客源会非常有利。(优信已经在和几家大型车商谈判收购事宜)根据美国的经验,这部分模式会占据~20%的零售覆盖率,考虑其1万元左右的差价,整个市场规模在1000亿元/年左右。因为来源十分复杂,这个模式依旧很分散,但是胜过传统车商的分散程度,不排除涌现Autonation这样的巨型且综合性二手车平台。&/p&&br&&p&&b&最后的总结,无论哪种模式,都是百亿元级别的市场。只不过每个模式的垄断或者分散程度不同,大家都会有一口。而整个生态链的核心是信息平台和拍卖平台,他们各自负责其中最核心的客源和车源。&/b&&/p&&br&&p&&b&...更多文章请到&a href=&http://zhuanlan.zhihu.com/hemingke& class=&internal&&数据冰山 - 知乎专栏&/a&&br&...更多回答请看&a href=&https://www.zhihu.com/people/he-ming-ke& class=&internal&&何明科的主页&/a&&/b&&/p&
下图非常之经典,到处被转载,最早似乎出现自IT橘子。它基本展现了中国和美国的二手车模式及布局,也基本回答了题主想要的交易模式。在做传统的模式划分以及模式解析中,往往使用的维度是:是否为实体?ToB还是ToC? 所以大体来讲二手车的交易平台模式就只…
&p&关于深度学习,网上的资料很多,不过貌似大部分都不太适合初学者。
这里有几个原因:
1.深度学习确实需要一定的数学基础。如果不用深入浅出地方法讲,有些读者就会有畏难的情绪,因而容易过早地放弃。
2.中国人或美国人写的书籍或文章,普遍比较难一些。我不太清楚为什么,不过确实是这样子的。&/p&&p&深度学习,确实需要一定的数学基础,但真的那么难么?这个,还真没有。不信?听我来给你侃侃。看完,你也会觉得没那么难了。&/p&&p&本文是针对初学者,高手可以无视,有不对的地方,还请多多批评指正。&/p&&p&这里,先推荐一篇非常不错的文章:
《1天搞懂深度学习》,300多页的ppt,台湾李宏毅教授写的,非常棒。
不夸张地说,是我看过最系统,也最通俗易懂的,关于深度学习的文章。&/p&&p&这是slideshare的链接:
&a href=&//link.zhihu.com/?target=http%3A//www.slideshare.net/tw_dsconf/ss-Fqid%3D108adce3-2c3d-d0a57e46bc%26v%3D%26b%3D%26from_search%3D3& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&http://www.slideshare.net/tw_dsconf/ss-?qid=108adce3-2c3d-d0a57e46bc&v=&b=&from_search=3&/a&&/p&&p&没梯子的同学,可以从我的网盘下:
链接:&a href=&//link.zhihu.com/?target=http%3A//pan.baidu.com/s/1nv54p9R& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&pan.baidu.com/s/1nv54p9&/span&&span class=&invisible&&R&/span&&span class=&ellipsis&&&/span&&/a& 密码:3mty&/p&&p&要说先准备什么,私以为,其实只需要知道导数和相关的函数概念就可以了。高等数学也没学过?很好,我就是想让文科生也能看懂,您只需要学过初中数学就可以了。&/p&&p&其实不必有畏难的情绪,个人很推崇李书福的精神,在一次电视采访中,李书福说:谁说中国人不能造汽车?造汽车有啥难的,不就是四个轮子加两排沙发嘛。当然,他这个结论有失偏颇,不过精神可嘉。&/p&&p&导数是什么,无非就是变化率呗,王小二今年卖了100头猪,去年卖了90头,前年卖了80头。。。变化率或者增长率是什么?每年增长10头猪,多简单。这里需要注意有个时间变量---年。王小二卖猪的增长率是10头/年,也就是说,导数是10.
函数y=f(x)=10x+30,这里我们假设王小二第一年卖了30头,以后每年增长10头,x代表时间(年),y代表猪的头数。
当然,这是增长率固定的情形,现实生活中,很多时候,变化量也不是固定的,也就是说增长率也不是恒定的。比如,函数可能是这样: y=f(x)=5x?+30,这里x和y依然代表的是时间和头数,不过增长率变了,怎么算这个增长率,我们回头再讲。或者你干脆记住几个求导的公式也可以。&/p&&p&深度学习还有一个重要的数学概念:偏导数,偏导数的偏怎么理解?偏头疼的偏,还是我不让你导,你偏要导?都不是,我们还以王小二卖猪为例,刚才我们讲到,x变量是时间(年),可是卖出去的猪,不光跟时间有关啊,随着业务的增长,王小二不仅扩大了养猪场,还雇了很多员工一起养猪。所以方程式又变了:y=f(x)=5x??+8x? + 35x? +30
这里x?代表面积,x?代表员工数,当然x?还是时间。
上面我们讲了,导数其实就是变化率,那么偏导数是什么?偏导数无非就是多个变量的时候,针对某个变量的变化率呗。在上面的公式里,如果针对x?求偏导数,也就是说,员工对于猪的增长率贡献有多大,或者说,随着(每个)员工的增长,猪增加了多少,这里等于35---每增加一个员工,就多卖出去35头猪. 计算偏导数的时候,其他变量都可以看成常量,这点很重要,常量的变化率为0,所以导数为0,所以就剩对35x? 求导数,等于35. 对于x?求偏导,也是类似的。
求偏导我们用一个符号 表示:比如 y/ x? 就表示y对 x?求偏导。&/p&&p&废话半天,这些跟深度学习到底有啥关系?有关系,我们知道,深度学习是采用神经网络,用于解决线性不可分的问题。关于这一点,我们回头再讨论,大家也可以网上搜一下相关的文章。我这里主要讲讲数学与深度学习的关系。先给大家看几张图:&/p&&figure&&img src=&https://pic2.zhimg.com/50/v2-cbe0cdfd0af76d328ebe_b.jpg& data-rawwidth=&631& data-rawheight=&488& class=&origin_image zh-lightbox-thumb& width=&631& data-original=&https://pic2.zhimg.com/50/v2-cbe0cdfd0af76d328ebe_r.jpg&&&/figure&&p& 图1. 所谓深度学习,就是具有很多个隐层的神经网络。&/p&&figure&&img src=&https://pic1.zhimg.com/50/v2-0d5accd6d800be9f933b_b.jpg& data-rawwidth=&432& data-rawheight=&576& class=&origin_image zh-lightbox-thumb& width=&432& data-original=&https://pic1.zhimg.com/50/v2-0d5accd6d800be9f933b_r.jpg&&&/figure&&br&&p&图2.单输出的时候,怎么求偏导数&/p&&figure&&img src=&https://pic2.zhimg.com/50/v2-c52b1fcdd42c3ace40a8619_b.jpg& data-rawwidth=&432& data-rawheight=&576& class=&origin_image zh-lightbox-thumb& width=&432& data-original=&https://pic2.zhimg.com/50/v2-c52b1fcdd42c3ace40a8619_r.jpg&&&/figure&&p&图3.多输出的时候,怎么求偏导数。后面两张图是日语的,这是日本人写的关于深度学习的书。感觉写的不错,把图盗来用一下。所谓入力层,出力层,中间层,分别对应于中文的:输入层,输出层,和隐层。&/p&&p&大家不要被这几张图吓着,其实很简单的。干脆再举一个例子,就以撩妹为例。男女恋爱我们大致可以分为三个阶段:
1.初恋期。相当于深度学习的输入层。别人吸引你,肯定是有很多因素,比如:身高,身材,脸蛋,学历,性格等等,这些都是输入层的参数,对每个人来说权重可能都不一样。
2.热恋期。我们就让它对应于隐层吧。这个期间,双方各种磨合,柴米油盐酱醋茶。
3.稳定期。对应于输出层,是否合适,就看磨合得咋样了。&/p&&p&大家都知道,磨合很重要,怎么磨合呢?就是不断学习训练和修正的过程嘛!比如女朋友喜欢草莓蛋糕,你买了蓝莓的,她的反馈是negative,你下次就别买了蓝莓,改草莓了。
------------------------------------------------------------------------------------------------
看完这个,有些小伙可能要开始对自己女友调参了。有点不放心,所以补充一下。
撩妹和深度学习一样,既要防止欠拟合,也要防止过拟合。所谓欠拟合,对深度学习而言,就是训练得不够,数据不足,就好比,你撩妹经验不足,需要多学着点,送花当然是最基本的了,还需要提高其他方面,比如,提高自身说话的幽默感等,因为本文重点并不是撩妹,所以就不展开讲了。这里需要提一点,欠拟合固然不好,但过拟合就更不合适了。过拟合跟欠拟合相反,一方面,如果过拟合,她会觉得你有陈冠希老师的潜质,更重要的是,每个人情况不一样,就像深度学习一样,训练集效果很好,但测试集不行!就撩妹而言,她会觉得你受前任(训练集)影响很大,这是大忌!如果给她这个映象,你以后有的烦了,切记切记!
------------------------------------------------------------------------------------------------&/p&&p&深度学习也是一个不断磨合的过程,刚开始定义一个标准参数(这些是经验值。就好比情人节和生日必须送花一样),然后不断地修正,得出图1每个节点间的权重。为什么要这样磨合?试想一下,我们假设深度学习是一个小孩,我们怎么教他看图识字?肯定得先把图片给他看,并且告诉他正确的答案,需要很多图片,不断地教他,训练他,这个训练的过程,其实就类似于求解神经网络权重的过程。以后测试的时候,你只要给他图片,他就知道图里面有什么了。&/p&&p&所以训练集,其实就是给小孩看的,带有正确答案的图片,对于深度学习而言,训练集就是用来求解神经网络的权重的,最后形成模型;而测试集,就是用来验证模型的准确度的。&/p&&p&对于已经训练好的模型,如下图所示,权重(w1,w2...)都已知。&/p&&figure&&img src=&https://pic3.zhimg.com/50/v2-9e08dbbab5aa63b6527bd4_b.jpg& data-rawwidth=&940& data-rawheight=&736& class=&origin_image zh-lightbox-thumb& width=&940& data-original=&https://pic3.zhimg.com/50/v2-9e08dbbab5aa63b6527bd4_r.jpg&&&/figure&&p&
图4&/p&&figure&&img src=&https://pic1.zhimg.com/50/v2-ef5ad0d06a316f762ff43_b.jpg& data-rawwidth=&776& data-rawheight=&174& class=&origin_image zh-lightbox-thumb& width=&776& data-original=&https://pic1.zhimg.com/50/v2-ef5ad0d06a316f762ff43_r.jpg&&&/figure&&p&
图5&/p&&p&我们知道,像上面这样,从左至右容易算出来。但反过来呢,我们上面讲到,测试集有图片,也有预期的正确答案,要反过来求w1,w2......,怎么办?&/p&&p&绕了半天,终于该求偏导出场了。目前的情况是:&/p&&p&1.我们假定一个神经网络已经定义好,比如有多少层,都什么类型,每层有多少个节点,激活函数(后面讲)用什么等。这个没办法,刚开始得有一个初始设置(大部分框架都需要define-and-run,也有部分是define-by-run)。你喜欢一个美女,她也不是刚从娘胎里出来的,也是带有各种默认设置的。至于怎么调教,那就得求偏导。&/p&&p&2.我们已知正确答案,比如图2和3里的r,训练的时候,是从左至右计算,得出的结果为y,r与y一般来说是不一样的。那么他们之间的差距,就是图2和3里的E。这个差距怎么算?当然,直接相减是一个办法,尤其是对于只有一个输出的情况,比如图2; 但很多时候,其实像图3里的那样,那么这个差距,一般可以这样算,当然,还可以有其他的评估办法,只是函数不同而已,作用是类似的:&/p&&figure&&img src=&https://pic2.zhimg.com/50/v2-e5ddd26d65aa04ed82f2a51fc8212427_b.jpg& data-rawwidth=&484& data-rawheight=&102& class=&origin_image zh-lightbox-thumb& width=&484& data-original=&https://pic2.zhimg.com/50/v2-e5ddd26d65aa04ed82f2a51fc8212427_r.jpg&&&/figure&&p&不得不说,理想跟现实还是有差距的,我们当然是希望差距越小越好,怎么才能让差距越来越小呢?得调整参数呗,因为输入(图像)确定的情况下,只有调整参数才能改变输出的值。怎么调整,怎么磨合?刚才我们讲到,每个参数都有一个默认值,我们就对每个参数加上一定的数值?,然后看看结果如何?如果参数调大,差距也变大,你懂的,那就得减小?,因为我们的目标是要让差距变小;反之亦然。所以为了把参数调整到最佳,我们需要了解误差对每个参数的变化率,这不就是求误差对于该参数的偏导数嘛。&/p&&p&关键是怎么求偏导。图2和图3分别给了推导的方法,其实很简单,从右至左挨个求偏导就可以。相邻层的求偏导其实很简单,因为是线性的,所以偏导数其实就是参数本身嘛,就跟求解x?的偏导类似。然后把各个偏导相乘就可以了。&/p&&p&这里有两个点:&/p&&p&这里有两个点:一个是激活函数,这主要是为了让整个网络具有非线性特征,因为我们前面也提到了,很多情况下,线性函数没办法对输入进行适当的分类(很多情况下识别主要是做分类),那么就要让网络学出来一个非线性函数,这里就需要激活函数,因为它本身就是非线性的,所以让整个网络也具有非线性特征。另外,激活函数也让每个节点的输出值在一个可控的范围内,这样计算也方便。&/p&&p&貌似这样解释还是很不通俗,其实还可以用撩妹来打比方;女生都不喜欢白开水一样的日子,因为这是线性的,生活中当然需要一些浪漫情怀了,这个激活函数嘛,我感觉类似于生活中的小浪漫,小惊喜,是不是?相处的每个阶段,需要时不时激活一下,制造点小浪漫,小惊喜,比如;一般女生见了可爱的小杯子,瓷器之类都迈不开步子,那就在她生日的时候送一个特别样式,要让她感动得想哭。前面讲到男人要幽默,这是为了让她笑;适当的时候还要让她激动得哭。一哭一笑,多整几个回合,她就离不开你了。因为你的非线性特征太强了。&/p&&p&当然,过犹不及,小惊喜也不是越多越好,但完全没有就成白开水了。就好比每个layer都可以加激活函数,当然,不见得每层都要加激活函数,但完全没有,那是不行的。&/p&&p&由于激活函数的存在,所以在求偏导的时候,也要把它算进去,激活函数,一般用sigmoid,也可以用Relu等。激活函数的求导其实也非常简单:&/p&&figure&&img src=&https://pic1.zhimg.com/50/v2-aaedc22cee9ed_b.jpg& data-rawwidth=&257& data-rawheight=&159& class=&content_image& width=&257&&&/figure&&p&求导: f'(x)=f(x)*[1-f(x)]
这个方面,有时间可以翻看一下高数,没时间,直接记住就行了。
至于Relu,那就更简单了,就是f(x) 当x&0的时候y等于0,其他时候,y等于x。
当然,你也可以定义你自己的Relu函数,比如x大于等于0的时候,y等于0.01x,也可以。&/p&&p&另一个是学习系数,为什么叫学习系数?刚才我们上面讲到?增量,到底每次增加多少合适?是不是等同于偏导数(变化率)?经验告诉我们,需要乘以一个百分比,这个就是学习系数,而且,随着训练的深入,这个系数是可以变的。&/p&&p&当然,还有一些很重要的基本知识,比如SGD(随机梯度下降),mini batch 和 epoch(用于训练集的选择),限于篇幅,以后再侃吧。其实参考李宏毅的那篇文章就可以了。&/p&&p&这篇拙文,算是对我另一个回答的补充吧:
&a href=&https://www.zhihu.com/question//answer/?from=profile_answer_card& class=&internal&&深度学习入门必看的书和论文?有哪些必备的技能需学习? - jacky yang 的回答&/a&&/p&&p&其实上面描述的,主要是关于怎么调整参数,属于初级阶段。上面其实也提到,在调参之前,都有默认的网络模型和参数,如何定义最初始的模型和参数?就需要进一步深入了解。
不过对于一般做工程而言,只需要在默认的网络上调参就可以了,相当于用算法;
对于学者和科学家而言,他们会发明算法,难度还是不小的。向他们致敬!&/p&&p&写得很辛苦,觉得好就给我点个赞吧:)&/p&&p&------------------------------------------------------------------------------------------------&/p&&p&关于求偏导的推导过程,我尽快抽时间,把数学公式用通俗易懂的语言详细描述一下,前一段时间比较忙,抱歉:)&/p&&p&------------------------------------------------------------------------------------------------&/p&
关于深度学习,网上的资料很多,不过貌似大部分都不太适合初学者。
这里有几个原因:
1.深度学习确实需要一定的数学基础。如果不用深入浅出地方法讲,有些读者就会有畏难的情绪,因而容易过早地放弃。
2.中国人或美国人写的书籍或文章,普遍比较难一些。我…
在中国,上市的实质意义在于获得一张特许融资牌照。IPO融的钱只是餐前小菜,接下来大股东能干的事包括但不限于:原始股解禁套现,股票质押回购,发公司债券,定增圈钱,配股圈钱,高送转炒高股价后套现,并购重组炒高股价后套现。最后要是撂担子不想干了,壳还能卖几十亿。要是没上市,这些好事怎么捞得到?上市的跟没上市的,虽然都是做企业,但完全是两个平行宇宙。&br&&br&================== 分割线 ==================&br&&br&由于原答案没有确切回答题主的疑问,把评论里的问答贴上来:&br&&br&&a href=&http://www.zhihu.com/people/li-ge-32-37& class=&internal&&李戈&/a&(提问者)&br&谢谢回答 可是我问的主要是股票市场的钱最终存在了谁的账户里 是否会流进公司的账户&br&&br&&a href=&http://www.zhihu.com/people/chung-philip& class=&internal&&Chung Philip&/a&(作者) 回复 &a href=&http://www.zhihu.com/people/li-ge-32-37& class=&internal&&李戈&/a&(提问者)&br&不会。简化点说事情是这样的:IPO时公司把股份的25%一次性卖掉,卖给谁呢?卖给了中签的机构和散户,钱进了公司账户——这叫做一级市场。之后市场上流通的就是这25%的股票了,持有者一开始全部是中签的人。中签的人把股票卖给小明,小明的钱就进了中签者的口袋。然后小明又把股票卖给其他人——这叫做二级市场,与公司账户完全无关&br&&br&================== 分割线 ================&br&&br&股价涨跌是否影响公司资产和运营呢?答案是有影响,而且是有很大影响,但并非你所说的股价涨了钱就进了公司账户那样子。具体说起来有点复杂,首先你要懂得区分上市公司和公司实际控制人「实控人」。实控人持有上市公司的股份,这跟普通散户一样,不一样之处在于实控人股份比较多,且往往是公司实际管理者「也有不是的」,所以有能力主导公司董事会。&br&&br&股价高低对实控人的资产状况有巨大影响。最简单的,比如实控人所持的原始股临近解禁「即可以卖了」,其显然有做高股价的动机。&br&&br&再比方说,实控人可以将自己拥有的公司股票质押给银行获得贷款。请注意这个贷款是给实控人个人,不是给上市公司。股价越高实控人就能贷到越多钱。所以如果实控人需要用股票质押的方式融资,其就有做高股价的动机。&br&&br&如果公司定增融资,实控人并不参与,其有在定增发行前做高股价的动机。&br&&br&如果公司定增融资,实控人积极参与,其有在定增发行前做低股价、定增解禁前做高股价的动机。&br&&br&如你所见,股价高低会直接影响上市公司实控人的财富值,让实控人有动机去操纵股价「市值管理」,从而间接影响上市公司。
在中国,上市的实质意义在于获得一张特许融资牌照。IPO融的钱只是餐前小菜,接下来大股东能干的事包括但不限于:原始股解禁套现,股票质押回购,发公司债券,定增圈钱,配股圈钱,高送转炒高股价后套现,并购重组炒高股价后套现。最后要是撂担子不想干了,…
本人码农,从六月开始正式接触机器学习(其实五年前的本科毕设就是在生物信息领域应用神经网络的项目,但是非常浅薄),深吸一口气,先要声明“人之患在好为人师”,我用的步骤只是适合我,下面的内容仅供参考。&br&&br&&b&第一步:复习线性代数。&/b&(学渣的线代忘了好多-_-||)&br&&ul&&li&懒得看书就直接用了著名的——&a href=&//link.zhihu.com/?target=http%3A//open.163.com/special/opencourse/daishu.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&麻省理工公开课:线性代数&/a&,深入浅出效果拔群,以后会用到的SVD、希尔伯特空间等都有介绍;&/li&&li&广告:边看边总结了一套笔记 &a href=&//link.zhihu.com/?target=https%3A//github.com/zlotus/notes-linear-algebra& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&GitHub - zlotus/notes-linear-algebra: 线性代数笔记&/a&。&/li&&/ul&&b&第二步:入门机器学习算法。&/b&&br&&ul&&li&还是因为比较懒,也就直接用了著名的——&a href=&//link.zhihu.com/?target=http%3A//open.163.com/special/opencourse/machinelearning.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&斯坦福大学公开课 :机器学习课程&/a&,吴恩达教授的老版cs229的视频,讲的非常细(算法的目标-&数学推演-&伪代码)。这套教程唯一的缺点在于没有介绍最近大火的神经网络,但其实这也算是优点,让我明白了算法都有各自的应用领域,并不是所有问题都需要用神经网络来解决;&/li&&li&多说一点,这个课程里详细介绍的内容有:一般线性模型、高斯系列模型、SVM理论及实现、聚类算法以及EM算法的各种相关应用、PCA/ICA、学习理论、马尔可夫系列模型。课堂笔记在:&a href=&//link.zhihu.com/?target=http%3A//cs229.stanford.edu/materials.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&CS 229: Machine Learning (Course handouts)&/a&,同样非常详细。&/li&&li&广告:边看边总结了一套笔记 &a href=&//link.zhihu.com/?target=https%3A//github.com/zlotus/notes-LSJU-machine-learning& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&GitHub - zlotus/notes-LSJU-machine-learning: 机器学习笔记&/a&&/li&&/ul&&b&第三步:尝试用代码实现算法。&/b&&br&&ul&&li&依然因为比较懒,继续直接使用了著名的——&a href=&//link.zhihu.com/?target=https%3A//www.coursera.org/learn/machine-learning/home/welcome& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&机器学习 | Coursera&/a& ,还是吴恩达教授的课程,只不过这个是极简版的cs229,几乎就是教怎么在matlab里快速实现一个模型(这套教程里有神经网络基本概念及实现)。这套课程的缺点是难度比较低,推导过程非常简略,但是这也是它的优点——让我专注于把理论转化成代码。&/li&&li&广告:作业参考 &a href=&//link.zhihu.com/?target=https%3A//github.com/zlotus/Coursera_Machine_Learning_Exercises& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&GitHub - zlotus/Coursera_Machine_Learning_Exercises: Machine Learning by Andrew Ng from Coursera&/a&&/li&&/ul&&b&第四步:自己实现功能完整的模型&/b&——进行中。&br&&ul&&li&还是因为比较懒,搜到了cs231n的课程视频 &a href=&//link.zhihu.com/?target=https%3A//www.youtube.com/playlist%3Flist%3DPLkt2uSq6rBVctENoVBg1TpCC7OQi31AlC& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&CS231n Winter 2016 - YouTube&/a& ,李飞飞教授的课,主讲还有Andrej Karpathy和Justin Johnson,主要介绍卷积神经网络在图像识别/机器视觉领域的应用(前面神经网络的代码没写够?这门课包你嗨到爆~到处都是从零手写~)。这门课程的作业就更贴心了,直接用Jupyter Notebook布置的,可以本地运行并自己检查错误。主要使用Python以及Python系列的科学计算库(Scipy/Numpy/Matplotlib)。课堂笔记的翻译可以参考 &a href=&https://zhuanlan.zhihu.com/p/& class=&internal&&智能单元 - 知乎专栏&/a&,主要由知友杜客翻译,写的非常好~&/li&&li&在多说一点,这门课对程序员来说比较走心,因为这个不像上一步中用matlab实现的作业那样偏向算法和模型,这门课用Python实现的模型同时注重软件工程,包括常见的封装layer的forward/backward、自定义组合layer、如何将layer组成网络、如何在网络中集成batch-normalization及dropout等功能、如何在复杂模型下做梯度检查等等;最后一个作业中还有手动实现RNN及其基友LSTM、编写有助于调试的CNN可视化功能、Google的DeepDream等等。(做完作业基本就可以看懂现在流行的各种图片风格变换程序了,如 &a href=&//link.zhihu.com/?target=https%3A//github.com/cysmith/neural-style-tf& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&cysmith/neural-style-tf&/a&)另外,这门课的作业实现非常推崇computational graph,不知道是不是我的幻觉……要注意的是讲师A.K的语速奇快无比,好在YouTube有自动生成解说词的功能,准确率还不错,可以当字幕看。&/li&&li&广告:作业参考 &a href=&//link.zhihu.com/?target=https%3A//github.com/zlotus/cs231n& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&GitHub - zlotus/cs231n: CS231n Convolutional Neural Networks for Visual Recognition (winter 2016)&/a& (我的在作业的notebook上加了一些推导演算哦~可以用来参考:D)&/li&&/ul&&br&因为最近手头有论文要撕,时间比较紧,第四步做完就先告一段落。后面打算做继续业界传奇Geoffrey Hinton教授的&a href=&//link.zhihu.com/?target=https%3A//www.coursera.org/learn/neural-networks/home/welcome& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Neural Networks for Machine Learning | Coursera&/a&,再看看NLP的课程 &a href=&//link.zhihu.com/?target=http%3A//cs224d.stanford.edu/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Stanford University CS224d: Deep Learning for Natural Language Processing&/a&,先把基础补完,然后在东瞅瞅西逛逛看看有什么好玩的……&br&&br&PS:一直没提诸如TensorFlow之类的神器,早就装了一个(可以直接在conda中为Tensorflow新建一个env,然后再装上Jupyter、sklearn等常用的库,把这些在学习和实践ML时所用到的库都放在一个环境下管理,会方便很多),然而一直没时间学习使用,还是打算先忍着把基础部分看完,抖M总是喜欢把最好的留在最后一个人偷偷享受2333333(手动奸笑&br&&br&PS**2:关于用到的系统性知识,主要有:&br&&ul&&li&线性代数,非常重要,模型计算全靠它~一定要复习扎实,如果平常不用可能忘的比较多;&br&&/li&&li&高数+概率,这俩只要掌握基础就行了,比如积分和求导、各种分布、参数估计等等。(评论中有知友提到概率与数理统计的重要性,我举四肢赞成,因为cs229中几乎所有算法的推演都是从参数估计及其在概率模型中的意义起手的,参数的更新规则具有概率上的可解释性。对于算法的设计和改进工作,概统是核心课程,没有之一。答主这里想要说的是,当拿到现成的算法时,仅需要概率基础知识就能看懂,然后需要比较多的线代知识才能让模型高效的跑起来。比如最近做卷积的作业, 我手写的比作业里给出的带各种trick的fast函数慢几个数量级,作业还安慰我不要在意效率,岂可修!)&/li&&/ul&需要用到的编程知识也就是Matlab和Numpy了吧,Matlab是可以现学现卖的;至于Python,就看题主想用来做什么了,如果就是用来做机器学习,完全可以一天入门,如果想要做更多好玩的事,一天不行那就两天。(贴一个Python/Numpy的简要教程:&a href=&//link.zhihu.com/?target=http%3A//cs231n.github.io/python-numpy-tutorial/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Python Numpy Tutorial&/a&,是cs231n的课堂福利。)&br&&br&我感觉机器学习的先修就这么点,记得Adobe的冯东大

我要回帖

更多关于 保险资管从业人员 炒股 的文章

 

随机推荐