如何亚马逊星级评价算法阿里巴巴的盖昆的算法LS-MLR

恒大 | 冬奥会 | 炒股 | 美股 | 基金 | 穿越 | 黄金投资 | 摩纳哥 | 首次公开募股（IPO） | 外汇交易 | 动漫 | 智利 | 股价 | 视频会议 | 毕业论文 | 东京 | 服饰搭配 | 海淘 | 金融数学 | 赚钱 | 创业团队 | 量化交易 | 盈利模式 | 重大疾病保险 | 足球 | 文案 | 易纲 | 企业管理 | 别墅 | 代理 | 户型 | 八字算命 | 写字楼 | 平面设计 | 赎回 | 在线教育 | 阿里云os | 苏州市 | 交易平台 | 书籍推荐 | 基金定投 | 睡眠 | 燕窝 | 对联 | 韭菜 | 人体 | 白酒 | 人口 | 中医 | 江苏银行 | 二胎 | 咖啡馆 | 中药 | 外汇投资 | 儿科 | 投资银行 | 生意 | 塞浦路斯 | 工资 | 融资 | 广告人 | 商业模式 | 艺术 | 会计学习 | 老挝 | 超市 | 股市 | 网络推广 | 澳大利亚 | 破产 | Python | 失业保险 | 芯片（集成电路） | 汉语 | 肺炎 | 企业邮箱 | 福建省 | 程序员 | 化工 | 热水器 | 非法集资 | 编程 | 银行业务 | 故事 | 债券 | 香港理工大学 | 私募股权（pe） | 数据分析 | 电影 | 负债 | 试管婴儿 | 银行工作 | 能源期货 | 上海租房 | 嘉兴市 | 房地产开发商 | 创业想法 | 日本动漫 | 图片 | 港股 | 石家庄市 | 饮酒 | 医生 | 公司法 | 音响设备 | 金融学 | 图书 | 互联网广告 | 智能电视 | 原油投资 | 饮食 | 智能仪器 | 名言 | 新能源汽车 | 公益活动 | 结构工程 | 电源 | 礼节礼仪 | 办公家具 | 电路 | 微信朋友圈 | 辞退 | 汕尾市 | 民间借贷 | 皮肤 | 离职 | 代购 | 收藏 | 国家开发银行 | 歌词 | 团队管理 | 纪录片 | 澳门 | 电视节目 | 北京地铁 | 星座 | 车辆 | 车祸 | 中学 | 包装设计 | 老师 | 饮料 | 陈卓林 | 学习 | 背景音乐（bgm） | 营销策划 | 民国 | 教育培训 | 头屯河区 | 植物辨识 | 高考志愿 | 人生 | 马云（人物） | 缅甸 | 驾驶 | 今日头条 | 糕点 | 感冒 | 网站运营 | 品牌营销 | 面包车 | 创业股份分配 | 祛痘 | 服装品牌 | 变相传销 | 世界杯 | 巧克力 | 南航 | 元氏县 | 婆媳关系 | 浙江核新同花顺网络信息服务有限公司 | 大学生兼职 | 机动车驾驶证考试 | 股票配资 | 汉服 | 婚礼 | 网络营销 | 焦虑 | logo设计 | 自建房 | 活动策划 | 作文 | 电梯事故 | 整容 | 机器人 | 石油 | 永修县 | 中国电信 | 专利申请 | 手办 | 国际贸易 | 天使投资 | 宁波 | 森美 | 微店 | 沥青 | 珠宝行业 | 期权 | 猎头 | 百度地图 |

你的位置：网站首页 >> 频道首页 >>互联网 >>如何亚马逊星级评价算法阿里巴巴的盖昆的算法LS-MLR

如何亚马逊星级评价算法阿里巴巴的盖昆的算法LS-MLR

来源：蜘蛛抓取(WebSpider) 时间：2017-06-23 08:43 标签：评价算法

阿里的LS-PLM是Jordan 1994年提出的混合专家模型的改进，最大的特点是加入了sparse group lasso，其中优化sparse group lasso是基于OWL-QN(Andrew & Gao 2007) orthant-based想法(在同一象限看成是连续可微函数，在参数从+到1，或是从-到+，强制在0点根据sub-gradient来决定走向)，一般针对非光滑的目标函数采用是sub-gradient来优化，或者是采用proximal gradient来，但是这种group lasso即使采用proximal gradient的时候也很难在每一步求出闭式解，所以使用用另一种常用的方法：方向导数来求得最快下降方向(其实传统的连续可微函数的梯度的定义就是方向导数最大的方向向量)，利用极限就不难求出来最快下降方向了。&/p&&p&
好吧，我厚颜无耻的插入一段广告，猿辅导开源的ytk-learn(&a href=&///?target=https%3A///yuantiku/ytk-learn& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&yuantiku/ytk-learn&i class=&icon-external&&&/i&&/a&)中实现的Gradient Boosting Soft Tree(GBST)，jordan混合专家模型的变种(目前混合专家模型在deep learning也用到很多), 一种可以在含有大量categorical特征场景中使用的GBDT：&/p&&br&&img src=&/v2-4be80c4ec5bcbdf940cc32_b.png& data-rawwidth=&1794& data-rawheight=&636& class=&origin_image zh-lightbox-thumb& width=&1794& data-original=&/v2-4be80c4ec5bcbdf940cc32_r.png&&&br&&p&支持两种gating函数：&/p&&br&&img src=&/v2-26e8d9ddded_b.png& data-rawwidth=&1956& data-rawheight=&1346& class=&origin_image zh-lightbox-thumb& width=&1956& data-original=&/v2-26e8d9ddded_r.png&&&p&支持两种basis score函数：&/p&&br&&img src=&/v2-5bca47c8cefa2dba6e3b_b.png& data-rawwidth=&1738& data-rawheight=&390& class=&origin_image zh-lightbox-thumb& width=&1738& data-original=&/v2-5bca47c8cefa2dba6e3b_r.png&&&br&&p&不难看出阿里的LS-PLM是我们GBST(tree num = 1, gating函数为softmax, 基函数为linear)的特殊情况。&/p&&p&优点：混合专家模型在很多含有大量categorical特征场景中的效果确实比lr, fm, ffm要好不少&/p&&p&缺点：非凸函数，优化初始化比较难，这点跟k-means类似，但是在维度特别高的情况，这种初始化就更难了，很多时候只有一两个叶子节点的gating有效，大量的叶子节点无效。楼上提到的模型级联可能是一种解决方案，我认为level-based可能也是一种解决方案(后续我们会在ytk-learn中实现)&/p&
阿里的LS-PLM是Jordan 1994年提出的混合专家模型的改进，最大的特点是加入了sparse group lasso，其中优化sparse group lasso是基于OWL-QN(Andrew & Gao 2007) orthant-based想法(在同一象限看成是连续可微函数，在参数从+到1，或是从-到+，强制在0点根据su…
已有帐号？
无法登录？
社交帐号登录
3504 人关注
420 条内容
8054 人关注
604 条内容
181 条内容
130 人关注
106 条内容【杭州个性化推荐算法工程师招聘】阿里巴巴集团招聘个性化推荐算法工程师-看准网
个性化推荐算法工程师
岗位描述:1 为天猫超市及天猫行业场景开发推荐方案和算法，抽象产品和运营的业务逻辑，设计合理的流量分配机制，在商品推荐、店铺推荐、内容推荐、促销活动等场景中提高用户体验与流量利用效率。2 对海量数据分析、挖掘有浓厚兴趣，热衷于机器学习和数据挖掘技术理论和实践，乐于钻研，对数据敏感，喜欢观察数据并从中发现价值；3 参与实践过用户、内容和商品标签和画像体系的开发落地，能提供基本的大数据分析建模方案，有沉淀行业解决方案思考和能力，协助拓展业务边界4 改进与研发新的推荐技术尤其是深度学习前沿问题的探索与研究，包括但不限于深度学习，强化学习、迁移学习、主动学习、维度降低、核方法、谱方法、特征提取与稀疏学习、推荐Rank、随机优化等的算法和系统框架研发等岗位要求:1 精通部分常用的机器学习技术，如Logistic Regression、GBDT、CNN、RNN、Reinforcement Learning等2 精通部分协同过滤相关技术，如ItemCF、SVD++等3 有大数据计算平台如Hadoop上的开发经验4 要求候选人计算机、数学或统计学等相关专业，精通常用机器学习、数据挖掘和自然语言处理相关理论，对深度学习有所实践者优先5 具备一种或多种高级语言及脚本语言的（如java，C++，Python等）的程序和算法开发能力，掌握常用数据结构和算法；6 沉稳厚重，严谨皮实，具备强烈的进取心、求知欲及团队合作精神；7 有实际成果并发表在国际顶级会议、期刊者优先
欢迎关注阿里巴巴招聘！阿里巴巴集团经营多元化的互联网业务，致力为全球所有人创造便捷的交易渠道。自成立以来，阿里巴巴集团建立了领先的消费者电子商务、网上支付、B2B网上交易市场及云计算业务，近几年更积极开拓无线应用、手机操作系统和互联网电视等领域。集团以促进一个开放、协同、繁荣的电子商务生态系统为目标，旨在对消费者、商家以及经济发展做出贡献。阿里巴巴集团由本为英语教师的中国互联网先锋马云于1999年带领其他17人在杭州创立，他希望将互联网发展成为普及使用、安全可靠的工具，让大众受惠。阿里巴巴集团由私人持股，现在大中华地区、新加坡、印度、英国及美国设有70多个办事处，共有20,400多名员工。阿里巴巴集团的使命是让天下没有难做的生意。我们经营多个领先的网上及移动平台，业务覆盖零售和批发贸易及云计算等。我们向消费者、商家及其他参与者提供技术和服务，让他们可在我们的生态系统里进行商贸活动。阿里巴巴集团及其子公司基于共同的使命、愿景及价值体系，建立了强大的企业文化，作为我们业务的基石。我们的业务成功和快速增长有赖于我们尊崇企业家精神和创新精神，并且始终如一地关注和满足客户的需求。　　新员工加入阿里巴巴集团的时候，需于杭州总部参加全面的入职培训和团队建设课程，该课程着重于公司的使命、愿景和价值观，而我们也会在定期的培训、团队建设训练和公司活动中再度强调这些内容。无论公司成长到哪个阶段，这强大的共同价值观让我们可以维持一贯的企业文化。我们的梦想:通过发展新的生意方式创造一个截然不同的世界我们的使命：让天下没有难做的生意我们的愿景：分享数据的第一平台；幸福指数最高的企业&活102年&我们的价值观：我们坚持&客户第一、员工第二、股东第三&。阿里巴巴集团有六个核心价值观，是我们企业文化的基石和公司DNA的重要部分。该六个核心价值观为：　客户第一：客户是衣食父母　团队合作：共享共担，平凡人做平凡事　拥抱变化：迎接变化，勇于创新　诚信：诚实正直，言行坦荡　激情：乐观向上，永不言弃　敬业：专业执着，精益求精！
该公司其他工作机会
Duang~我要涨薪！
匿名填写收入情况，立刻获取涨薪20%的机会
来自1个员工
离职员工 -
走的时候很舍不得，好领导，好平台。。。...
愿意推荐朋友
公司发展变好
面试难度系数
来自3个员工
匿名用户&&&&面试阿里巴巴集团的&-&&杭州
面试经历：
首先先是电话面试主要问的是java和android基础的知识和原理，然后参加的是视频面试，问的是an...
面试未通过面试整体感受：不好困难
面试通关必备
最新面试题等你来看
看了该职位的人还看了
北京你我一起科技公司
北京你我一起科技公司
免费发布职位/提升职位曝光
看准网()为您免费提供阿里巴巴集团相关信息，包括阿里巴巴集团招聘、工资、面试、评价及员工、工作环境照片，以上信息均由阿里巴巴集团员工匿名提交，看准网整理发布，所有阿里巴巴集团相关内容均不代表看准网意见！
下载看准APP
点评工资任意看
查看5,608,972家公司的员工评价，预先看清你想去的每一家公司
获取职位最新招聘信息
一有该职位最新招聘信息马上通知您
王晓晴正在直聘
阿里巴巴集团·
我在boss直聘等你来沟通入职。
500万人安装扫一扫，下载APP
附件简历：
请上传简历！
附件简历：
下载看准APP
点评工资任意看
查看5,608,972家公司的员工评价，预先看清你想去的每一家公司热门排序 |
&p&谢邀。&/p&&p&很正常，在跟随微软已经成功的路线。&/p&&p&可以参考这个问题下面的回答：&a href=&/question/& class=&internal&&如何评价微软在数据中心使用FPGA代替传统CPU的做法？ - 知乎&/a&&/p&&p&目前国内已经开始形成T+Xilinx和A+Intel PSG对峙的局面，双方都在加紧部署。&/p&&p&至于对FPGA发展方向的影响，我估计和GPGPU类似。在去掉一些无关的功能后，出现专门面向运算加速的FPGA。具体形态应该包括但不限于：1.去掉大部分IO可编程的功能；2.以SiP的形式内置大容量的存储器；3.高速以太网和PCI-e完全硬核化，而且需要多通道。&/p&
谢邀。很正常，在跟随微软已经成功的路线。可以参考这个问题下面的回答：目前国内已经开始形成T+Xilinx和A+Intel PSG对峙的局面，双方都在加紧部署。至于对FPGA发展方向的影响，我估计和GPGPU类似…
强无敌。&br&白金xoen的规格很明显是敌不过epyc的。&br&价格虽然还不清楚...不过白金xeon的旗舰已经钦定28c56t，主频2.2-3.0，其他的东西和epyc差距不大。实际上白金xeon唯一的筹码就只剩下avx512了...&br&epyc价格真的很便宜。32c仅售20000+...&br&不过最后谁卖的好？这个还真说不定。市场份额Intel不可能会低于AMD，问题只是AMD能抢走多少，看样子应该能抢走不少。&br&企业级的市场环境和消费级完全不一样。没有可比性。&br&这是一颗8176&br&&img src=&/v2-2ff69ff2cbbd498bbf7b1138a60eee23_b.jpg& data-rawwidth=&398& data-rawheight=&246& class=&content_image& width=&398&&-3.0...&br&&br&&br&&br&&br&&br&&br&&br&&br&&br&&br&&img src=&/v2-7cf0f36bb0d6a619e827c46e16e38b11_b.png& data-rawwidth=&425& data-rawheight=&106& class=&origin_image zh-lightbox-thumb& width=&425& data-original=&/v2-7cf0f36bb0d6a619e827c46e16e38b11_r.png&&&br&给你们看看Intel令人窒息的公关
强无敌。白金xoen的规格很明显是敌不过epyc的。价格虽然还不清楚...不过白金xeon的旗舰已经钦定28c56t，主频2.2-3.0，其他的东西和epyc差距不大。实际上白金xeon唯一的筹码就只剩下avx512了... epyc价格真的很便宜。32c仅售20000+... 不过最后谁卖的好？…
&p&两年前提的问题，搞了两年相关方面的科研，论文也发了不少，特地跑来自问自答。&/p&&p&直流配电网这个概念火起来也就是近几年的事情，两家电网公司在配电网升级改造方面投入了大量资金，随着电力电子技术的进步，人们也开始探讨直流应用配电网的可能性。甚至在深圳和苏州等地区，也在论证直流配电网应用的技术问题。&/p&&p&大概在10年到14年时，大家的科研热点是直流微电网，主要解决的是新能源并网或者孤岛等问题，可应用在海岛，舰船或者楼宇。微电网也属于低压配电网，但是现在大家的研究热点集中在中压配电的应用，也就是主要集中在正负10kV或者正负7.5kV等电压等级，主要解决的是提高电能质量，增大输送容量或者减小线路走廊等问题。其实这也不只是限于科研领域，国外已有相关工程实际应用，比如芬兰建设了一条农村地区的直流配电网已解决输送容量的问题，德国亚琛大学正在建设校园内部的直流配电网。&/p&&p&就像好多回答里提到的一样，如果直流配电网的建设目的只是为了减少换流环节，减少换流损耗，是很不现实的，成本很高，不可能大规模应用。也就说，在可预见的未来，直流配电网基本不可能作为配电网主网架独立存在，而最有可能的应用形式就是交直流混合配电网的应用，也就是在传统的交流配电网基础上进行改造或者直接增加新的直流线路，为特定区域特定用户搭设直流配电网。&/p&&p&交直流混合配电网的应用会带来一些显而易见的好处，比如对于数据中心、银行、高层建筑等，有的对电能质量要求高，有的用电量很大，有的线路走廊要求严格，直流可以满足这些需求；另外，传统的交流配电网是没有多少控制手段的，但在直流引入后，就可以通过控制换流站来使整个配电网运行更可靠，更优化，比如配电网一般损耗较大，功率因数较低，这些都可以通过换流站的调整实现优化。&/p&&p&在普及之前，也存在一些问题急需解决，比如变流器价格昂贵，谐波问题，协调控制问题，保护整定问题。&/p&&p&参考文献：&/p&&p&直流配电网研究现状与展望江道灼&/p&&p&交直流混合主动配电网关键技术研究
陈云燕&/p&&p&POSSIBILITIES OF THE LOW VOLTAGEDC DISTRIBUTION SYSTEMS&/p&
两年前提的问题，搞了两年相关方面的科研，论文也发了不少，特地跑来自问自答。直流配电网这个概念火起来也就是近几年的事情，两家电网公司在配电网升级改造方面投入了大量资金，随着电力电子技术的进步，人们也开始探讨直流应用配电网的可能性。甚至在深圳…
&img src=&/v2-0a657dbfbcd4c_b.jpg& data-rawwidth=&1440& data-rawheight=&1280& class=&origin_image zh-lightbox-thumb& width=&1440& data-original=&/v2-0a657dbfbcd4c_r.jpg&&&br&&p&&b&升级位置：&/b&联通的&b&手机营业厅&/b&APP——首页的沃推荐&/p&&p&----------------------&/p&&p&早在半年前，我在知乎上回答了“&a href=&/question//answer/& class=&internal&&腾讯大王卡值得办理吗？&/a&”与“&a href=&/question/& class=&internal&&蚂蚁宝卡值得办理吗？&/a&”&/p&&p&因为很多人反馈文章太长，有点乱，所以今天特意花费了一中午的时间，重新进行了编辑，如果再不喜欢，那你也只能忍着了......&b&（摔 (╯‵□′)╯︵┻━┻ ）&/b&&/p&&p&之前的内容后续维护修改了13次，收到了很多人的赞与支持，同样也收到了很多人的评论、私信还有回答邀请，在这里，十分感谢大家，同样也十分抱歉没有给与大家回复。&/p&&br&&img src=&/v2-10eed716accbad57f26d4_b.jpg& data-rawwidth=&600& data-rawheight=&375& class=&origin_image zh-lightbox-thumb& width=&600& data-original=&/v2-10eed716accbad57f26d4_r.jpg&&&br&&p&在传统意义上&b&“腾讯王卡”&/b&是第一个出现在我们面前的，当时刚出现的时候，朋友圈、空间、微博充斥着各种代注册、代申请的广告，可想而知当时想体验一下新卡是多么的不容易。&/p&&br&&p&而在“腾讯王卡”出现后又陆续出了&b&“蚂蚁宝卡”、“百度神卡”、“招商招卡”&/b&等等一系列的联合产品。&/p&&br&&p&可以通过我整理的一张图表，可以看出虽然出现了很多新卡，但在业务上也很难拥有创新，基本的模式都是“数据流量”+“通话时长”+“特殊优惠”的模式。&/p&&br&&img src=&/v2-cbbd3cd98d004_b.png& data-rawwidth=&1368& data-rawheight=&1314& class=&origin_image zh-lightbox-thumb& width=&1368& data-original=&/v2-cbbd3cd98d004_r.png&&&br&&p&“腾讯王卡”最为最早出现在我们视线中的联合产品，他的优势和劣势都很明显，优势一直在于&u&“日租流量”&/u&与&u&“腾讯免流”，“日租流量”&/u&这个概念在之前并没有多少人清楚，因为联通自己的日租卡并没有大范围的宣传，在“腾讯王卡”打出&b&“1天500MB，1天1块钱，不用不收费”&/b&、&b&“腾讯应用全免流”&/b&的宣传后迅速传播。&/p&&ul&&li&有优就有劣，“日租流量”虽然在有1天500MB流量的噱头，但是有两点不可避免，第一这个流量是省内流量，第二普通人很少会一天用到500MB流量。&/li&&li&而“腾讯应用全免流”在一开始也很华而不实，一是QQ/微信的视频语音通话不免流，二是腾讯视频的第三方视频不免流，这就很尴尬了。&/li&&li&最后一个劣势在于“通话时长”,在“大王卡”、“小王卡”都是没有的，对于很多需要经常电话沟通的人来说，这是一个很大的弊端，在这一点，腾讯可能在做产品定位时认为，QQ与微信的普及是不需要电话与短信的（玩笑话~~~哈哈哈哈~）&/li&&/ul&&br&&img src=&/v2-803d809f992f7cac93d59d9adcc8a7c1_b.jpg& data-rawwidth=&600& data-rawheight=&450& class=&origin_image zh-lightbox-thumb& width=&600& data-original=&/v2-803d809f992f7cac93d59d9adcc8a7c1_r.jpg&&&br&&p&但是当&b&回到现实&/b&，你会发现，腾讯很努力，从一开始的不靠谱，不成熟，逐渐有了自己的想法与进步。&/p&&br&&p&&b&“腾讯王卡”做为第一个吃螃蟹的人&/b&，在经过长时间的收集用户反馈之后，在接下来的时间里进行了大幅度的改变。&/p&&br&&ul&&li&首先是“日租流量”增加了国内流量，将1天1元500MB省内流量，增加了1天2元500MB省外流量，给出差、旅游与短时间去异地的人更好的解决方案。&/li&&/ul&&blockquote&而在后来出现的联通各类联合产品中，“腾讯王卡”是为数不多在采用“日租流量”的产品（另一个是“B站2233卡”）。
在“日租流量”这一个点上，没有太多的问题，这个点应该去考虑的是“我每天能用多少流量？”，而不是“我每天一定要用到这么多流量”。
如果你觉得，你用的流量很多，大于3G以上，但是每天不超过500MB流量，可以考虑“腾讯王卡”。&/blockquote&&ul&&li&其次在“腾讯应用全免流”方面，积极地将“QQ/微信视频语音通话免流”更新上去，这不可否认是一个很关键的点。&/li&&/ul&&blockquote&在这个点上，我个人认为如果你是个腾讯的忠实用户（玩着腾讯游戏、用着QQ和基友开黑语音，用着微信经常和男票包电话粥）、并且不经常接触WIFI，或者是一名学生、一个搬砖族，可以考虑“腾讯王卡”。&/blockquote&&ul&&li&最后在已有的“大王卡”、“小王卡”之上，增加了“天王卡”，“天王卡”在“大王卡”的基础上，增加了500分钟的国内通话。&/li&&/ul&&blockquote&&b&这是欣赏“腾讯王卡”的很重要一点，让用户可以看到进步，自身也在努力去维护。&/b&
在比较上来看如果你每天都会使用流量，但是不经常出省，经常要打电话，但是又不会超过500分钟，那么你一个月需要花费90左右，而在其他联合产品中，“通话时长”在500分钟左右的都有哪些呢？
“招商大招卡”600分钟，月租96元；
“滴滴大橙卡”600分钟，月租96元；
“运满满大满卡”400分钟，月租56元；
（滴滴王卡不算在内）
如果你经常用流量，“运满满大满卡”就算了，2GB的国内流量真的不够用，而专属特权是针对司机的，你确定你用得到？
在对比上，招商与滴滴两张卡的业务基本相同月租96元；600分钟通话，6GB国内流量，这一点对比起来其实也真的是与“腾讯天王卡”比较的。&/blockquote&&br&&p&所以请考虑。&/p&&p&各卡申请地址：&a href=&///?target=http%3A////card/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&“腾讯王卡”等联合产品一览表&申请地址 - 哎喔&i class=&icon-external&&&/i&&/a&&/p&
升级位置：联通的手机营业厅APP——首页的沃推荐----------------------早在半年前，我在知乎上回答了“”与“”因为很多人反馈文章太长，有点乱，所以今天特意花费了一中午的时间，重新进行了编辑，如果再不喜…
利益相关：微软亚洲研究院实习生，研究方向是 FPGA 在数据中心的应用。&br&&br&问题「用 FPGA 代替 CPU」中，这个「代替」的说法不准确。我们并不是不用 CPU 了，而是&b&用 FPGA 加速适合它的计算任务，其他任务仍然在 CPU 上完成，让 FPGA 和 CPU 协同工作&/b&。&br&&br&本回答将涵盖三个问题：&br&&ol&&li&为什么使用 FPGA，相比 CPU、GPU、ASIC（专用芯片）有什么特点？&/li&&li&微软的 FPGA 部署在哪里？FPGA 之间、FPGA 与 CPU 之间是如何通信的？&/li&&li&未来 FPGA 在云计算平台中应充当怎样的角色？仅仅是像 GPU 一样的计算加速卡吗？&/li&&/ol&&br&&b&一、为什么使用 FPGA？&/b&&br&&br&众所周知，通用处理器（CPU）的摩尔定律已入暮年，而机器学习和 Web 服务的规模却在指数级增长。&b&人们使用定制硬件来加速常见的计算任务，然而日新月异的行业又要求这些定制的硬件可被重新编程来执行新类型的计算任务&/b&。FPGA (Field Programmable Gate Array) 正是一种硬件可重构的体系结构，常年来被用作专用芯片（ASIC）的小批量替代品，然而近年来在微软、百度等公司的数据中心大规模部署，以&b&同时提供强大的计算能力和足够的灵活性&/b&。&br&&br&&img src=&/v2-71bb2dab64eb85e80b815c_b.png& data-rawwidth=&2106& data-rawheight=&1147& class=&origin_image zh-lightbox-thumb& width=&2106& data-original=&/v2-71bb2dab64eb85e80b815c_r.png&&&i&不同体系结构性能和灵活性的比较。&/i&&br&&br&FPGA 为什么快？「都是同行衬托得好」。&b&CPU、GPU 都属于冯·诺依曼结构，指令译码执行、共享内存。&/b&FPGA 之所以比 CPU 甚至 GPU 能效高，本质上是无指令、无需共享内存的体系结构带来的福利。&br&&br&冯氏结构中，由于执行单元（如 CPU 核）可能执行任意指令，就需要有指令存储器、译码器、各种指令的运算器、分支跳转处理逻辑。由于指令流的控制逻辑复杂，不可能有太多条独立的指令流，因此 GPU 使用 SIMD（单指令流多数据流）来让多个执行单元以同样的步调处理不同的数据，CPU 也支持 SIMD 指令。而 &b&FPGA 每个逻辑单元的功能在重编程（烧写）时就已经确定，不需要指令。&/b&&br&&br&冯氏结构中使用内存有两种作用。一是保存状态，二是在执行单元间通信。由于内存是共享的，就需要做访问仲裁；为了利用访问局部性，每个执行单元有一个私有的缓存，这就要维持执行部件间缓存的一致性。&b&对于保存状态的需求，&/b&&b&FPGA&/b& 中的寄存器和片上内存（BRAM）是属于各自的控制逻辑的，&b&无需不必要的仲裁和缓存&/b&。&b&对于通信的需求，FPGA&/b& 每个逻辑单元与周围逻辑单元的连接在重编程（烧写）时就已经确定，&b&并不需要通过共享内存来通信&/b&。&br&&br&说了这么多三千英尺高度的话，FPGA 实际的表现如何呢？我们分别来看计算密集型任务和通信密集型任务。&br&&br&&b&计算密集型任务&/b&的例子包括矩阵运算、图像处理、机器学习、压缩、非对称加密、Bing 搜索的排序等。这类任务一般是 CPU 把任务卸载（offload）给 FPGA 去执行。对这类任务，目前我们正在用的 Altera（似乎应该叫 Intel 了，我还是习惯叫 Altera……）Stratix V FPGA 的整数乘法运算性能与 20 核的 CPU 基本相当，浮点乘法运算性能与 8 核的 CPU 基本相当，而比 GPU 低一个数量级。我们即将用上的下一代 FPGA，Stratix 10，将配备更多的乘法器和硬件浮点运算部件，从而理论上可达到与现在的顶级 GPU 计算卡旗鼓相当的计算能力。&br&&br&&img src=&/v2-ff703e9c57f9cf55777b_b.png& data-rawwidth=&1053& data-rawheight=&832& class=&origin_image zh-lightbox-thumb& width=&1053& data-original=&/v2-ff703e9c57f9cf55777b_r.png&&&i&FPGA 的整数乘法运算能力（&/i&&i&估计值，&/i&&i&不使用 DSP，根据逻辑资源占用量估计）&/i&&br&&br&&img src=&/v2-404dcbcf292c4e31b3e12ebc228963af_b.png& data-rawwidth=&1070& data-rawheight=&831& class=&origin_image zh-lightbox-thumb& width=&1070& data-original=&/v2-404dcbcf292c4e31b3e12ebc228963af_r.png&&&i&FPGA 的浮点乘法运算能力（估计值，float16 用软核，float 32 用硬核）&/i&&br&&br&&b&在数据中心，FPGA 相比 GPU 的核心优势在于延迟&/b&。像 Bing 搜索排序这样的任务，要尽可能快地返回搜索结果，就需要尽可能降低每一步的延迟。如果使用 GPU 来加速，要想充分利用 GPU 的计算能力，batch size 就不能太小，延迟将高达毫秒量级。使用 FPGA 来加速的话，只需要微秒级的 PCIe 延迟（我们现在的 FPGA 是作为一块 PCIe 加速卡）。未来 Intel 推出通过 QPI 连接的 Xeon + FPGA 之后，CPU 和 FPGA 之间的延迟更可以降到 100 纳秒以下，跟访问主存没什么区别了。&br&&br&FPGA 为什么比 GPU 的延迟低这么多？这本质上是体系结构的区别。&b&FPGA 同时拥有流水线并行和数据并行，而 GPU 几乎只有数据并行（流水线深度受限）。&/b&例如处理一个数据包有 10 个步骤，FPGA 可以搭建一个 10 级流水线，流水线的不同级在处理不同的数据包，每个数据包流经 10 级之后处理完成。每处理完成一个数据包，就能马上输出。而 GPU 的数据并行方法是做 10 个计算单元，每个计算单元也在处理不同的数据包，然而所有的计算单元必须按照统一的步调，做相同的事情（SIMD，Single Instruction Multiple Data）。这就要求 10 个数据包必须一起输入、一起输出，输入输出的延迟增加了。当任务是逐个而非成批到达的时候，流水线并行比数据并行可实现更低的延迟。因此&b&对流式计算的任务，FPGA 比 GPU 天生有延迟方面的优势。&/b&&br&&br&&img src=&/v2-1ffb204e56f3d02b0cabdcd6f6c3fb34_b.png& data-rawwidth=&1435& data-rawheight=&476& class=&origin_image zh-lightbox-thumb& width=&1435& data-original=&/v2-1ffb204e56f3d02b0cabdcd6f6c3fb34_r.png&&&i&计算密集型任务，CPU、GPU、FPGA、ASIC 的数量级比较（以 16 位整数乘法为例，数字仅为数量级的估计）&/i&&br&&br&ASIC 专用芯片在吞吐量、延迟和功耗三方面都无可指摘，但微软并没有采用，出于两个原因：&br&&ol&&li&数据中心的计算任务是灵活多变的，而 ASIC 研发成本高、周期长。好不容易大规模部署了一批某种神经网络的加速卡，结果另一种神经网络更火了，钱就白费了。FPGA 只需要几百毫秒就可以更新逻辑功能。&b&FPGA 的灵活性可以保护投资，事实上，微软现在的 FPGA 玩法与最初的设想大不相同。&/b&&/li&&li&数据中心是租给不同的租户使用的，如果有的机器上有神经网络加速卡，有的机器上有 Bing 搜索加速卡，有的机器上有网络虚拟化加速卡，任务的调度和服务器的运维会很麻烦。&b&使用 FPGA 可以保持数据中心的同构性。&/b&&/li&&/ol&&br&接下来看通信密集型任务。相比计算密集型任务，通信密集型任务对每个输入数据的处理不甚复杂，基本上简单算算就输出了，这时通信往往会成为瓶颈。对称加密、防火墙、网络虚拟化都是通信密集型的例子。&br&&br&&img src=&/v2-d74634adc21db32f6fafed538c7b91ca_b.png& data-rawwidth=&1434& data-rawheight=&478& class=&origin_image zh-lightbox-thumb& width=&1434& data-original=&/v2-d74634adc21db32f6fafed538c7b91ca_r.png&&&i&通信密集型任务，CPU、GPU、FPGA、ASIC 的数量级比较（以 64 字节网络数据包处理为例，&/i&&i&数字仅为数量级的估计&/i&&i&）&/i&&br&&br&&b&对通信密集型任务，FPGA 相比 CPU、GPU 的优势就更大了&/b&。从吞吐量上讲，FPGA 上的收发器可以直接接上 40 Gbps 甚至 100 Gbps 的网线，以线速处理任意大小的数据包；而 CPU 需要从网卡把数据包收上来才能处理，&b&很多网卡是不能线速处理 64 字节的小数据包的&/b&。尽管可以通过插多块网卡来达到高性能，但 CPU 和主板支持的 PCIe 插槽数量往往有限，而且网卡、交换机本身也价格不菲。&br&&br&从延迟上讲，网卡把数据包收到 CPU，CPU 再发给网卡，即使使用 DPDK 这样高性能的数据包处理框架，延迟也有 4~5 微秒。更严重的问题是，&b&通用 CPU 的延迟不够稳定&/b&。例如当负载较高时，转发延迟可能升到几十微秒甚至更高（如下图所示）；现代操作系统中的时钟中断和任务调度也增加了延迟的不确定性。&br&&img src=&/v2-b5b50a3c73cba5223ada6c6_b.png& data-rawwidth=&817& data-rawheight=&594& class=&origin_image zh-lightbox-thumb& width=&817& data-original=&/v2-b5b50a3c73cba5223ada6c6_r.png&&&i&ClickNP（FPGA）与 Dell S6000 交换机（商用交换机芯片）、Click+DPDK（CPU）和 Linux（CPU）的转发延迟比较，error bar 表示 5% 和 95%。来源：[5]&/i&&br&&br&虽然 GPU 也可以高性能处理数据包，但 GPU 是没有网口的，意味着需要首先把数据包由网卡收上来，再让 GPU 去做处理。这样吞吐量受到 CPU 和/或网卡的限制。GPU 本身的延迟就更不必说了。&br&&br&那么为什么不把这些网络功能做进网卡，或者使用可编程交换机呢？&b&ASIC 的灵活性仍然是硬伤&/b&。尽管目前有越来越强大的可编程交换机芯片，比如支持 P4 语言的 Tofino，ASIC 仍然不能做复杂的有状态处理，比如某种自定义的加密算法。&br&&br&综上，&b&在数据中心里 FPGA 的主要优势是稳定又极低的延迟，适用于流式的计算密集型任务和通信密集型任务。&/b&&br&&br&&br&&b&二、微软部署 FPGA 的实践&/b&&br&&br&2016 年 9 月，《连线》（&i&Wired&/i&）杂志发表了一篇《微软把未来押注在 FPGA 上》的报道 [3]，讲述了 Catapult 项目的前世今生。紧接着，Catapult 项目的老大 Doug Burger 在 Ignite 2016 大会上与微软 CEO Satya Nadella 一起做了 FPGA 加速机器翻译的演示。演示的总计算能力是 103 万 T ops，也就是 1.03 Exa-op，相当于 10 万块顶级 GPU 计算卡。一块 FPGA（加上板上内存和网络接口等）的功耗大约是 30 W，仅增加了整个服务器功耗的十分之一。&br&&br&&img src=&/v2-de52eeb2acae767ec3a3_b.png& data-rawwidth=&1410& data-rawheight=&731& class=&origin_image zh-lightbox-thumb& width=&1410& data-original=&/v2-de52eeb2acae767ec3a3_r.png&&&i&Ignite 2016 上的演示：每秒 1 Exa-op (10^18) 的机器翻译运算能力&/i&&br&&br&微软部署 FPGA 并不是一帆风顺的。&b&对于把 FPGA 部署在哪里这个问题，大致经历了三个阶段：&/b&&br&&ol&&li&&b&专用的 FPGA 集群，里面插满了 FPGA&/b&&/li&&li&&b&每台机器一块 FPGA，采用专用网络连接&/b&&/li&&li&&b&每台机器一块 FPGA，放在网卡和交换机之间，共享服务器网络&/b&&/li&&/ol&&img src=&/v2-880465ced11d754f07f8edd225e48cab_b.png& data-rawwidth=&1077& data-rawheight=&1335& class=&origin_image zh-lightbox-thumb& width=&1077& data-original=&/v2-880465ced11d754f07f8edd225e48cab_r.png&&&i&微软 FPGA 部署方式的三个阶段，来源：[3]&/i&&br&&br&第一个阶段是专用集群，里面插满了 FPGA 加速卡，就像是一个 FPGA 组成的超级计算机。下图是最早的 BFB 实验板，一块 PCIe 卡上放了 6 块 FPGA，每台 1U 服务器上又插了 4 块 PCIe 卡。&br&&br&&img src=&/v2-8edb5cfe1cf_b.png& data-rawwidth=&2483& data-rawheight=&1101& class=&origin_image zh-lightbox-thumb& width=&2483& data-original=&/v2-8edb5cfe1cf_r.png&&&i&最早的 BFB 实验板，上面放了 6 块 FPGA。来源：[1]&/i&&br&&br&可以注意到该公司的名字。在半导体行业，只要批量足够大，芯片的价格都将趋向于沙子的价格。据传闻，正是由于该公司不肯给「沙子的价格」，才选择了另一家公司。当然现在数据中心领域用两家公司 FPGA 的都有。&b&只要规模足够大，对 FPGA 价格过高的担心将是不必要的。&/b&&br&&br&&img src=&/v2-aa8f6a91bfa87bd5db9165_b.png& data-rawwidth=&714& data-rawheight=&599& class=&origin_image zh-lightbox-thumb& width=&714& data-original=&/v2-aa8f6a91bfa87bd5db9165_r.png&&&i&最早的 BFB 实验板，1U 服务器上插了 4 块 FPGA 卡。来源：[1]&/i&&br&&br&像超级计算机一样的部署方式，意味着有专门的一个机柜全是上图这种装了 24 块 FPGA 的服务器（下图左）。这种方式有几个问题：&br&&ol&&li&不同机器的 FPGA 之间无法通信，FPGA 所能处理问题的规模受限于单台服务器上 FPGA 的数量；&/li&&li&数据中心里的其他机器要把任务集中发到这个机柜，构成了 in-cast，网络延迟很难做到稳定。&/li&&li&FPGA 专用机柜构成了单点故障，只要它一坏，谁都别想加速了；&/li&&li&装 FPGA 的服务器是定制的，冷却、运维都增加了麻烦。&/li&&/ol&&br&&img src=&/v2-70aa39ffd70ec_b.png& data-rawwidth=&2534& data-rawheight=&1206& class=&origin_image zh-lightbox-thumb& width=&2534& data-original=&/v2-70aa39ffd70ec_r.png&&&i&部署 FPGA 的三种方式，从中心化到分布式。来源：[1]&/i&&br&&br&一种不那么激进的方式是，在每个机柜一面部署一台装满 FPGA 的服务器（上图中）。这避免了上述问题 (2)(3)，但 (1)(4) 仍然没有解决。&br&&br&第二个阶段，为了&b&保证数据中心中服务器的同构性&/b&（这也是不用 ASIC 的一个重要原因），在每台服务器上插一块 FPGA（上图右），FPGA 之间通过专用网络连接。这也是微软在 ISCA'14 上所发表论文采用的部署方式。&br&&br&&img src=&/v2-7b73facc9e24d0fceca7e_b.png& data-rawwidth=&858& data-rawheight=&612& class=&origin_image zh-lightbox-thumb& width=&858& data-original=&/v2-7b73facc9e24d0fceca7e_r.png&&&i&Open Compute Server 在机架中。来源：[1]&/i&&br&&br&&img src=&/v2-e23b8d5c807ad2fffbec_b.png& data-rawwidth=&2433& data-rawheight=&736& class=&origin_image zh-lightbox-thumb& width=&2433& data-original=&/v2-e23b8d5c807ad2fffbec_r.png&&&i&Open Compute Server 内景。红框是放 FPGA 的位置。来源：[1]&/i&&br&&br&&img src=&/v2-f0ca82beaa1389406ebbc15_b.png& data-rawwidth=&1034& data-rawheight=&594& class=&origin_image zh-lightbox-thumb& width=&1034& data-original=&/v2-f0ca82beaa1389406ebbc15_r.png&&&i&插入 FPGA 后的 Open Compute Server。来源：[1]&/i&&br&&br&&img src=&/v2-6d0fdf2e59d9a4b579fc59c_b.png& data-rawwidth=&1002& data-rawheight=&1353& class=&origin_image zh-lightbox-thumb& width=&1002& data-original=&/v2-6d0fdf2e59d9a4b579fc59c_r.png&&&i&FPGA 与 Open Compute Server 之间的连接与固定。来源：[1]&/i&&br&&br&FPGA 采用 Stratix V D5，有 172K 个 ALM，2014 个 M20K 片上内存，1590 个 DSP。板上有一个 8GB DDR3-1333 内存，一个 PCIe Gen3 x8 接口，两个 10 Gbps 网络接口。一个机柜之间的 FPGA 采用专用网络连接，一组 10G 网口 8 个一组连成环，另一组 10G 网口 6 个一组连成环，不使用交换机。&br&&br&&img src=&/v2-a932a3ac4cd8_b.png& data-rawwidth=&2431& data-rawheight=&1218& class=&origin_image zh-lightbox-thumb& width=&2431& data-original=&/v2-a932a3ac4cd8_r.png&&&i&机柜中 FPGA 之间的网络连接方式。来源：[1]&/i&&br&&br&这样一个 1632 台服务器、1632 块 FPGA 的集群，把 Bing 的搜索结果排序整体性能提高到了 2 倍（换言之，节省了一半的服务器）。如下图所示，每 8 块 FPGA 穿成一条链，中间用前面提到的 10 Gbps 专用网线来通信。这 8 块 FPGA 各司其职，有的负责从文档中提取特征（黄色），有的负责计算特征表达式（绿色），有的负责计算文档的得分（红色）。&br&&br&&img src=&/v2-aaef099e0f6cf7aaf9e5be6bb3b0bc27_b.png& data-rawwidth=&1655& data-rawheight=&1155& class=&origin_image zh-lightbox-thumb& width=&1655& data-original=&/v2-aaef099e0f6cf7aaf9e5be6bb3b0bc27_r.png&&&i&FPGA 加速 Bing 的搜索排序过程。来源：[1]&/i&&br&&br&&img src=&/v2-8bd4abed27f2cbb8605f_b.png& data-rawwidth=&963& data-rawheight=&638& class=&origin_image zh-lightbox-thumb& width=&963& data-original=&/v2-8bd4abed27f2cbb8605f_r.png&&&i&FPGA 不仅降低了 Bing 搜索的延迟，还显著提高了延迟的稳定性。来源：[4]&/i&&br&&br&&img src=&/v2-bb29f3d4b687ce294b329c_b.png& data-rawwidth=&963& data-rawheight=&647& class=&origin_image zh-lightbox-thumb& width=&963& data-original=&/v2-bb29f3d4b687ce294b329c_r.png&&&br&&i&本地和远程的 FPGA 均可以降低搜索延迟，远程 FPGA 的通信延迟相比搜索延迟可忽略。&/i&&i&来源：[4]&/i&&br&&br&FPGA 在 Bing 的部署取得了成功，Catapult 项目继续在公司内扩张。微软内部拥有最多服务器的，就是云计算 Azure 部门了。Azure 部门急需解决的问题是网络和存储虚拟化带来的开销。Azure 把虚拟机卖给客户，需要给虚拟机的网络提供防火墙、负载均衡、隧道、NAT 等网络功能。由于云存储的物理存储跟计算节点是分离的，需要把数据从存储节点通过网络搬运过来，还要进行压缩和加密。&br&&br&在 1 Gbps 网络和机械硬盘的时代，网络和存储虚拟化的 CPU 开销不值一提。随着网络和存储速度越来越快，网络上了 40 Gbps，一块 SSD 的吞吐量也能到 1 GB/s，CPU 渐渐变得力不从心了。例如 Hyper-V 虚拟交换机只能处理 25 Gbps 左右的流量，不能达到 40 Gbps 线速，当数据包较小时性能更差；AES-256 加密和 SHA-1 签名，每个 CPU 核只能处理 100 MB/s，只是一块 SSD 吞吐量的十分之一。&br&&img src=&/v2-5aeb1ccedd0b0f00cd82_b.png& data-rawwidth=&1842& data-rawheight=&546& class=&origin_image zh-lightbox-thumb& width=&1842& data-original=&/v2-5aeb1ccedd0b0f00cd82_r.png&&&i&网络隧道协议、防火墙处理 40 Gbps 需要的 CPU 核数。来源：[5]&/i&&br&&br&&b&为了加速网络功能和存储虚拟化，微软把 FPGA 部署在网卡和交换机之间。&/b&如下图所示，每个 FPGA 有一个 4 GB DDR3-1333 DRAM，通过两个 PCIe Gen3 x8 接口连接到一个 CPU socket（物理上是 PCIe Gen3 x16 接口，因为 FPGA 没有 x16 的硬核，逻辑上当成两个 x8 的用）。物理网卡（NIC）就是普通的 40 Gbps 网卡，仅用于宿主机与网络之间的通信。&br&&br&&img src=&/v2-974dfbd7fc14f_b.png& data-rawwidth=&1265& data-rawheight=&625& class=&origin_image zh-lightbox-thumb& width=&1265& data-original=&/v2-974dfbd7fc14f_r.png&&&i&Azure 服务器部署 FPGA 的架构。来源：[6]&/i&&br&&br&FPGA（SmartNIC）对每个虚拟机虚拟出一块网卡，虚拟机通过 SR-IOV 直接访问这块虚拟网卡。原本在虚拟交换机里面的数据平面功能被移到了 FPGA 里面，虚拟机收发网络数据包均不需要 CPU 参与，也不需要经过物理网卡（NIC）。这样不仅节约了可用于出售的 CPU 资源，还&b&提高了虚拟机的网络性能（25 Gbps），把同数据中心虚拟机之间的网络延迟降低了 10 倍&/b&。&br&&br&&img src=&/v2-dad5b8d8d6ac0e047a016924_b.png& data-rawwidth=&2371& data-rawheight=&1316& class=&origin_image zh-lightbox-thumb& width=&2371& data-original=&/v2-dad5b8d8d6ac0e047a016924_r.png&&&i&网络虚拟化的加速架构。来源：[6]&/i&&br&&br&这就是微软部署 FPGA 的第三代架构，也是目前「每台服务器一块 FPGA」大规模部署所采用的架构。&b&FPGA 复用主机网络的初心是加速网络和存储，更深远的影响则是把 FPGA 之间的网络连接扩展到了整个数据中心的规模&/b&，做成真正 cloud-scale 的「超级计算机」。第二代架构里面，FPGA 之间的网络连接局限于同一个机架以内，FPGA 之间专网互联的方式很难扩大规模，通过 CPU 来转发则开销太高。&br&&br&第三代架构中，FPGA 之间通过 LTL (Lightweight Transport Layer) 通信。同一机架内延迟在 3 微秒以内；8 微秒以内可达 1000 块 FPGA；20 微秒可达同一数据中心的所有 FPGA。第二代架构尽管 8 台机器以内的延迟更低，但只能通过网络访问 48 块 FPGA。为了支持大范围的 FPGA 间通信，第三代架构中的 LTL 还支持 PFC 流控协议和 DCQCN 拥塞控制协议。&br&&br&&img src=&/v2-c1dbeccbb5_b.png& data-rawwidth=&2209& data-rawheight=&993& class=&origin_image zh-lightbox-thumb& width=&2209& data-original=&/v2-c1dbeccbb5_r.png&&&i&纵轴：LTL 的延迟，横轴：可达的 FPGA 数量。来源：[4]&/i&&br&&br&&img src=&/v2-7ce4e13c6a60fe7923ceb_b.png& data-rawwidth=&968& data-rawheight=&791& class=&origin_image zh-lightbox-thumb& width=&968& data-original=&/v2-7ce4e13c6a60fe7923ceb_r.png&&&i&FPGA 内的逻辑模块关系，其中每个 Role 是用户逻辑（如 DNN 加速、网络功能加速、加密），外面的部分负责各个 Role 之间的通信及 Role 与外设之间的通信。来源：[4]&/i&&br&&br&&img src=&/v2-b9d7f53b5125aecfd5d0b719b1a4179f_b.png& data-rawwidth=&1272& data-rawheight=&971& class=&origin_image zh-lightbox-thumb& width=&1272& data-original=&/v2-b9d7f53b5125aecfd5d0b719b1a4179f_r.png&&&i&FPGA 构成的数据中心加速平面，介于网络交换层（TOR、L1、L2）和传统服务器软件（CPU 上运行的软件）之间。来源：[4]&/i&&br&&br&&b&通过高带宽、低延迟的网络互联的 FPGA 构成了介于网络交换层和传统服务器软件之间的数据中心加速平面。&/b&除了每台提供云服务的服务器都需要的网络和存储虚拟化加速，FPGA 上的剩余资源还可以用来加速 Bing 搜索、深度神经网络（DNN）等计算任务。&br&&br&&b&对很多类型的应用，随着分布式 FPGA 加速器的规模扩大，其性能提升是超线性的。&/b&例如 CNN inference，当只用一块 FPGA 的时候，由于片上内存不足以放下整个模型，需要不断访问 DRAM 中的模型权重，性能瓶颈在 DRAM；如果 FPGA 的数量足够多，每块 FPGA 负责模型中的一层或者一层中的若干个特征，使得模型权重完全载入片上内存，就消除了 DRAM 的性能瓶颈，完全发挥出 FPGA 计算单元的性能。当然，拆得过细也会导致通信开销的增加。&b&把任务拆分到分布式 FPGA 集群的关键在于平衡计算和通信。&/b&&br&&br&&img src=&/v2-5a17afc6d68df612e27e2_b.png& data-rawwidth=&1827& data-rawheight=&394& class=&origin_image zh-lightbox-thumb& width=&1827& data-original=&/v2-5a17afc6d68df612e27e2_r.png&&&i&从神经网络模型到 HaaS 上的 FPGA。利用模型内的并行性，模型的不同层、不同特征映射到不同 FPGA。来源：[4]&/i&&br&&br&在 MICRO'16 会议上，微软提出了 &b&Hardware as a Service (HaaS)&/b& 的概念，即把硬件作为一种可调度的云服务，使得 FPGA 服务的集中调度、管理和大规模部署成为可能。&br&&br&&img src=&/v2-e87fddf2b776f27c0d37cba5a521beed_b.png& data-rawwidth=&1025& data-rawheight=&950& class=&origin_image zh-lightbox-thumb& width=&1025& data-original=&/v2-e87fddf2b776f27c0d37cba5a521beed_r.png&&&i&Hardware as a Service (HaaS)。来源：[4]&/i&&br&&br&从第一代装满 FPGA 的专用服务器集群，到第二代通过专网连接的 FPGA 加速卡集群，到目前复用数据中心网络的大规模 FPGA 云，三个思想指导我们的路线：&br&&ol&&li&&b&硬件和软件不是相互取代的关系，而是合作的关系；&/b&&/li&&li&&b&必须具备灵活性，即用软件定义的能力；&/b&&/li&&li&&b&必须具备可扩放性（scalability）。&/b&&/li&&/ol&&br&&br&&b&三、FPGA 在云计算中的角色&br&&/b&&br&最后谈一点我个人对 FPGA 在云计算中角色的思考。作为三年级博士生，我在微软亚洲研究院的研究试图回答两个问题：&br&&ol&&li&FPGA 在云规模的网络互连系统中应当充当怎样的角色？&/li&&li&如何高效、可扩放地对 FPGA + CPU 的异构系统进行编程？&/li&&/ol&&br&我对 FPGA 业界主要的遗憾是，FPGA 在数据中心的主流用法，从除微软外的互联网巨头，到两大 FPGA 厂商，再到学术界，大多是把 FPGA 当作跟 GPU 一样的计算密集型任务的加速卡。然而 FPGA 真的很适合做 GPU 的事情吗？前面讲过，&b&FPGA 和 GPU 最大的区别在于体系结构，FPGA 更适合做需要低延迟的流式处理，GPU 更适合做大批量同构数据的处理。&/b&&br&&br&由于很多人打算把 FPGA 当作计算加速卡来用，两大 FPGA 厂商推出的高层次编程模型也是基于 OpenCL，模仿 GPU 基于共享内存的批处理模式。CPU 要交给 FPGA 做一件事，需要先放进 FPGA 板上的 DRAM，然后告诉 FPGA 开始执行，FPGA 把执行结果放回 DRAM，再通知 CPU 去取回。&b&CPU 和 FPGA 之间本来可以通过 PCIe 高效通信，为什么要到板上的 DRAM 绕一圈？&/b&也许是工程实现的问题，我们发现通过 OpenCL 写 DRAM、启动 kernel、读 DRAM 一个来回，需要 1.8 毫秒。而通过 PCIe DMA 来通信，却只要 1~2 微秒。&br&&br&&img src=&/v2-ade077e9ffe5e9babeb857_b.png& data-rawwidth=&1761& data-rawheight=&647& class=&origin_image zh-lightbox-thumb& width=&1761& data-original=&/v2-ade077e9ffe5e9babeb857_r.png&&&i&PCIe I/O channel 与 OpenCL 的性能比较。纵坐标为对数坐标。来源：[5]&/i&&br&&br&OpenCL 里面多个 kernel 之间的通信就更夸张了，默认的方式也是通过共享内存。本文开篇就讲，FPGA 比 CPU 和 GPU 能效高，体系结构上的根本优势是无指令、无需共享内存。使用共享内存在多个 kernel 之间通信，在顺序通信（FIFO）的情况下是毫无必要的。况且 FPGA 上的 DRAM 一般比 GPU 上的 DRAM 慢很多。&br&&br&因此我们提出了 ClickNP 网络编程框架 [5]，&b&使用管道（channel）而非共享内存来在执行单元（element/kernel）间、执行单元和主机软件间进行通信&/b&。需要共享内存的应用，也可以在管道的基础上实现，毕竟 CSP（Communicating Sequential Process）和共享内存理论上是等价的嘛。ClickNP 目前还是在 OpenCL 基础上的一个框架，受到 C 语言描述硬件的局限性（当然 HLS 比 Verilog 的开发效率确实高多了）。理想的硬件描述语言，大概不会是 C 语言吧。&br&&br&&img src=&/v2-f0af9adc093_b.png& data-rawwidth=&1647& data-rawheight=&618& class=&origin_image zh-lightbox-thumb& width=&1647& data-original=&/v2-f0af9adc093_r.png&&&i&ClickNP 使用 channel 在 elements 间通信，来源：[5]&/i&&br&&br&&img src=&/v2-e6ca6cdab83c_b.png& data-rawwidth=&1585& data-rawheight=&359& class=&origin_image zh-lightbox-thumb& width=&1585& data-original=&/v2-e6ca6cdab83c_r.png&&&i&ClickNP 使用 channel 在 FPGA 和 CPU 间通信，来源：[5]&/i&&br&&br&低延迟的流式处理，需要最多的地方就是通信。然而 &b&CPU 由于并行性的限制和操作系统的调度，做通信效率不高，延迟也不稳定&/b&。此外，&b&通信就必然涉及到调度和仲裁&/b&，CPU 由于单核性能的局限和核间通信的低效，调度、仲裁性能受限，硬件则很适合做这种重复工作。因此我的博士研究把 FPGA 定义为通信的「大管家」，不管是服务器跟服务器之间的通信，虚拟机跟虚拟机之间的通信，进程跟进程之间的通信，CPU 跟存储设备之间的通信，都可以用 FPGA 来加速。&br&&br&成也萧何，败也萧何。缺少指令同时是 FPGA 的优势和软肋。每做一点不同的事情，就要占用一定的 FPGA 逻辑资源。如果要做的事情复杂、重复性不强，就会占用大量的逻辑资源，其中的大部分处于闲置状态。这时就不如用冯·诺依曼结构的处理器。数据中心里的很多任务有很强的局部性和重复性：&b&一部分是虚拟化平台需要做的网络和存储，这些都属于通信；另一部分是客户计算任务里的，比如机器学习、加密解密&/b&。我们首先把 FPGA 用于它最擅长的通信，日后也许也会像 AWS 那样把 FPGA 作为计算加速卡租给客户。&br&&br&不管通信还是机器学习、加密解密，算法都是很复杂的，如果试图用 FPGA 完全取代 CPU，势必会带来 FPGA 逻辑资源极大的浪费，也会提高 FPGA 程序的开发成本。更实用的做法是 &b&FPGA 和 CPU 协同工作，局部性和重复性强的归 FPGA，复杂的归 CPU。&/b&&br&&br&当我们用 FPGA 加速了 Bing 搜索、深度学习等越来越多的服务；当网络虚拟化、存储虚拟化等基础组件的数据平面被 FPGA 把持；当 FPGA 组成的「数据中心加速平面」成为网络和服务器之间的天堑……似乎有种感觉，FPGA 将掌控全局，CPU 上的计算任务反而变得碎片化，受 FPGA 的驱使。以往我们是 CPU 为主，把重复的计算任务卸载（offload）到 FPGA 上；以后会不会变成 FPGA 为主，把复杂的计算任务卸载到 CPU 上呢？随着 Xeon + FPGA 的问世，古老的 SoC 会不会在数据中心焕发新生？&br&&br&「跨越内存墙，走向可编程世界」&i&(&/i&&i&Across the memory wall and reach a fully programmable world.&/i&)&br&&br&&b&参考文献：&/b&&br&[1] Large-Scale Reconfigurable Computing in a Microsoft Datacenter &a href=&///?target=https%3A///en-us/research/wp-content/uploads/2014/06/HC26.12.520-Recon-Fabric-Pulnam-Microsoft-Catapult.pdf& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&https://www.&/span&&span class=&visible&&/en-us/res&/span&&span class=&invisible&&earch/wp-content/uploads/2014/06/HC26.12.520-Recon-Fabric-Pulnam-Microsoft-Catapult.pdf&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&&br&[2] A Reconfigurable Fabric for Accelerating Large-Scale Datacenter Services, ISCA'14 &a href=&///?target=https%3A///en-us/research/wp-content/uploads/2016/02/Catapult_ISCA_2014.pdf& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&https://www.&/span&&span class=&visible&&/en-us/res&/span&&span class=&invisible&&earch/wp-content/uploads/2016/02/Catapult_ISCA_2014.pdf&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&&br&[3] &a href=&///?target=https%3A///2016/09/microsoft-bets-future-chip-reprogram-fly/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Microsoft Has a Whole New Kind of Computer Chip—and It’ll Change Everything&i class=&icon-external&&&/i&&/a&&br&[4] A Cloud-Scale Acceleration Architecture, MICRO'16 &a href=&///?target=https%3A///en-us/research/wp-content/uploads/2016/10/Cloud-Scale-Acceleration-Architecture.pdf& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&https://www.&/span&&span class=&visible&&/en-us/res&/span&&span class=&invisible&&earch/wp-content/uploads/2016/10/Cloud-Scale-Acceleration-Architecture.pdf&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&&br&[5] &a href=&///?target=https%3A///en-us/research/publication/clicknp-highly-flexible-high-performance-network-processing-reconfigurable-hardware/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&ClickNP: Highly Flexible and High-performance Network Processing with Reconfigurable Hardware - Microsoft Research&i class=&icon-external&&&/i&&/a&&br&[6] Daniel Firestone, SmartNIC: Accelerating Azure's Network with. FPGAs on OCS servers.
利益相关：微软亚洲研究院实习生，研究方向是 FPGA 在数据中心的应用。问题「用 FPGA 代替 CPU」中，这个「代替」的说法不准确。我们并不是不用 CPU 了，而是用 FPGA 加速适合它的计算任务，其他任务仍然在 CPU 上完成，让 FPGA 和 CPU 协同工作。本回答…
&p&&b&【多图预警】本文包含48款手机资费的详情截图介绍，建议在wifi下观看。&/b&&/p&&p&&b&第一部分
总览&/b&&/p&&p&首先上一张资费对比简表（6月15日更新）：&/p&&img src=&/v2-df790cd55383_b.png& data-rawwidth=&826& data-rawheight=&2530& class=&origin_image zh-lightbox-thumb& width=&826& data-original=&/v2-df790cd55383_r.png&&&br&&p&&b&第二部分
更新记录&/b&&/p&&p&&b&【6月21日更新：浦发银行推出大小发卡，资费与招商银行大小招卡一致，同样每月36元，小发卡仅相当于升级前的大宝卡】&/b&&/p&&img src=&/v2-34af9585b3cac6ff0778d_b.jpg& data-rawwidth=&1080& data-rawheight=&1823& class=&origin_image zh-lightbox-thumb& width=&1080& data-original=&/v2-34af9585b3cac6ff0778d_r.jpg&&&br&&p&&b&【6月17日更新：&/b&斗鱼直播和熊猫直播相继纳入腾讯王卡（不含小王卡）的免流范围。同时，通过这两家直播APP也能申请腾讯王卡了】（感谢知友deadpool、仇祥宇提供消息）&/p&&img src=&/v2-ec9b99cac267b7edd762b566d7951d9d_b.jpg& data-rawwidth=&1080& data-rawheight=&1038& class=&origin_image zh-lightbox-thumb& width=&1080& data-original=&/v2-ec9b99cac267b7edd762b566d7951d9d_r.jpg&&&br&&img src=&/v2-79fd5956cbe_b.jpg& data-rawwidth=&1080& data-rawheight=&182& class=&origin_image zh-lightbox-thumb& width=&1080& data-original=&/v2-79fd5956cbe_r.jpg&&&br&&img src=&/v2-0ba68c4ac584db1f2ceca726eb192d9b_b.jpg& data-rawwidth=&600& data-rawheight=&935& class=&origin_image zh-lightbox-thumb& width=&600& data-original=&/v2-0ba68c4ac584db1f2ceca726eb192d9b_r.jpg&&&p&&b&【6月13日更新：&/b&联通与花椒直播合作推出“小花椒卡”、“大花椒卡”，小花椒卡29元全国2GB，大花椒卡59元4GB+200分钟，超出后省内日租1元500MB、&b&省外日租1元100MB&/b&（有新意）。详情见本文最后】 &/p&&p&&b&【6月12日更新：&/b&联通与同花顺合作推出“小顺卡”、“大顺卡”和“天顺卡”，小顺卡28元全国2GB，大顺卡58元3GB+300分钟，天顺卡118元8GB+800分钟】&/p&&p&&b&【6月12日更新：&/b&蚂蚁小宝卡停售，升级推出小宝+卡。类似京东小强卡，同为月租16元含全国1GB，超出后15元/GB，但全国拨打0.1元比小强卡便宜】&/p&&img src=&/v2-7cff49ed33ce6b5820aa07_b.jpg& data-rawwidth=&720& data-rawheight=&1194& class=&origin_image zh-lightbox-thumb& width=&720& data-original=&/v2-7cff49ed33ce6b5820aa07_r.jpg&&&br&&img src=&/v2-e645ce67aece7d5a9ee492e_b.png& data-rawwidth=&720& data-rawheight=&1160& class=&origin_image zh-lightbox-thumb& width=&720& data-original=&/v2-e645ce67aece7d5a9ee492e_r.png&&&p&&b&【6月7日更新：&/b& 美团推出“大美卡”和“小美卡” ，除了美团APP绑定银行卡支付每笔赠送50MB外，其他资费标准与招商银行大小招卡完全一样。介绍见本文末尾】
&/p&&p&&b&【6月6日更新：&/b& 小米商城(&a href=&///?target=http%3A///& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&/&/span&&span class=&invisible&&&/span&&i class=&icon-external&&&/i&&/a& )今天已正式发售米粉卡，包括电信版的1元日租卡、3元不限量日租卡，以及联通版的29元月租卡和59元月租卡（就是原先说的“米粉卡“和“米粉金卡”）。北京地区电信米粉卡号码有173和177号段，联通版均为176号段。资费标准见本文末尾】 &/p&&img src=&/v2-cd6a42f309bdaf1adfb47ebe_b.jpg& data-rawwidth=&720& data-rawheight=&360& class=&origin_image zh-lightbox-thumb& width=&720& data-original=&/v2-cd6a42f309bdaf1adfb47ebe_r.jpg&&&br&&img src=&/v2-61194cedbbaeb_b.jpg& data-rawwidth=&720& data-rawheight=&360& class=&origin_image zh-lightbox-thumb& width=&720& data-original=&/v2-61194cedbbaeb_r.jpg&&&p&&b&【6月3日更新：联通推出优酷土豆大小酷卡，小酷卡月租9元赶超腾讯小王卡，大酷卡月租29元2GB，两者都有省外日租包！&/b&&a href=&///?target=https%3A///queen/youkucard/youku.html& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&https://&/span&&span class=&visible&&/queen/youku&/span&&span class=&invisible&&card/youku.html&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&
感谢知友“陈昕雨”的消息。可惜很快链接页面已显示“本轮活动已结束”。期待早日正式发售吧】&/p&&img src=&/v2-e472e6dbcfae4e0_b.jpg& data-rawwidth=&1080& data-rawheight=&2154& class=&origin_image zh-lightbox-thumb& width=&1080& data-original=&/v2-e472e6dbcfae4e0_r.jpg&&&p&&b&【5月23日更新：腾讯王卡/蚂蚁宝卡套餐免费升级！大王卡1元全国日租包/大宝卡加量不加价：&/b&腾讯大王卡/天王卡以及蚂蚁大宝卡的老用户（激活开通6个月以上）可申请。腾讯大王卡/天王卡的日租包由原来&b&“省内1元500MB/省外2元500MB“&/b&升级为&b&”全国1元500MB“&/b&，而大宝卡的套内全国流量和全国通话时长则由&b&“2GB+100分钟”&/b&升级为&b&“2.5GB+150分钟”。&/b& 申请链接：&a href=&///?target=http%3A///qAasH& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&/qAasH&/span&&span class=&invisible&&&/span&&i class=&icon-external&&&/i&&/a& （用联通手机营业厅APP打开）。详见截图（转自威锋网论坛），作者： &a href=&///?target=https%3A///home.php%3Fmod%3Dspace%26uid%3D& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&老北京冰糖葫芦&i class=&icon-external&&&/i&&/a& &b&】&/b& &/p&&img src=&/v2-ffbb5e3de1de_b.jpg& data-rawwidth=&402& data-rawheight=&1024& class=&content_image& width=&402&&&br&&img src=&/v2-e3f045711baa237022cdffc_b.jpg& data-rawwidth=&394& data-rawheight=&1024& class=&content_image& width=&394&&&br&&p&&b&【以往更新：&/b&5月16日补充今日头条懂我卡、懂我卡Plus；5月10日补充小米米粉卡、饿了么大小饿卡；京东5.14推出大小强卡（多为185号段！更适于打电话），联通集齐王、宝、强卡；5月9日补充百度女神卡、滴滴大小橙卡、招联金融招联牛卡，增设对比简表；5月2日推荐&b&北京联通自己的流量小王卡&/b&，不是腾讯那个。&b&5月31日前激活优惠力度很大，每月只需25元，一共有300分钟拨打、4.1GB流量！&/b&头三个月每月另送3GB的4G专网本地流量&b&】&/b&&/p&&p&扩展阅读&/p&&p&手机支持电信的童鞋可关注：&a href=&/p/& class=&internal&&中国电信连发5款互联网定制卡 - 知乎专栏&/a& ；&/p&&p&北京本地的童鞋可关注：&a href=&/question//answer/& class=&internal&&北京性价比流量卡推荐? - 知乎&/a&&/p&&p&= = = = = = = = = = = = = = =&/p&&br&&p&&b&第三部分
个人推荐：&/b&&/p&&p&&b&1.北京本地大流量使用：北京联通日租卡&/b&，月租低（5元），日租1元本地500MB（超出自动叠加），每月36元最多能用15.5GB，上不封顶。如果常用腾讯视频，&b&腾讯视频小王卡&/b&也不错，月租9元，观看腾讯视频全国免流量（广告/图片/文字不免），同样日租1元本地500MB，不过月封顶40GB。可惜小王卡已停售，如果手机支持全网通且通话主号不是电信号码，可以申请&b&电信酷视卡&/b&，月租也是9元，优酷土豆省内免流，其他资费高度类似小王卡。&/p&&p&&b&2.漫游较多的小流量使用：新浪V+卡&/b&，月租19元，含1GB全国流量，超出后12元1GB全国流量。门槛较大宝卡低，月用量4GB以内时总开销低于大宝卡。&/p&&p&&b&3.大小用量、本地漫游较为均衡的选择：哔哩哔哩【22卡】。该卡现已在哔哩哔哩APP中再次开放申请！&/b&月租22元，含1GB全国流量，超出后省内1元500MB/天、省外2元500MB/天。除了在本地持续大流量使用情况下，月消费高于北京联通日租卡和小王卡外，其他情况下都很有竞争力。22卡同时具有小流量使用固定费用低、大流量使用有保障、省内省外均适用的特点，在各应用场景下资费比较均衡灵活。再加上观看B站免流，很具性价比。 &/p&&p&= = = = = = = = = = = = = = &/p&&br&&p&&b&第四部分资费详情介绍&/b&&/p&&p&先回顾一下上线初期的【腾讯小王卡（视频小王卡为例）、大王卡】资费吧，当时大王卡还没有省外日租包，而且微信/QQ的视频和语音聊天都不能免流。而视频小王卡因为月租低、流量大、而且已经免了最大头的腾讯视频的流量费，颇受追捧。然而王卡日租包的形式，使得月总开销并不低（小王39元起、大王49元起）。&/p&&img src=&/v2-c66f6b26ddf34bd942c361b26c6de487_b.jpg& data-rawwidth=&1080& data-rawheight=&1514& class=&origin_image zh-lightbox-thumb& width=&1080& data-original=&/v2-c66f6b26ddf34bd942c361b26c6de487_r.jpg&&&br&&img src=&/v2-893cc1c371e97a9aaf0fe_b.jpg& data-rawwidth=&1080& data-rawheight=&1167& class=&origin_image zh-lightbox-thumb& width=&1080& data-original=&/v2-893cc1c371e97a9aaf0fe_r.jpg&&&br&&p&这是2017年3月末的【腾讯大王卡、天王卡】资费。大王卡补充了省外日租包，也终于实现了微信/QQ的视频/语音聊天免流量。而小王卡已悄然停办，存量小王卡并没有补充省外日租包，用户开始被官微“王卡助手”不时“劝诱”升级大王卡。&/p&&img src=&/v2-b2ef1ddf1c03b_b.jpg& data-rawwidth=&1080& data-rawheight=&1336& class=&origin_image zh-lightbox-thumb& width=&1080& data-original=&/v2-b2ef1ddf1c03b_r.jpg&&&p&【蚂蚁大宝卡、小宝卡】，以全国流量见长，适合中小流量和有漫游需求的用户。&/p&&img src=&/v2-eb61c0cd3fab7ec0f686c5_b.jpg& data-rawwidth=&1080& data-rawheight=&1354& class=&origin_image zh-lightbox-thumb& width=&1080& data-original=&/v2-eb61c0cd3fab7ec0f686c5_r.jpg&&&br&&p&联通与京东将于日首发【京东大强卡、小强卡】，联通终于集齐了王·宝·强卡。京东小强卡拉低了全国1GB的门槛，但超出后每GB 15元，台阶较高，月用2GB以上则不如微博V+卡；大强卡资费与下文的滴滴小橙卡和淘宝畅淘卡基本一致，购物送流量稍有优势。&/p&&img src=&/v2-7fadbdde648fc88a9b2aa53760ff9cfb_b.jpg& data-rawwidth=&1080& data-rawheight=&1014& class=&origin_image zh-lightbox-thumb& width=&1080& data-original=&/v2-7fadbdde648fc88a9b2aa53760ff9cfb_r.jpg&&&img src=&/v2-55dbeb1d6df194a798aac_b.jpg& data-rawwidth=&1080& data-rawheight=&808& class=&origin_image zh-lightbox-thumb& width=&1080& data-original=&/v2-55dbeb1d6df194a798aac_r.jpg&&&br&&br&&p&百度【女神卡、大神卡、小神卡】，话说大神卡这月租都可以办联通无限流量和通话的冰淇淋套餐了。小神卡则相当于在蚂蚁大宝卡和小宝卡的资费间折中了一下。女神卡则主要在通话方面有一定优势。&/p&&img src=&/v2-97e0c2789c02abd6c70a3_b.jpg& data-rawwidth=&1080& data-rawheight=&2672& class=&origin_image zh-lightbox-thumb& width=&1080& data-original=&/v2-97e0c2789c02abd6c70a3_r.jpg&&&p&还有和招商银行合作的【大招卡、小招卡】。小招卡≈大宝卡，大招卡通话量较多，可惜这些合作卡号段都不太好（176等），通话用不是很适合。&/p&&img src=&/v2-814ccdd2d0ba637debcb20e_b.jpg& data-rawwidth=&1080& data-rawheight=&1592& class=&origin_image zh-lightbox-thumb& width=&1080& data-original=&/v2-814ccdd2d0ba637debcb20e_r.jpg&&&p&与&b&新浪&/b&合作的&b&【微博V卡、大V卡】&/b&，以下是上线初期的产品线，其中V卡相当于缩水的小王卡，大V卡相当于加量加价的大宝卡，性价比都不高。 &/p&&img src=&/v2-32fbf9ba8d63b5e50c84c_b.jpg& data-rawwidth=&1080& data-rawheight=&1770& class=&origin_image zh-lightbox-thumb& width=&1080& data-original=&/v2-32fbf9ba8d63b5e50c84c_r.jpg&&&p&近日，新浪微博V卡已悄然停售，取而代之的是&b&【V+卡】&/b&，19元全国1GB、超出后12元1GB的价格政策，与大宝卡相比门槛较低，在月用量不超过5GB时V+卡更实惠。百度小神卡更是被V+卡秒杀（如果不用来打电话）。新推出的&b&【金V卡】&/b&定价很高，不如直接办联通自己全国不限流量和通话量的冰淇凌套餐了。 &/p&&img src=&/v2-9df8d13fb2b9ad_b.jpg& data-rawwidth=&1080& data-rawheight=&2611& class=&origin_image zh-lightbox-thumb& width=&1080& data-original=&/v2-9df8d13fb2b9ad_r.jpg&&&p&继蚂蚁宝卡，淘宝也另推出了【畅淘卡】，与微博大V卡一样3GB全国+300分钟，便宜13元，明显更值一些。&/p&&img src=&/v2-63e14e8e47cd9b880d579e8eae85b247_b.jpg& data-rawwidth=&1080& data-rawheight=&1071& class=&origin_image zh-lightbox-thumb& width=&1080& data-original=&/v2-63e14e8e47cd9b880d579e8eae85b247_r.jpg&&&p&与映客直播合作的【大小映卡】，糅合了宝卡的套内全国流量和王卡的日租包，但定价稍高，又没有免流量应用，反响不大。&/p&&img src=&/v2-2763eef8b27ad4d6e5dfd2_b.jpg& data-rawwidth=&1080& data-rawheight=&1700& class=&origin_image zh-lightbox-thumb& width=&1080& data-original=&/v2-2763eef8b27ad4d6e5dfd2_r.jpg&&&br&&p&与【哔哩哔哩】合作的【22卡、33卡和小电视卡】，同样糅合宝卡的套内全国流量和王卡的日租包，其中22卡因为门槛低，灵活性高，既可以节省使用套内流量，也可以用完使用日租包，漫游也不发愁，性价比凸显。加上哔哩哔哩免流，这3种卡凭借B站人气，4月1日公测一天抢空。&b&4月11日起再次开放申请了（不过公测期间的分两个月加赠2GB全国流量的优惠没有了）。&/b&&/p&&img src=&/v2-a613fac24d0bec2ea8c7c82_b.jpg& data-rawwidth=&1080& data-rawheight=&1067& class=&origin_image zh-lightbox-thumb& width=&1080& data-original=&/v2-a613fac24d0bec2ea8c7c82_r.jpg&&&br&&img src=&/v2-472e4ed50ae23af70c03d539_b.jpg& data-rawwidth=&1080& data-rawheight=&1141& class=&origin_image zh-lightbox-thumb& width=&1080& data-original=&/v2-472e4ed50ae23af70c03d539_r.jpg&&&br&&p&其实联通与互联网企业合作推手机卡，可能还是这个比较早：【滴滴王卡】，但是要在滴滴司机端软件里申请，受众面比较窄。倒是适合通话量大的用户。（图片来自网络）&/p&&img src=&/v2-ab31a2ecb20cf1dfa0bdcf_b.jpg& data-rawwidth=&500& data-rawheight=&889& class=&origin_image zh-lightbox-thumb& width=&500& data-original=&/v2-ab31a2ecb20cf1dfa0bdcf_r.jpg&&&br&&p&此后，联通与滴滴出行面向乘客，又推出了大小橙卡，套内流量改为全部是全国流量，但套内语音通话量有所减少。&/p&&img src=&/v2-6f3fc9f794f36d5b131e2a1760ac48ac_b.png& data-rawwidth=&1080& data-rawheight=&1920& class=&origin_image zh-lightbox-thumb& width=&1080& data-original=&/v2-6f3fc9f794f36d5b131e2a1760ac48ac_r.png&&&br&&p&联通最新与招联金融推出了招联牛卡，相当于蚂蚁大宝卡增加50分钟通话，贵了3元：&/p&&img src=&/v2-7b27ccd82d9772bad4b91fb9cd76e672_b.jpg& data-rawwidth=&1080& data-rawheight=&1287& class=&origin_image zh-lightbox-thumb& width=&1080& data-original=&/v2-7b27ccd82d9772bad4b91fb9cd76e672_r.jpg&&&img src=&/v2-518ecd371a6cdfc_b.jpg& data-rawwidth=&750& data-rawheight=&930& class=&origin_image zh-lightbox-thumb& width=&750& data-original=&/v2-518ecd371a6cdfc_r.jpg&&&p&联通可能最近是真饿了，还跟饿了么外卖合作推出了【大饿卡、小饿卡】，但月费均相对较高，不够灵活。（原谅下图的渣画质，我实在不想再多注册一个APP了）&/p&&img src=&/v2-f04a07fa38d3f0362a14_b.jpg& data-rawwidth=&340& data-rawheight=&574& class=&content_image& width=&340&&&p&最近联通又和美团点评推出了【大美卡】【小美卡】，除了增加美团APP绑定银行卡支付每笔赠送50MB全国流量的优惠（每月最多送10次）外，资费标准与招商银行大小招卡完全一样。申请链接：小美卡[&a href=&///?target=https%3A///queen/meituan/fill.html%3Fproduct%3D1& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&资料填写&i class=&icon-external&&&/i&&/a&]，大美卡[&a href=&///?target=https%3A///queen/meituan/fill.html%3Fproduct%3D0& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&资料填写&i class=&icon-external&&&/i&&/a&] &/p&&img src=&/v2-5bde0eb9a7c4a930b78e031be655005b_b.jpg& data-rawwidth=&1080& data-rawheight=&2082& class=&origin_image zh-lightbox-thumb& width=&1080& data-original=&/v2-5bde0eb9a7c4a930b78e031be655005b_r.jpg&&&p&今日头条在与电信合作推出头条“关心卡”的同时，又与联通合作退出了【懂我卡】和【懂我卡Plus】，资费与小米的联通版“米粉卡”“米粉金卡”很类似。&/p&&img src=&/v2-2fe5ce415cda_b.jpg& data-rawwidth=&1080& data-rawheight=&1640& class=&origin_image zh-lightbox-thumb& width=&1080& data-original=&/v2-2fe5ce415cda_r.jpg&&&p&5月11日媒体刚报道了电信将与小米推出无限流量的“米粉卡”，13日就收到了知友&a href=&/people/tang-tang-89-4-84& class=&internal&&deadpool&/a&发来的联通&b&【米粉卡、米粉金卡】&/b&爆料。6月6日，上述资费最终以&b&【米粉卡月租卡】&/b&的名义在小米商城（&a href=&///?target=http%3A///& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&/&/span&&span class=&invisible&&&/span&&i class=&icon-external&&&/i&&/a& ）发售。【&b&29元月租卡】&/b&相当于蚂蚁大宝卡去掉100分钟通话，把2GB起步、套外10元/GB的价格从36元下拉到29元；【&b&59元月租卡】&/b&内容类似哔哩哔哩66卡，不过套外不是日租包，价格从66元下降到59元。不同于腾讯王卡/微博V卡/哔哩哔哩卡等直接免流量，&b&米粉卡月租卡是在MIUI内（就是仅限小米手机享受）用小米系列APP产生多少流量，下月返同等流量&/b&。这种方式可能会在当月产生较高费用，而下月流量又不一定用得完（虽然返的流量不限小米APP使用），&b&别说跟免流比，其实连买一送一都不如，只能算是返券（限次月使用）。&/b& &/p&&img src=&/v2-28a3513eee1d99a726a5c63ce5b149e6_b.jpg& data-rawwidth=&1080& data-rawheight=&2714& class=&origin_image zh-lightbox-thumb& width=&1080& data-original=&/v2-28a3513eee1d99a726a5c63ce5b149e6_r.jpg&&&p&这里拓展介绍一下电信版的“米粉卡日租卡”：电信版“米粉卡”分为&b&【不限量日租卡】&/b&与&b&【1元日租卡】&/b&。其中&b&【不限量日租卡】&/b&月费5元，省内流量为3元/天，当天不使用不收费，当天无论用多少流量都收费3元（当月上网流量累计达到40GB之后，上网速率降至3.1Mbps以下，累计达到100GB后上网速率降至128Kbps，次月恢复），通话费用0.1元/分钟，短信0.1元/条；&b&【1元日租卡】&/b&月费5元，省内流量每天1元500MB，超过后自动叠加。通话费用0.1元/分钟，短信0.1元/条。&b&两者国内漫游流量费用为15元/GB，当月有效。这点上1元日租卡优于联通的腾讯小王卡，起码出省多少有的用了。 &/b& &/p&&img src=&/v2-6e3db1102cad1d414e63e_b.jpg& data-rawwidth=&1080& data-rawheight=&2935& class=&origin_image zh-lightbox-thumb& width=&1080& data-original=&/v2-6e3db1102cad1d414e63e_r.jpg&&&p&最近，联通又与同花顺合作推出了【小顺卡】【大顺卡】【天顺卡】，只能说联通玩得越来越6了。小顺卡把全国2GB的月租拉到28元的新低。大顺卡比等量的套餐贵了2元，天顺卡则以合理价格提供了较高的通话量。&/p&&img src=&/v2-a793d10f7304c6cecf359_b.jpg& data-rawwidth=&1080& data-rawheight=&2412& class=&origin_image zh-lightbox-thumb& width=&1080& data-original=&/v2-a793d10f7304c6cecf359_r.jpg&&&br&&p&6月13日，联通与花椒直播合作的【小花椒卡】【大花椒卡】发售。比较有新意的是省外1元&b&100MB&/b&日租包，相对于2元500MB省外日租包虽然单日流量下降，但对大多数人来说其实更灵活经济。另外，入网头6个月每月送1GB全国流量，也是很划算的。 &/p&&img src=&/v2-cb890a6e52e82bfc8d69e5056fdac449_b.jpg& data-rawwidth=&1080& data-rawheight=&2050& class=&origin_image zh-lightbox-thumb& width=&1080& data-original=&/v2-cb890a6e52e82bfc8d69e5056fdac449_r.jpg&&&br&&p&= = = = = = = =&/p&&p&以上都是联通合作的全国性资费，其实&b&北京联通&/b&自己的&b&【日租卡】&/b&（每天1元500MB的本地日租包与小王卡很类似）也很有优势，一是最低消费低，月租仅5元，无需来电显示费；二是相比大小王卡等40GB封顶的当月流量上限，日租卡流量上不封顶；三是如果有通话需求，讲究号码的话，131、132的号段相比上述合作卡以176为主的号段，不容易被当作骚扰电话。不过日租卡漫游流量0.27元/MB，明显贵一些。&/p&&img src=&/v2-0cdef6d154754faf4b877a9d5b46053b_b.png& data-rawwidth=&1080& data-rawheight=&1646& class=&origin_image zh-lightbox-thumb& width=&1080& data-original=&/v2-0cdef6d154754faf4b877a9d5b46053b_r.png&&&br&&p&实在忍不住再偏个楼，推荐【&b&北京联通流量小王卡】&/b&，不是腾讯那个，是北京联通自己的。&b&5月31日前优惠力度很大：&/b&&/p&&p&套餐月费25元，内容有：(1)含国内拨打100分钟、本地1GB、国内100MB，全国免费接听；(2)如果号码带4，则每月再送本地1GB。&b&(3)5月31日前激活&/b&，还会长期赠送国内拨打200分钟、本地2GB。这样（带4的号码）&b&每月只需25元，一共有300分钟拨打、4.1GB流量！在本地中等流量使用，比腾讯小王卡（每天使用、无论用多少的情况下）每月36元的固定消费合算&/b&(4)目前激活还送3个月每月3GB的4G专网本地流量!(5)首次充值满100元，加赠100元话费！分10个月赠送，每月10元。&/p&&p&另有【&b&北京联通流量大王卡】&/b&，套餐月费50元，套内300分钟国内拨打、本地3.5GB、国内500MB，带4号码赠本地1GB、&b&5月31日前激活&/b&会长期赠送国内拨打300分钟、本地3GB，这样（带4的号码）&b&每月只需50元，一共有600分钟拨打、8GB流量！另有2GB闲时流量。&/b&同样送3个月每月3GB的4G专网本地流量，同样首充100送100。&/p&&br&&img src=&/v2-c1bc3ce08dfe1bf3c49d37d52f50ecdb_b.jpg& data-rawwidth=&600& data-rawheight=&271& class=&origin_image zh-lightbox-thumb& width=&600& data-original=&/v2-c1bc3ce08dfe1bf3c49d37d52f50ecdb_r.jpg&&&br&&img src=&/v2-824d150a470fe4c2a25eae_b.jpg& data-rawwidth=&2276& data-rawheight=&1280& class=&origin_image zh-lightbox-thumb& width=&2276& data-original=&/v2-824d150a470fe4c2a25eae_r.jpg&&&br&&p&此外，除了联通与互联网企业合作，&b&电信&/b&现在也推出了类似的套餐，比如&b&与优酷土豆合作的【酷视卡】&/b&。资费高度类似联通的腾讯小王卡（已停办），同样9元月租、每天1元500M省内日租包、国内流量单价和语音、短信资费也都一模一样，只是把腾讯视频免流量改成了优酷视频及土豆视频免流。但逊于小王卡的是，免流使用范围限于省内，而小王卡则在省外漫游时也对腾讯视频免流。&b&而且电信卡有一个先天劣势：即使最新的全网通双卡手机，目前也还没有完美支持双电信卡同时待机的。因此如果通话主卡为电信卡，流量副卡反而不能选择电信卡；还有一点：电信的预付费卡均不支持国际漫游，如果在作流量卡之余，还想用于银行、网站等绑定的话，在国外是无法接收验证码的（联通手机卡均可）。&/b&&/p&&img src=&/v2-658e5ccd292be0ca53524_b.jpg& data-rawwidth=&1080& data-rawheight=&1738& class=&origin_image zh-lightbox-thumb& width=&1080& data-original=&/v2-658e5ccd292be0ca53524_r.jpg&&&br&&p&【完】【不定期更新】&/p&
【多图预警】本文包含48款手机资费的详情截图介绍，建议在wifi下观看。第一部分总览首先上一张资费对比简表（6月15日更新）：第二部分更新记录【6月21日更新：浦发银行推出大小发卡，资费与招商银行大小招卡一致，同样每月36元，小发卡仅相当于升级前的…
已有帐号？
无法登录？
社交帐号登录

如何亚马逊星级评价算法阿里巴巴的盖昆的算法LS-MLR

我要回帖

更多关于评价算法的文章

随机推荐

如何亚马逊星级评价算法阿里巴巴的盖昆的算法LS-MLR

我要回帖

更多关于 评价算法 的文章

随机推荐

更多关于评价算法的文章