关于风控员主要是干嘛的交流

一方面随着近年来通信技术的不斷发展黑产大行其道,银行业外部监管压力日益增加内部风控要求也不断加强。另一方面银行账务交易数据呈现爆发式的增长,这對数据的处理和分析能力提出了更高的要求在这种新形势下,要求银行必须积极探索和使用新的理论技术解决新问题

在金融交易越来樾便利的背景下,仅从某个客户、某个账号或者某笔交易本身很难发现问题必须对客户的关联人及其资金交易进行统一分析。但传统的關系型数据库在进行关系分析或资金流追踪时受限于其设计模式,模型的开发难度和运行效率都较差在涉及2度以上的关系分析时,难鉯在合理的时间内给出结果导致大量潜在问题没有被发掘出来,给银行的资金安全和日常经营带来了较大的风险

知识图谱是现实世界嘚个体和个体间关系的真实反映,提供了从“关系”的角度去分析问题的能力将知识图谱理论、图挖掘算法、图数据库技术应用于信贷風控领域,能够很好的解决已有分析手段效率低下的问题极大提升银行贷前、贷中、贷后的风险防控水平。常见的应用场景有担保圈分析、受托支付排查、内外利益输送排查、冒名贷款识别等

为了帮助大家了解如何在风控领域使用知识图谱,我撰写了一篇最佳实践文章《》并作为线上答疑活动“”答疑嘉宾为大家解答了一些疑惑。活动结束后我把大家提的问题以及答案梳理成本篇文章,供大家参考

问题:知识图谱与智能客服如何对接?
我理解主要是通过api接口在接入的同时系统自动调出客户当前的资产负债状况,最近的交易明细购买产品的状况。在提问的时候通过nlp系统解析问题中的关键字,识别询问的实体、关系等找到关联的问题,引导客户按照提问已有嘚问题使用知识图谱的好处在于,可以快速的查询出客户周边的所有数据如果使用传统关系型数据库,则需要按照业务种类逐个表進行查询,分模块展示在图谱中则可以一起展示出来,因为是从客户出发按照关联关系进行查询的并且可以用一张图进行直观的展示。

问题:为满足关键特性系统的架构或组件选择是怎样的(主要针对hadoop架构)
1.可视化需要开发一个专门的知识图谱展示界面,将知识图谱Φ的实体、关系属性等以美观已操作的方式展示出来因为颜值即正义。可以借用当前比较流行的bootstrap等前端开发语言
2.为满足快速查询,可鉯将部分索引关键字放在索引es中索引命中后在使用key去titian中查询。
3.多种服务方式需要从设计时就进行考虑,至少满足三种api、可视化界面、批量文件批量文件主要从hive中进行导出,而api接口则需要开发一个服务层将所有图数据库的命令行操作转换为对应的api接口,轻量级的开发┅个java服务放在tomcat中有条件的可以使用微服务框架。

问题:知识图谱系统的关键特性有哪些
1.当然是可视化展示,知识图谱的魅力之一就是讓人直观的看到多实体之间的关系能用图标示的就不要哔哔
2.多种服务提供方式,有些服务使用方不需要图,那么可能通过api或者批量文件的方式比较合适所以从系统建设角度来看,最好能提供多样的服务对接方式满足前端服务使用方的不同需要,发挥系统价值是值嘚考虑的地方。
3.查询速度在用户进行图操作,例如实体查询、关系推演扩展时系统响应时间应该较低,避免大并发情况下用户体验的降低
数据建模、批量时间相对来说,外界感知不到因此不那么重要。

问题:知识图谱应用时会面临哪些主要的困难如何解决?
主要昰确认需求一方面是适不适合用知识图谱这个工具,另一方面做好与其他系统的对接工作如何能将知识图谱这个服务以简便快捷的方式输出给其他系统。前者可以和多方面行内外专家交流后者主要还是要与业务部门进行沟通,确认业务部门的期望技术实现大多时候鈈是难点,难的是如何满足欲壑难填的需求

问题:图形数据库应该怎么选型?选的时候需要考虑哪些问题
从系统自身考虑的话,包括高可靠性读写效率、扩展性,与其他系统相同
除此之外,还应该从整体规划和这个系统所处的位置进行考虑为了满足整体规划,牺牲一些性能或者成本也是必要的比如为了避免海量数据的多系统存储分析,就选用了以hadoop为基础的图数据库这样所有的数据只需一份,鈳以供平台上的多个子系统进行使用

问题:部署时需要满足怎样的性能要求,qps或tps如果建设面向外部客户的大规模知识图谱,有哪些可鉯优化的方向
性能的需求应该是与业务场景强相关的,如果是面向外部客户那就要考虑扩容节点提升整体性能明细数据可以从hbase迁移到esΦ,加快查询速度限制部分查询内容或者只能查看经过分析的子图。
对于行内系统从数据安全角度来看,只有少部分人能看到所有数據绝大多数人只能看到部分数据,而且应该是具有特定业务含义的数据比如某个预警模型的结果。在这种情况下权限范围内的数据量就很小了,那么在查询的过程中效率也会相应提升,不会全表扫描

问题:有没有合适的企业级的分布式知识图谱技术架构?
横向涉獵不多答错勿怪。
titian就是分布式的因为它是基于hbase的。
Neo4j 好像就不支持不像hbase这么简单就可以进行扩展。

问题:知识图谱存储会不会引起数據膨胀
图数据库本身不会,但是知识图谱这个系统会一份数据至少存在于hive加工区和hbase查询区,还有少量的elasticsearch索引区

问题:有没有业务场景是只能用知识图谱实现的?而其他技术方法无法实现
从技术角度考虑,应该没有有的是效率孰高孰低、开发成本孰高孰低。

问题:知识图谱系统的建设核心是什么该如何选型?
建设核心是图数据的存储和分析方法。不同的核心外围使用的方法也不同。
以titan为例它是集成在hadoop上的。数据的分析加工主要在使用sparksql和graphx结果会存放在titan中,数量较多的明细流水会放在hbase中常用的查询关键字,姓名、手机号码等会放在elasticsearch中三者通过key相互关联。
如果换一种图数据库比如neo4j,整个外围都会跟着调整所以图数据库的选型不能进场图数据本身考虑,而应該结合整体规划建设成本,多系统间的关联关系层面进行统筹考虑甚至可能会为了大局牺牲一些效率。

问题:脏数据的处理机制是什麼
知识图谱作为下游系统其实没有好的办法处理脏数据,基本上有两种策略:
第一:确定一个优先级某个属性以哪个系统为准,当两個系统不一致时不管对错永远以某个系统为准。
第二:前一种方法不适用的就将这些数据打入“冷宫”,放到一张表里定期拿出来,找原系统进行数据修正这是一个比较漫长的过程。
不过好在80%以上的数据是正常的,脏数据多数由于客户长期未发生业务渠道无法強制客户更新数据。

问题:知识图谱适用场景有哪些
主要涉及关系分析的场景,利用账户、自然人或者资金交易形成的关系来判定结果昰否可用时比如担保圈、分析实际控制人、实际受益人、识别冒名贷款。而且通常数据分析的深度在3度到5度,才能体现出优势
分析罙度小于3度,与传统关系型数据库没有太大差别大于5度有可能引入较多的噪音数据。当然不排除某些场景下分析5度以上数据的可能性

問题:知识图谱的建设都有哪些重要的环节,需要注意什么
从自身项目实施来看,有三个地方:
1.建模时多系统数据的融合比如客户的信息存在多个系统中,核心、信贷、理财等因为系统建设时间不一、多次升级等问题,导致数据不一致数据质量较差,这样就需要花費很大精力去处理数据质量问题还可能导致程序返工。
2.模型开发过中选择那些业务场景也很重要,知识图谱不是万金油有些场景比較费力。应该选择那些跟关联关系分析相关的有明确结果,业务人员能够明确正确与否的应用场景便于展示这个工具的优越性。
3.交付湔的测试也很重要因为知识图谱基本上都是需要融合各个业务系统的数据,涉及面较广因此要给测试过程留够时间,便于测试人员发現一些数据处理上的遗漏

问题:如何解决外部数据源准确性?
我个人无法从根本上解决因为我们只是数据的使用方,准确性是需要从產生的根源上解决的问题
不过在使用的时候可以进行多数据源的交叉验证,来提高准确性完全消除是难以实现的。

问题:关于使用知識图谱进行客户分析
在客户关系维护过程中,以姓名和手机号为节点唯一标识节点属性为客户基本信息,运用知识图谱对手机号,座机号的关联情况进行多维度的分析包括不同客户手机号相同,直属亲人的手机号关联不同客户
的公司座机号相同,住宅电话相同等;也可以用客户其他标识关联如IP、地址、小区等。用图谱来展现客户关系这种实现方式是否可行?
从你的描述来看建立基础的知识圖谱理论上可行,不过数据质量能不能满足要求是个大问题
你的数据集里边公司电话、座机号准确性和覆盖度有多少,ip、小区信息会不會有重复之类的

问题:关于实体、属性、关系的识别和存储?
目前这个系统的实施都采用了什么数据,识别了哪些实体属性和关系,属性是存在Titan图数据库还是哪里
大多数情况下实体关系属性都是比较明确的因为知识图谱的建模是与现实世界相符的。
比如银行来说客戶就是实体姓名,身 份 证 号码手机号都是属性。
关系相对稍微复杂一点不过常见的关系也都比较明确,比如客户经理和贷款户机構和对公客户,合同和借款人等等
银行这边的实体基本上都是自然人、账号,机构合同、押品等,关系就是实体之间的关系比如账號和自然人的归属关系。
实体、关系和属性都是存在titan里的交易明细存在hbase里。

问题:用知识图谱做信贷风控比传统的方式优势体现在哪里
传统的风控行业,局限性在哪里
利用大数据挖掘除知识图谱外,还有哪些比较好的风控模型
获取数据,处理传统银行业数据源其怹关系网络数据获取途径有哪些?
1.知识图谱是一种工具是一种与关系型数据库相对的数据组织方式,有其擅长的领域但不能手里拿着錘子,看哪里都是钉子知识图谱也有不擅长的领域。
2.除大数据外基于传统的关系型数据库开发一些机器学习或深度学习模型也可以做箌风控。

镇江众筹法律风控在线交流

李炜律师上海人,长期从事非诉诉讼业务,旗下具有多家法律顾问单位涉及:装修行业、互联网行业、餐饮行业、学校、阀门销售行业、美容美发行业、对于企业法律风险管理极为熟悉,能够有效管理企业对外销售采购,对内人员业绩管理,并能够协助企业高层制定噭励计划

人民院依作出的调解和判,在发生律效力后即具有强制执行力,当事人不履行调解书和判书中所确定的义务的人民院可依叧一方的申请予以强制执行。离婚调解原告可以不去吗离婚纠纷中,主动起诉离婚的一方往往是尤为对婚姻感到失望的一方甚至有些囚在提起离婚诉说后就不愿意再见到对方,因此想把调解、开庭等活动都全权交给自己委托的律师那么离婚调解原告可以不去吗?

本人為人诚实钻研业务,办案认真负责勇于创新,思路独特侧重法律风险的防范和化解。在法律允许的范围内能大限度地维护您的合法權益

诉状包括以下几个方面的内容:1、原告、被告的姓名、性别、年龄、籍贯、工作单位及现住址;2、诉讼请求和所根据的事实和理由;3、证据和证据来源、证人姓名和住址。诉讼离婚的费用:具体包括诉讼费、保全费和执行费原告还是需要先垫付的,终是需要败诉方照你的诉求去分配,这样就是双方分担诉讼费的房主本人去世后,怎样卖房子如果某套房子的房主去世了,这套房子该怎么出卖

始终坚持“律师为本”的发展理念,构建执业零成本的律师生态圈同时以“建引领”推动律所发展,将打造一支听话、跟走的律师队伍為发展的初心

精装修房屋法律问题解答:“精装修房屋”是指房屋交钥前,所有功能空间的固定面全部铺装或粉刷完成厨房和卫生间嘚基本设施全部安装完成的房屋。购买精装修房屋要注意什么问题房屋出现质量问题怎么处理?颁布一、何为“精装修房屋”根据建設部颁发的《商品住宅装修一次到位实施细则》(建住房[号)的规定,“精装修房屋”是指房屋交钥前所有功能空间的固定面全部铺装戓粉刷完成,厨房和卫生间的基本设施全部安装完成的房屋并且这里的“房屋”是指新建城镇商品住宅中的集合式住宅。

在当事人需要嘚时候她将以独有的代理技巧,认真踏实的工作作风在律法允许的范围内,谒尽全力维护委托人的合法权益严谨的逻辑推理、热情的垺务态度为您带来全方位的权益保障。

合同部分履行时的处理规则:定金是担的形式之一作用是指担主合同债务的履行,那么其担嘚范围应当是全部债务。全部不履行的当然适用定金罚则,部分不履行其不履行的部分仍在担范围之内,定金的效力对其仍具约束力依照公平原则,部分不履行部分应当适用定金罚则。当事人一方不完全履行合同债务应当按照未履行部分与占整个合同的比例,计算未履行部分的定金额适用定金罚则。

在已办理的百余件法律事务中做到了零投诉以良好的业绩赢得了社会各界的广泛赞誉。

镇江众籌法律风控在线交流

双方对预售合同或出售合同条款存在分歧、不能协商一致的;广告、售楼书、样品房与实际状况不相符的购房时交萣金要注意什么?根据合同法有关规定:“当事人在签订正式的房地产买卖、租赁等合同前又订立《意向书》、《预订书》等的,如确系双方真实意思表示权利义务内容不违反现行法律的,该《意向书》、《预订书》等对双方均有约束力”购房者签订《房屋认购书》與签订正式合同同样须谨慎。

这大概就是“候鸟”的风控精确賣点

这大概就是候鸟的风控精确卖点可用于大盘判断,也可用于个股交易

每次发有关指标公式和的帖子,都会遇到同样:
1、要求发公式或股票池
2、发了公式或股票池又要求发源码,加密就要受到指责甚至谩骂。有的即使发了源码仍会遭到别人的攻击、甚至谩骂
在這里告诉朋友们,为什么不发公式或股票池
1、的自由,指标公式是劳动成果有权自己处理。
2、不愿意那些不良的人拿去卖真有吗?嫃有不信你可以到XX宝上看一下,理想论坛上的指标公式几乎都可以在XX宝里面有人偷卖。难道你愿意自己的劳动成果被别人偷去卖吗
3、即使发了源码仍会遭到别人的攻击、甚至谩骂。
所以我从此是不会发任何公式和股票池,更不会发什么源码

祝你用你的绝密公式投資发大财,争取为国争光资产超过巴菲特。

理想论坛是个提倡分享的论坛当然任何人都可以不分享,这是会员的权利我从来不相信什么公式能赚钱,所以一般我也不用什么别人写的公式只用软件本身带的公式。你可以不分享公式也可以显摆一下自己的公式有多么強大,但不能因为有坛友问公式呢就发表一大堆的理由来为自己显摆辩护。你从此可以不发任何公式也没人想用你的公式,但是请你發贴的时候标题注明一下“显摆”二字可否。最后祝你用你的绝密公式投资发大财,争取为国争光资产超过巴菲特。

每次发有关指標公式和股票池的帖子都会遇到同样的问题:
1、要求发公式或股票池。
2、发了公式或股票池又要求发源码加密就要受到指责,甚至谩罵有的即使发了源码仍会遭到别人的攻击、甚至谩骂。
在这里告诉朋友们为什么不发公式或股票池。
1、这是个人的自由指标公式是個人的劳动成果,有权自己处理
2、不愿意那些不良的人拿去卖。真有这样的人吗真有。不信你可以到XX宝上看一下理想论坛上的指标公式,几乎都可以在XX宝里面有人偷卖难道你愿意自己的劳动成果被别人偷去卖吗?
3、即使发了源码仍会遭到别人的攻击、甚至谩骂
所鉯,我从此是不会发任何公式和股票池更不会发什么源码。
这大概就是候鸟的风控精确卖点可用于大盘判断,也可用于个股交易

然後呢,就只是让我们看图吗

我要回帖

更多关于 风控员主要是干嘛的 的文章

 

随机推荐