新浪财经讯 “2018中国金融论坛”于5月16日-17日在北京召开,主题为“金融科技服务实体经济发展”,百融金服CRO季元出席并演讲。
以下为演讲实录:
季元:今天主要是结合我个人和我们公司这些年的探索介绍一下科技金融在金融业里具体的应用场景。
我的发言分三部分,第一部分讲科技金融里科技的核心要素;第二部分是具体的在金融业的落地的应用场景;第三和大家一起探讨一下接下来这些年科技金融的发展趋势。
在360行里,我觉得金融业对新技术的应用始终是处于一个比较领先的位置。随着说科技金融这个词这两年出现的频率才比较高,但是从整个科技金融的发展来说,很早就开始了,我大致把它分为三个阶段,第一个阶段是2004年以前,这个阶段主要的推动力是在传统的金融机构,从上世纪一九八几年的时候大行就开始建立这个信息系统,包括人民银行的大额和小额的信贷系统也是在2005年上线的,到2004、2005年这个阶段,是传统金融机构信息化的完成,意义在于金融业务本身的数据开始沉淀下来。
第二阶段是从2005-2015年阶段,这个阶段的主力就是一些非金融机构像阿里,开始对金融的一些边缘业务做创新,比如余额宝、支付宝包括P2P也是这个阶段开始起步的,支付宝是2004年成立的,国内最大的消费金融公司钱信(音)也是2004年进中国的,最大的P2P是2006年进中国的,所以从2005年前后进行了第二阶段的创新,这个阶段唱主角的不是金融机构。
第三个阶段是2016年以后,到了2015年之后电子货币,特别是2016、2017年消费信贷的爆发,金融科技开始触及金融业的核心要素,像货币和信用体系,这个阶段属于科技公司和金融机构融合的阶段。
在整个历程中我认为科技金融最核心的要素是数据和算法,之所以在2016、2017年互联网金融能够爆发,除了第一阶段的基础设施的积累,支付系统、清算系统加上金融业本身的数据积累,还有第二阶段积累的互联网、移动互联网的数据,这是整个业态能够发展起来的基础,在这个基础上对这些数据的信息的挖掘就是算法也发挥了很大的作用,包括反欺诈、大数据风控,能做到0.3秒是基于这些算法的积累,通过人工审批完全达不到这个效果。这些是科技的核心要素就是数据和算法。
支撑数据和算法的是背后一整套的应用框架,大致分成四层,最底层是数据存储层,就是我要把这些大量的数据沉淀下来,第二层是数据处理,对这些海量的数据进行加工,需要特征衍生、数据清洗,第三在清洗完的数据上进行搭建,最上层是基于这些系统做的各种产品,比如微利贷款,从传统的金融机构到现在的科技金融层次是一样的,只不过随着IT技术的进步,每一层用的技术不太一样,比如最低层的存储,传统的就是储仓,第二层清洗也是,只是技术的迭代导致整个业务的效率在提升。
数据的存储和数据的加工,这个是基于开源技术搭建的我们公司现在用的大数据平台,能做到这种毫秒级的响应,现在我们公司每天的业务的访问量是千万级的。
这个是我们基于微服务的应用平台,这是前面那一页四层架构里的第二层,采用微服务的技术搭建整个应用平台,保证整个技术的耦合和快速迭代,并且能够支撑高并发的响应。最后是算法平台,这也是科技金融里两个核心之一,我们传统的在银行里做算法都是用SAAS等语言先建模,之后把这个模型交给开发部门进行开发再上线,数据的提取是通过数据库实现的,整个流程走下来至少得要三个月,这样的效率对科技公司来讲是接受不了的,因为现在整个公司的建模团队不到60个人,但是我们要支撑三千多家客户的服务,所以我们把整个算法平台服务化,首先我们的数据变成服务化的,不是从数据库里提的,直接通过API接口匹配数据。另外是建模的数据化,原来是通过一行行敲代码建模型,现在我们建模的算法直接通过接口实现直接调用。最后是这个模型的上线,它自动会部署到线上平台并且自动监控,每天监控这好几百个模型。整套流程下来不到一周的时间就能完成一个模型,最快能够做到两三天,背后有这么一套体系来支撑我们的整个服务。
上面讲的是科技的部分,实际上是通过科技的高效率来推动业务的高效率,我觉得这也是金融科技的一个核心的竞争力。
第二部分结合具体的应用场景和大家分享一下我们公司跟客户一起做的创新的应用。
科技金融应用场景大家平常都能感知到,这些年的发展总结下来,至少这五个方面是大家比较公认的。像移动支付和智能投顾,这个跟大家的生活都比较贴近,每天我们都在用微信支付和支付宝,智能投顾就是我们现在买理财,像我们公司的90后一半以上都不买银行理财,都买的是P2P的理财。下面这三个就是精准营销、欺诈防范和大数据风控,这个主要是跟咱们的业务贴的比较近,也是我们公司主要的业务方向。
接下来我结合具体的信贷业务讲一下在这几方面我们的一些创新的技术。
信贷业务的生命周期可以分成这四个阶段,首先是获客,传统的金融机构的获客通过网点和客户经理,在金融科技发展起来后,首先渠道上就有变化,从线上转到线上,现在最大的问题是你的成本从原来的固定成本变成了现在的变动成本,并且客户的质量也会发生很大的下沉,所以在获客这个方面,最大的诉求是精准。第二个就是进入审批阶段之后,因为有这些大数据的积累,所以我们能做到智能的反欺诈和大数据风控。在贷后阶段也能做到动态的监控,最后是催收。这几个阶段在创新的过程中也是有先后顺序的,比如说从去年或者2016年刚开始的时候,市场上头部的互联网金融公司,他们的以上人员结构有一个比较奇怪的现象,他们贷后部门人数会战刀整个公司的一半,这和传统的金融机构的结构偏差比较大,因为早期的创新主要是在获客和审批阶段,他在获客和信审部门只投入比较少量的人就能支撑,但是那个时候贷后和催收的业务还没有开始,这是一个重人力的阶段。从去年下半年开始到今年一季度,智能催收和贷中、贷后监控也开始发力了,这些公司他们部门的人员结构也在变化,从这些互联网金融机构的部门结构中能够看到整个金融科技的创新的节奏。
接下来就是从各个环节来具体讲一下我们的一些核心的东西。
在营销这个阶段主要解决的是获客的问题。早期的营销的创新主要是渠道的变化,传统银行获客是从网点和客户经理,这个增长的速度一定是线性的,首先开设网点是由监管机构来批准的,这个速度本身就受了限制,然后每一个客户经理每天的精力也是有限的,所以你的网点数量和客户经理的数量决定你业务规模的增长,这是一个线性增长。但是从去年转到线上之后可以看到,头部的互联网金融公司的客户增长是指数级的,可以做一个对比,各家股份制银行或者大行的信用卡客户从零到一千万,这个时间平均下来大概是在十年左右,但是去年现金贷风声水起的时候,这些机构他们的客户数量从零积累到一千万大概只用了一年多不到两年的时间,所以这是渠道的变化带来的红利。有渠道变化红利的同时也有另外一个问题,早期线上的渠道获客的成本很便宜,而且质量又好,都是找的最好的那拨人,但是最后机构多了以后,客户的质量在下沉,成本也在上升,这个时候大家最大的诉求就是要精准,因为借贷是一个典型的逆向选择,主动找你要钱的都是坏客户,怎么能把这些坏客户找出来这是风险的问题,另外就是意向的问题,好客户不是什么时候都需要钱的,怎么在大家需要钱的时候金融机构找到你,这是营销时机的问题,所以营销主要解决两个问题,一个是风险,一个是营销时机,第一步是靠客户画像,识别这个人是好还是坏,第二是识别你的意向,通过模型预测你什么时候需要钱;第三步是匹配,把客户和金融机构进行匹配,因为每家银行的风险偏好是不一样的,有的客户要有的客户不要。
在我们营销平台上,如果这个客户不是你这家银行的菜,他在这个平台上是看不见您的产品的,保证能够看到您的产品的都是您想要的客户,这是精准营销的逻辑,这个背后是大数据的客户画像加上一个精准的匹配算法。通过这个匹配算法能确保两点,第一个客户的风险下降,第二你的获客成本下降,不用成海量的客户里筛你想要的客户,给到金融机构的就是你想要的客户。
第二个是在审批阶段,这也是创新比较集中的环节,市场上提供这类服务的机构非常多。去年底现金贷政策出来之后,里面强调了几点,金融机构的核心业务不能外包,这里面就包括风控,所以当时有一些银行跟我们合作时就有这个顾虑,就是跟你合作算不算核心的业务外包风控外包,很多人对这个有一个误区,是不是我们来合作就变成外包了,实际上我们这个里面的决策涉及到防火墙的角色。比方说一百个借款人到了银行之后,首先经过我们的模型过滤一下,剩下的50个人再到你的银行,但是最终的放款决策是银行发起的。这里面的好处在银行保证你的信审部门的规模是可控的,当你业务爆发的时候,前面有一段过滤器帮你把不想要的客户过滤掉,而且我们做这个事情有一些优势,有一些坏人银行自身发现不了的,,但是通过我们的大数据风控体系可以发现这就是反欺诈。
传统的银行做反欺诈风控是右边这个图,是基于内部关系的,所有在你这家金融机构申请的客户这些来做反欺诈判断,首先是他本人信息的真实性,另外就是人和人之间信息的关联,比如多个人共用手机号和地址,我们做反欺诈除了刚才这两个环节外还有另外一个环节,就是我们能够建立借款人和金融机构间的关系,因为我们合作了三千多家金融机构,所以我们能够发现这些借款人跨机构的信用,比如这个人手里有好几家信用卡还去借现金贷,这是属于很缺钱的人,比如一伙人同时在多家机构出现,一百人同时出现在两家金融机构,三四次出现绝对不是巧合。我们可以构建一套立体的反欺诈模型,这是金融机构自身做不了的。
第二个就是在大数据风控方面,这三张图举了一个例子,就是非金融的这些数据对风控的指示性,因为传统的风控模型是基于个人的征信记录来做你的信用判断,这种方式在成熟市场是成立的,因为大部分人都有这种征信记录,但是在中国或者其他的国家这点上会碰到很大的困难,比如说今年很多互联网金融公司去东南亚放贷,他们发现大部分人没有征信记录,国内其实也一样,在人行征信体系里的只有3亿人剩下接近10亿人没有,这个就靠大数据风控。比如财经媒体阅读与违约率关系,读的越多违约率越低,第二是网络游戏消费与违约率,第三是本地生活消费与违约率的关系,这些背后不是因果关系,不是因为你读了财经媒体风险就下降,这个是相关性,背后的逻辑可能更复杂,你阅读什么样的媒体可能取决于你的教育水平和职业,这两个因素又能影响你的收入,但是我们不知道这个人的教育、职业、收入的情况下,通过这个数据能够对他的风险进行判断,这是大数据风控的第一个优势,保证没有征信记录的人能够获得一个相对比较精准的风险判断。
大数据风控的第二个优势是不容易作假,因为我们传统的模型也就十来个变量,很多的欺诈分子会针对你的变量进行包装,比如包装他的学历和职业,所以我们传统金融机构的风控体系里很大一部分工作是在识别这些包装造假,大数据模型是很难造假的,因为我们模型预演会有成百上千个变量,你去包装一个两个十个八个变量,对最后信用评分结果的影响会非常小。你如果针对成百上千个变量进行包装,比如你一年内都在看财经媒体一年之内不网网络游戏,你这不是在作假是换了一个人在生活了,那样你的信用可能真的变好了,所以这是大数据风控的第二个优势,可以大幅度降低风控成本。
智能语音催收,这个是去年底到今年初新出现的创新,自动外呼这是语音转文本的过程,语音合成是文本转语音的过程,这个环节已经非常成熟了,前一阶段谷歌出的技术发现拟合的语音语调非常接近真人,核心在于语意理解和知识图谱,这块是需要大量的深度学习技术。
转载请注明出处。