一、案例概述
(一)实施背景
当前电信诈骗形势日益严峻,如何在有效控制风险的同时兼顾客户体验,对银行是一大挑战。目前华夏银行手机银行主要采用基于规则的模型进行风险防控,但存在风险识别粒度较粗、模型准确度较低、无法兼顾客户体验等痛点。为了进一步增强手机银行安全服务能力,打造多层次的风险防控体系,兼顾风险防范与客户体验的动态平衡,华夏银行启动了手机银行反欺诈机器学习模型和信识模型项目。
(二)目标与内涵
本项目计划通过打造反欺诈机器学习模型和信识模型,构建信识和风控两套体系。信识体系的“信”代表“信任”,“识”代表“识别”,“信识客户”表示识别为可信任的客户,“信识交易”表示识别为可信任的交易。信识体系的目标是通过行为特征来识别当前交易是否为信识客户本人操作,风控体系目标是识别交易是否可疑,两套体系协同运转,实现对信识交易简化验证,对风险交易采取管控手段,最终达到风险防范与客户体验的动态平衡。
二、实施方案
华夏银行设计的总体方案框架如下图所示:
该方案框架涵盖了数据层、特征处理层、模型层、模型策略层和应用层。在模型层中,信识模型主要识别交易是否为信识客户本人操作,反欺诈规则模型和反欺诈机器学习模型主要识别交易是否可疑;在模型策略层中,可采用权重策略、高分策略、分流策略、地区策略、群体区分策略等方法将这三种模型配合使用,输出信识等级、欺诈风险等级和欺诈角色;在应用层中,根据模型策略层输出结果对交易分类分级,以便对不同交易采取差异化的策略和风险控制措施。
(一)反欺诈机器学习模型
反欺诈机器学习模型由欺诈风险模型和欺诈角色模型串联组成。
1.欺诈风险模型。该模型利用统计学习和机器学习技术,对客户的交易行为进行实时监控,识别客户异常行为,预测每笔交易的欺诈风险。
2.欺诈角色模型。该模型基于对已知欺诈案例的行为特征进入深入分析,分别构建受害人样本和诈骗犯样本的行为特征档案,识别具有相似行为特征的客户,在识别高风险交易行为的同时,进一步区分疑似受害人和疑似诈骗犯两种角色。
欺诈风险模型和欺诈角色模型先后串联连接,欺诈风险模型先对交易数据进行欺诈风险判别,欺诈角色模型再对所选出的高风险客户进行欺诈角色判别,最终识别出欺诈风险等级(高风险/中风险/低风险/无风险)和欺诈角色(疑似受害人/疑似诈骗犯)。具体模型结构如下图所示:
(二)信识模型
信识模型主要用于识别交易是否为信识客户本人操作。通过分析信识客户的历史登录数据、历史交易数据、绑定设备信息、客户信息等,深入理解信识客户的行为特征和偏好并形成信识档案,量化评估当前交易是信识客户本人操作的可能性,再结合欺诈风险等级情况识别当前交易是否为信识交易,对信识交易简化验证方式,提升客户体验。
信识模型最终输出信识等级(高信识/中信识/低信识/不信识),模型的构建主要采用层次分析法来确定各因子的权重,通过信识评分量化表达当前交易是客户本人操作的可能性。同时,利用LightGBM、线性回归等先进的机器学习方法,进一步评估各特征的重要性,以优化层次分析法的特征排序矩阵。
(三)交易分类分级矩阵
根据模型策略层输出的信识等级、欺诈风险等级以及欺诈角色情况,将交易分类分级,对不同交易采取不同的策略和风险控制措施。
三、效果与创新点
(一)项目效果
本项目构建的反欺诈机器学习模型和信识模型已完成基于历史数据的效果验证,验证结果表明模型表现良好,具有很好的应用价值和可推广性。
1.模型表现良好
反欺诈机器学习模型的AUC为0.93,KS统计量为0.728。模型整体表现良好,表明反欺诈机器学习模型在区分欺诈与非欺诈交易方面具有较高的准确性,它将在风险防控方面发挥重要作用。
信识模型的AUC为0.82,KS统计量为0.56,模型整体表现良好。信识模型为规则模型,主要用于简化验证提升体验,仅对欺诈风险等级为低风险/无风险且信识等级为中信识/高信识的信识交易简化验证。根据历史数据表现,可为45%以上的交易降级验证,能够很好的提升客户体验。
2.应用价值高
(1)增强欺诈交易识别能力。反欺诈机器学习模型采用了机器学习算法和大数据分析技术,其在识别欺诈交易的准确性方面表现良好,能够减少反欺诈系统错判和漏判的情况发生,能更有效地保护客户资金安全。
(2)提升客户体验。信识模型的开发应用,可简化正常客户信识交易的验证方式,提升客户使用体验和满意度。
(3)风险防控管理更精细。通过综合分析交易行为、历史记录和客户信息等,模型能够更准确地判断欺诈角色是疑似受害人还是疑似诈骗犯,从而采取更合适的应对措施。
(4)增强可扩展及适应性能力。该模型具备较优的可扩展能力,反欺诈系统预留了多个接口,这些接口既可以使模型与外部数据源和算法库进行连接,也能使模型接收和整合来自不同渠道的数据,如黑名单、模型权重系数等,以让模型适应不同的新型欺诈手段,最终提高模型的准确性。
(二)主要创新点
1.安全服务模式创新
本项目构建了信识和风控两套体系,两套体系协同运转,实现对信识交易简化验证,对风险交易采取管控手段,最终达到风险防范与客户体验的动态平衡,实现安全服务模式创新,推动了科技创新与数智化发展。
2.技术创新
本项目充分应用大数据和人工智能技术进行创新。反欺诈机器学习模型利用自然语言处理(NLP)领域的实体识别技术对样本打标,显著提升了打标效率,利用词频-逆文档频率(TF-IDF)算法挖掘欺诈特征,丰富了模型的数据维度;信识模型基于用户历史长期行为与近期行为数据构建用户画像,深入理解用户的行为特征和偏好,再利用机器学习算法辅助创建层次分析模型,进一步提升了信识模型在复杂决策过程中的分析能力和准确性。
(1)用户画像
通过聚合统计用户交易行为、交易关键要素等,构建用户画像,分析正常用户与诈骗犯行为模式的区别,为反欺诈机器学习模型、信识模型提供特征/标签支持。
(2)NLP的实体识别技术
使用NLP的实体识别技术辅助交易数据打标,增强数据处理能力,提高反欺诈机器学习模型的准确性和效率。一是可自动化解析交易备注等非结构化文本数据,提取关键信息和情感倾向,为识别潜在欺诈行为提供线索;二是能校准和修正已有的打标数据,通过分析发现并纠正错误,提高数据质量。
(3)NLP的TF-IDF技术
使用NLP的TF-IDF技术进行数据特征工程,提取和构造更有针对性的数据特征,结合适当的特征选择和降维技术,提高模型对欺诈行为的识别能力。
(4)与机器学习结合的层次分析技术
构建信识模型采用了与机器学习结合的层次分析技术。将机器学习模型训练得到的因子权重系数做为层次分析的基础权重系数,并结合测试数据表现和专家经验对模型权重系数进行微调,提高信识模型准确性和效率。
四、案例总结
本项目构建的反欺诈机器学习模型与信识模型是金融科技创新的具体体现,通过对大数据和人工智能技术的创新性应用,实现对信识交易简化验证,对风险交易采取管控手段,最终达到风险防范与客户体验的动态平衡。本项目实现了安全服务模式创新,助力提升银行业务的安全性、客户体验和服务效率,符合现代化产业体系对于提高生产效率、提升服务质量的要求,推动了科技创新与数智化发展,为经济社会高质量稳健发展保驾护航。
长
按
关
注
解锁更多精彩内容