"); //-->
计算机视觉在金融行业的应用
近几年计算机视觉算法在金融领域应用越来越多,在支付、双录、ICR等场景都发挥着举足轻重的作用。该技术不断赋能金融领域,提升金融领域的服务效率,拓展金融服务的广度和深度。
1. 智能支付
支付作为与消费者链接最紧密以及消费领域中必不可少的环节,随着AI智能技术的成熟,智能支付也成为生活中习以为常的步骤。计算机视觉中以人脸识别、虹膜识别、活体检测等为代表的生物识别支付技术,极大的简化了支付流程,为消费者带来便利,有效的降低了交易各环节中的直接和间接成本,提升了消费者的支付体验感。
2. 智能双录
全面双录可以进一步保护消费者的权益,但传统双录系统存在着耗时长、一次性通过率低、人力成本高等方面的缺陷。随着AI技术的发展,AI技术赋能双录环节,实现了智能双录,包含现场/远程双录、网点柜面交易、远程面签、开户面审、远程营销等流程。在全流程中实时“人脸+声纹”双身份核验、实时风险播报提示,规范标准化双录操作,改善了传统双录在效率、成本、体验等方面的劣势。
3. 智能单据识别
ICR是在OCR的基础上植入了计算机深度学习技术,它采用语义推理和语义分析,根据字符上下文语句信息并结合语义知识库,进行未识别部分的字符信息补全,从而弥补OCR技术缺陷。同时以AI+OCR的方式来实现文字高精度识别、文本内容高质量检测及结构化信息高准确度输出,从而满足文字录入、证照识别、单据识别、合同识别与对比等各类金融业务场景的需求。
4. 智慧网点
计算机视觉技术也广泛应用于智慧网点中,通过对网点采集到的视频、图像数据进行视觉分析以及行为分析,对违规、违法等行为进行判断,并基于标准化流程下发到各级负责人处进行调查处理、跟踪反馈。
✦+
+
计算机视觉在其他重点行业的应用
计算机视觉在工业生产中的应用极为广泛,常常扮演“工兵”“哨兵”的角色,不仅能提高生产效率,节约人力成本,还能为整个生产流程安全保驾护航。下面简单介绍计算机视觉在工地、仓储以及石化能源等行业中的应用。
1. 智慧工地
建筑业是一个高危行业,保障员工安全和文明施工是施工单位及政府管理部门高度重视和积极倡导的。然而工地环境复杂、人工监管难度大,如果不能对危险行为和异常情况及时告警上报将会危及到财产和人身安全。智慧工地是将智能算法赋能在监控摄像头上,多点位实时智能监管,以此来保障工地工人的安全。
算法应用有安全帽检测、跌倒检测、区域入侵检测、逗留检测、攀爬检测、烟火检测等。安全帽检测能及时提醒工人佩戴安全帽作业,提高工人的安全意识;跌倒检测能发现工人的异常状态,可以快速知会管理者并获得帮助;区域入侵检测、逗留检测和攀爬检测能及时提醒工人远离危险区域,防患未然;烟火检测能第一时间发现火情并告警上报,可以为控制火情和疏散人员争取时间,让施工方减少损失。
2. 智慧仓储
电商的发展给仓储物流行业提供机遇的同时也带来了挑战。仓储物流环节较多,拣货、配货、条码扫描、包裹扫描、分拣等环节往往依赖人工和自动化设备,导致运营的成本非常高昂。计算机视觉赋能仓储物流的各个环节,可以大大降低其对人工和自动化设备的依赖,准确有效地完成各个环节的数据采集和分拣任务,极大地提高仓储物流效率,优化仓库的运营管理。
算法应用有条码检测识别、仓储物品识别、仓储物品数量检测等。条码检测识别能省去条码位置的人工定位环节,减少人工重复操作导致的误码情况;仓库物品识别能确定物品位置,并结合3D视觉信息估计物品姿态和抓取位置,为分拣机器人精确分拣物品提供依据。相比人工分拣方式,这样做大大提高了分拣效率,减少了人力成本;仓储物品数量检测能快速统计物品数量,为仓库管理者提供物资库存信息,及时应对断货情况。
3. 石化能源
工业4.0是以智能制造为主导的第四次工业革命,在这样的时代背景下,石化能源公司都会考虑引进人工智能技术来提高生产效率,保障生产安全。计算机视觉是优先被考虑的人工智能技术,利用这一技术可以解决一些行业痛点问题,比如风险评估难、危险条件下人工检测结构腐蚀情况、人眼无法观测到的甲烷气体排放、人工仪表读数等。这些任务依靠人工处理是比较困难的,且处理效率较低,对于计算机视觉,这些任务就能很好的完成。
算法应用有石油或天然气管道缺陷检测、仪表智能识别读数、腐蚀检测、甲烷泄露检测、烟火检测等。石油或天然气管道缺陷检测是将传统视觉和深度视觉相结合,对管道进行大规模的损伤检测和损伤程度评估,给运营商提供极大便利;仪表智能识别读数指的是通过深度视觉对仪表盘进行读数,具有准确度高和速度快的特点,可以防止生产中断和危险事故的发生;腐蚀检测能通过图像判断出结构是否存在腐蚀情况,一旦发现可以及时采取有效措施对管道进行更换和修复,减少安全风险;甲烷泄露检测是用来弥补人眼无法看到气体的缺陷,通过红外成像和深度学习图像算法判断甲烷是否存在泄露问题;烟火检测在石化能源行业是非常重要的,通过计算机视觉可以扩大检测范围,以便及时发现火情,精准定位火情位置,快速告警上报,减少因火焰导致的重大安全事故。
✦+
+
当前的机遇及挑战
近些年AI技术的快速发展为金融行业提供了创新的解决方案,也为计算机视觉的落地应用创造了新的机遇。
■ 在多媒体智慧网点(无人网点)中,可以使用人脸识别技术为网点提供安防。例如,在网点使用人脸抓拍机可以抓拍经过网点门口人员的人脸,再通过智能比对分析就可以确定在网点门口频繁出现的可疑人员。
此外,通过对抓拍的人脸图片进行管理,还可以建立人脸图像数据库,再对视频进行结构化处理,可快速匹配人脸数据库,对一段时间内频繁出现的人脸,产生预警提示。这种做法就是将传统的事后人眼比对模式转变为事前防范模式,可以显著提升网点的安全防范水平。
■ 在远程****领域中,音/视频双录就是将****业每笔产品的销售过程同步录音录像,这样可以让业务过程可控且可回溯质检,从而满足金融监管部门的相关要求。
传统的双录质检是通过人工方式来检查视频中业务规程是否合规,费时费力且时效性不强。而基于AI技术的自动化质检,提供了高效、可靠、稳定、安全的技术保障,能够有效提高企业双录效率、降低人工双录错误率和运营成本、提升服务质量与管理水平,从而保证合规且高效。
■ 在农村金融领域中,基于卫星遥感图像识别技术能够为农村信贷服务提供担保评估所需的可信任、可追溯的农村经济数据。例如,针对卫星拍摄的不同分辨率图像,通过计算机视觉算法可以对农作物进行识别,分析作物品类、种植面积、长势情况,进而建立完整的作物种植画像,为信贷担保提供依据。
面对上述丰富的创新应用机遇,计算机视觉技术要想在国内金融业及其他重点行业中取得成功的落地应用,还必须要解决以下三方面的问题:
■ AI视觉系统是否与行业知识契合?现有的视觉算法落地都要经过这样的过程,首先是基于厂商提出的需求以及现有的视觉模型,研发符合厂商要求的算法,将现实需求转化为现有视觉模型可以解决的问题,然后收集数据,对视觉模型不断的进行迭代。
这种落地模式受限于现有的视觉模型,使得模型和需求之间存在一定的偏差,需要依据大量的数据获得一定的准确率,成本高且迁移性差。场景定制化的视觉模型研发具有一定的挑战,其需要不断地积累行业知识和专家经验,将行业知识和专家经验运用到现有的视觉模型中作为先验知识,或者提出全新的场景定制化视觉模型。
■ 数据从何而来?现有的深度学习算法依赖于大数据的驱动,因而数据的可获得性、数据的质量以及数据的标注成本等是制约视觉算法发展的重要因素。对于人脸识别等少数头部需求,数据的获取比较容易且成本较低,可以为视觉算法提供大量的训练数据,由此得到的模型泛化性能比较好,能够满足现有的市场需求。
但是对于稀有目标的检测、特定行业场景的分析等众多长尾需求,训练数据的获取难度大且成本高,数据量无法保证,由此得到的模型泛化性能比较低,无法对现实场景做出准确的判断以及预警。
此外,大部分视觉算法需要标注数据,这也会消耗大量人力和物力,且由于标注人员对于标注要求理解的多样性,将会导致最终的标注质量差异性大,使得模型难以收敛到最佳状态。如何获得一定数量的多样性数据以及高质量标注数据,是一个需要关注和解决的问题。
■ 可以满足国产化的要求吗?视觉算法的成功普及和落地应用依赖于GPU、TPU等高性能的运行设备及TensorFlow、PyTorch等生态良好的深度学习框架。依托于高性能的运行设备,不仅可以使用大数据训练大模型,还可以显著提升算法的推理效率,从而提升视觉算法的实时性。而凭借优秀的深度学习开发框架,可以促进开源项目的生态,促进视觉算法的推广以及部署应用。
随着视觉算法落地进程的加快,需要考虑核心部件的国产化进程,防止关键时刻受制于人,出现卡脖子情况。对于视觉算法开发框架,百度和阿里分别自主研发了PaddlePaddle和X-DeepLearning,但易用性和普适性有待提升。对于视觉算法运行显卡,国内一些厂商已经有了自研产品,但推理速度、显存等性能与国外厂商有一定差距。除此之外,不同显卡和框架之间的迁移和适配过程复杂。为了让视觉算法落地到国家的各行各业,国产化进程任重而道远。
*博客内容为网友个人发布,仅代表博主个人观点,如有侵权请联系工作人员删除。