文档视界 最新最全的文档下载
当前位置:文档视界 › 数据洞察力_保险的核心生产力_郑岩

数据洞察力_保险的核心生产力_郑岩

数据洞察力_保险的核心生产力_郑岩
数据洞察力_保险的核心生产力_郑岩

□文/本刊记者 郑岩

Gartner在一篇题为《CEO Advi-sory:“Big Data” Equals Big Opportunity》(CEO报告:“大数据”=大机遇)的报告中,将大数据时代的企业机遇做出如下描述:大数据是一个影响传统认识和业务模式的紧迫问题,它打乱了现行趋势,同时代表了公共部门、业务和IT领导者们无法忽略的巨大机会。Gartner的研究员表示,IT部门应直面大数据时代的挑战,确保一定程度的成本控制和协调,避免大数据“机会”成为大数据“混乱”。

的确,面对纷繁复杂的数据,如果不能合理、快速、直观地揭示其内部的复杂关系,对于企业来说,数据

的累积仅仅意味着更高、更不

可控的存储和管理成本。可

见,数据的真正价值在于洞察

其内部规律,支持业务决策。

对于保险公司来说,大

数据时代的“机会”和“混

乱”直接反映出企业外部的商

业机遇和内部的管理挑战。本

刊记者通过对多家保险公司

信息科技部负责人的采访,试

图描绘保险行业大数据时代

的蓝图,并剖析孕育在大数

据时代的保险公司核心生产

力——数据洞察力。

保险数据分类及规模

要了解保险公司的数据

规模,首先必须明确其数据

分类。业内通常将保险行业数据分为

以下几类,一是在保单交易系统中管

理和运作的结构化数据。此类数据自

保险公司运营之初即在不断产生、累

积。二是影像数据。随着保险公司业

务量的不断发展,保单检索环节必须

依靠电子化手段,2000年前后,各

家保险公司纷纷上线影像系统,保证

承保、保全、理赔等环节档案的自动

调取。三是语音数据。此类数据源于

2002年保险行业Call Centre的陆续

投产,话务员与客户的通话记录是质

检工作以及业务改进的重要依据,必

须妥善存储。四是OLTP(联机事务处

理)、OLAP(联机分析处理)衍生的存

储于数据仓库、数据集市中的分析型

多维体系数据。区别于交易系统中的

结构化数据,这部分数据是相同数据

源在不同维度上的展现。五是来源于

互联网、社交媒体等的资讯数据。借

助舆情分析等手段,这些外部数据对

公司的经营发展策略和实践同样影响

深远。

与银行业的“短交易”契约不

同,保险业属于“长交易”契约,保

险账户信息变动的频繁程度不及银行

账户,但单一保险账户的信息量远大

于银行。与银行和证券公司类似,保

险公司的沉淀、新增数据量与其业务

发展水平高度正相关。

从当前数据规模看,保险公司的

数据量普遍都在TB级别。

截至目前,中国人寿保险(集团)

公司(以下简称“国寿集团”)的签

约保单客户约2.4亿,是全球保单量

最大的保险集团公司。自1996年业

务运营之初每年几十亿的保费规模,

到现在每年3000多亿保费规模,集

团数据量也呈级数上升,结构化数据

达几百TB。

中国平安保险(集团)股份有

限公司(以下简称“平安集团”)的

OLTP和OLAP数据量超百TB,保单

影像、票据影像、事故图片、电话中

心录音数据等半结构化和非结构化数

据超千TB。

中国人民财产保险股份有限公司

(以下简称“人保财险”)最近8年内

的结构化数据超过百TB,半结构化、

数据洞察力:保险的核心生产力

邵利铎:要发挥大数据的价值作用,必须主动

进行数据治理,让数据管理与分析部门处于公

司的上游位置。

非结构化数据在500TB 以上,预计南方数据中心建成后存储的总数据量将达到2000TB。

作为一家成立不到12年的合资保险公司,信诚人寿保险有限公司(以下简称“信诚人寿”)的累计数据量约为8TB,其中2TB 左右的数据是客户、保单及财务信息等结构化数据,其余为电邮、文档、录音、影像等非结构化数据。信诚人寿信息技术部总经理钟齐胜坦言:“目前,非结构化数据除了支持日常运营需要之外,主要是基于监管及合规要求进行长期保存,但尚未在业务经营决策层面加以很好的分析及利用。”

洞察数据并非易事

“基于数据类型、数据量以及数据响应速度等3个大数据时代的核心特征评估”, 人保财险信息技术部总经理邵利铎表示,“毫无疑问,对于金融行业尤其是以服务为主的保险行业来说,大数据时代或者说大数据的初级时代已经到来。”

掌控市场的机遇

大数据的机遇在于能够提供更好的销售和服务策略,掌握数据、利用数据是保险公司产品创新、服务创新的前提。国寿集团信息技术部副总经理赵峰举例,“比如事件关联性分析,能在数据现象呈现的同时找出其内部本质的联系,精准分析何种人群适合何种产品,进而强化销售策略,为业务发展提供更加明确的市场方向。”

的确,在市场竞争中,关联性分析的优势在于能找到竞争对手可能忽略的事件关联,进而提供既让客户满意,同业又没有的服务,从而占领市场先机。

同时,数据分析亦能防范经营风

险。赵峰强调:“通过现金流分析,结合给付高峰预测,能够让公司在资金运作方面提前做出调整,实现在自有资金收益最大化基础上,应对正常业务运作。”

此外,保险公司的定价能力与数据分析能力息息相关,一旦成本分析出现问题,无疑将挤占产品的利润空间,直接影响保单的销售业绩。赵峰强调:“成本分析能力越强,公司对市场的掌控能力则越强。”

在成本分析方面,未来在监管制度、行业环境允许的情况下,寿险公司可能考虑根据客户贡献度,在传统保单定价的基础上,给予客户一定幅度的价格优惠,此种模式如能成型,将大幅提升保险公司的市场竞争力。当然,这种差异化定价提高客户忠诚度的做法需要建立在强大的数据挖掘能力的基础上。

治理数据的挑战

面对大数据时代的种种市场机遇,各家保险公司的科技部负责人都显得异常“冷静”。在信息化市场中,绝佳的机遇往往伴随着巨大的挑战。对此,邵利铎就企业和员工两个层面,分析了保险公司在大数据时代的核心挑战。

在企业方面,一是对企业IT 战略决策的挑战。大数据量必然要求企业在带宽和存储设备等基础设施方面增加大量投入,对于习惯采用成熟技术的保险公司来说,面临固守或革新的抉择。

二是对企业组织和管理的挑战。目前大部分企业内部数据均处于末端而不是前端,数据更多的是经营结果的被动体现,而不是经营政策的主动

选择,在此情况下,数据质量很难保证。要发挥大数据的价值作用,必须主动进行数据治理,让数据管理与分析部门处于公司的上游位置,这必然要对企业现有的组织体系、资源配置和权力结构进行重组。

三是对企业数据管理和处理能力的挑战。大数据管理以及潜在商业价值的挖掘和预测不仅仅需要硬件和网络投入,由于缺乏成熟的实践经验,其方式方法又与传统的数据仓库和BI 有一定区别,要实施大数据分析,企业还需具备更加专业的数据分析方法和使用体系,尤其是需要具备大量的数据专业人才,这些人才决定了企业应该采取何种大数据技术,应该在何时、何地使用大数据结论。

在IT 员工方面,挑战源于员工是否具备大数据分析所需的多学科、多层次的专业素质,是否具备对新技术的学习和驾驭能力。邵利铎强调,专业的大数据分析人员至少应具备三个方面的专业知识,一是与从事的行业相关的业务技能,二是进行建模与样本选取所必需的数学技能,三是必要

赵峰:

大数据的机遇在于能够提供更好的销售和服务策略,掌握数据、利用数据是保险公司产品创新、服务创新的前提。

的IT 技术。

主动出击,应对海量数据

数据的累积和管理为保险公司的精细化运作和可持续发展奠定了坚实的基础。对于保险行业来说,技术部门承担决策数据支持的职能,要进行数字化决策,信息的准确和及时发布至关重要。邵利铎表示,随着近些年数据的急剧膨胀,各家公司对数据决策支持的需要也愈加广泛和深入,为有效应对,建设企业级数据仓库、对数据进行统一和专业化管理,同时借助专业化数据工具对数据进行处理和加工已经成为保险公司的普遍选择。

结构化数据挖掘仍是主流

“非结构化数据可能会是大数据时代未来信息挖掘的价值所在,但从目前来讲,在投入、使用频率、使用范围、对于信息价值的挖掘深度等方面,结构化数据仍远远高于半结构化和非结构化数据。”邵利铎进一步分析,就目前的大数据环境而言,对于结构化海量数据的认识、处理技术和基础环境等已经基本成熟,而对于半结构化、非结构化海量数据的认识和使用尚处于尝试阶段。

在结构化数据处理方面,赵峰举例,国寿集团集中关注数据管理过程中的4个环节。一是在数据采集环节,必须确保数据的准确性和一致性,比如保单处理系统即为主要的数据采集处理系统之一。二是在数据访问环节,面对庞大的数据量,复杂的数据访问需求,必须有不断优化的数据存储访问策略和用户访问权限设置来保障数据方案的及时性和安全性。三是在数据可用性环节,需要对数据进行合理存储、归档和备份,制订可行的应急恢复方案保证其可用性。四是在数据

分析利用环节,选择适用的技术手段和分析工具,研究构建合理的分析模型,做好事件关联分析、实时分析、预测分析

等工作,使数据通过分析利用产生业务价值。

信诚人寿在结构化数据处理方面同样形成了一套完整的流程。2005年开始,信诚人寿陆续建立了一些小规模的数据分析应用软件。在数据挖掘方面,每日从核心保单业务系统中抽取产品信息、销售信息、客户信息等数据,灌入数据仓库体系的ODS (Operational Data Store,可操作数据存储)中,通过ETL(Extraction Transformation Loading,数据提取、转换和加载)等传统技术,实现对KPI(Key Performance Indica-tor,关键绩效指标)的追踪,及时向管理层反馈销售情况及达成率,并适时调整产品及营销策略。此挖掘流程,还能帮助公司根据已有客户信息和购买习惯,深度挖掘出一批可继续开发、多次营销的客户群,进而制订营销计划、分配相应的销售团队,实施针对性跟进,取得了一定的成效。钟齐胜强调:“数据挖掘的过程要有明确的目标,即从采集阶段就明确定义标的数据的来源和用途,并精准预测挖掘方向。”

非结构化数据的标准化是关键

伴随保险公司电销、网销渠道的客户行为信息、客服中心语音数据、承保环节标的风险识别信息、理赔环节的图片信息以及用于风险预警和评估的灾害风险信息等复杂类别数据的增多,半结构、非结构数据也成为现代保险公司数据内涵的重要组成部分。

要挖掘非结构化数据的价值,对于其进行梳理并标准化的工作非常关键。平安集团保险标准化执行委员会副主任韩梅表示,非结构化数据涉及的标准众多,有非结构化数据的格式要求、采集设备技术要求、系统间信息交换标准等技术标准,操作人员的组织和配备要求、设备和用品的配置要求以及非结构化数据的处理规范和应用规范等等,这些标准的制定、实施和持续改进一直是保险公司信息化工作的重点。

“保险非结构化数据的标准化并没有通用或简易的准则和方法,普遍具有一定难度,尤其是图像数据的标准化。”邵利铎分析,进行标准化工作,最重要、最困难的是要找到更多的数据性质的共同点,此项工作虽可通过一些工具或技术手段来实现,但并不是所有的非结构化数据都能够进行完美的标准化,一般都需要根据用途和方式对数据进行一定的选择和取舍,在此过程中,数据衰减在所难免。

韩梅:我们必须首先明确要解决什么业务问题,之后再从产品角度进行开发,并权衡是借鉴开源技术,还是应用商用软件。

邵利铎认为:“不管是现在还是将来,非结构化数据的标准化问题将是一个普遍的难题。”

非结构化数据处理案例

“要让非结构数据产生价值,首先要做好基本功。”韩梅表示,平安集团有上百TB 的存量非结构化数据,每天还有上百G 的新增,要满足分布在全国广域网上的数万人同时在线实时处理,且响应时间要在3秒之内,如何满足低成本可靠存储和高效实时在线处理要求是最大的技术难题之一。平安集团的应对方法是:结合动态路由检索算法和数据生命周期管理技术,综合应用不同成本的多级存储方案,依据不同数据的价值规律,进行差异化处理。

非结构化数据处理的实践至少应该帮助保险公司达成两项最基本的目标,一是控制风险,二是提高效率。在这两方面,平安集团都有较好实践。

比如通过“影像分割”技术,解决申请表数据录入环节的信息泄露风险。平安集团利用影像与模板的相对坐标,把申请表扫描件切分为一个个

小块,再分发给不同的录入员,有效避免了因同一录入员看到整个申请表而可能导致的客户信息泄露风险。

再如“车险电子地图调度”系统,有效提高了业务效率。平安集团在报案系统中采用了数字化地图,可以方便快捷准确地检索出客户的出险地点,匹配预置排班系统,自动判断离出险距离最近的查勘车(员),及时派工。另外,“网格”划分市中心区域拥堵路段,每个网格由一台查勘车负责,区域大小可以让自行车在10~15分钟内到达。

以业务目标评估商用软件的可用性

当今保险行业,技术改良的动力源泉是业务目标而非技术本身的发展。同理,保险公司主动应对海量数据特别是非结构化海量数据挑战的动力源于满足“高标准、差异化服务,高效率、精细化管理”的业务目标。在此指导思想下,商用软件虽是企业应对大数据时代的有效利器之一,但能否在保险公司落地,还要看其效能与业务的吻合度。

当前,传统商用数据库软件的核心功能基本一致,即将现有数据转化为多维数据,并提供良好的数据展现工具。“从现有商用软件的处理能力来看,基本都能满足保险公司现有及未来几年的需求。”赵峰表示:“保险公司采用新技术和设备不光考虑性能问题,稳定性和安全性也同样重要,当然所有评估要素都要围绕业务需求进行。”

“无论是传统BI,还是大

数据分析平台,并不能解决大数据时代保险公司面临的所有问题,在明确这一点的基础上,

让业务需求说话,可能会是一个更好的选择。”邵利铎表示,未来公司利用大数据技术,更多的是考虑满足以“精细化和差异化的客户服务以及精准化的销售服务”为特征的业务需求。

对此,韩梅表示了相同的看法:“国内保险业务市场变化很快,IT 需要根据业务的变化而变化。我们必须首先明确要解决什么业务问题,之后再从产品角度进行开发,并权衡是借鉴开源技术,还是应用商用软件。”

把握未来

“海量数据正在以前所未有的力度重塑社会。近10年来很多重大的保险创新活动,比如后援集中、公章集中、理赔服务时效大幅度提升、移动展业等,背后都是结构化、半结构化和非结构化数据相结合的成果。”韩梅表示,未来,数据的集成仍是重中之重,大数据技术的核心成果就是更聪明地将各类数据组合起来,凭借不断超越历史的数据洞察力,获得以前难以实现的业务价值。

当前,保险公司大都是依托集中存储、集中计算的技术平台框架,以能够满足现阶段的保险业务需要。然而,随着未来数据规模的膨胀、业务需求的激增,必然要将大量数据分布在不同的设备平台上进行处理,即将串行任务进行并行处理,传统的关系型数据库管理系统更适合一般的事务性处理工作,在性能方面不能很好地满足数据挖掘的即时性要求,未来,以“提升即时交付能力,快速获取分析结果”为目标的新技术将日趋成熟并成功落地。

注:因离线存储于备份系统中的数据通常不做分析、挖掘使用,故此部分数据不在本文讨论之列。

钟齐胜:数据挖掘的过程要有明确的目标,即从采集阶段就明确定义标的数据的来源和用途,并精准预测挖掘方向。

相关文档