现在已经有相当数量的公司安装了资料挖采软件,以找出那些会造成利润差异的信息。
1.完美的购物经验-英国Safeway
此个案研究探讨英国的Safeway如何运用Data Mining来从大量的资料中萃取商业信息。英国Safeway使用Intelligent Miner从资料中萃取商业知识,这是一个Data Mining可以成为企业的一部份的最佳范例。英国Safeway定义了明确并实际的目标,使用相当干净的资料源,进行Data Mining,并且投注许多人力用以解读Data Mining的结果,并且采取实际的行动以善用Data Mining所发掘出来的信息。
英国Safeway的年销售量超过一百亿美金,旗下的员工接近七万名,是英国第三大的连锁超级市场,提供的服务种类则达三十四种。该公司的信息部有两台System/390服务器,以平行的方式执行DB2,其中最大者每周要管理八百万笔交易,以及约4TB的磁盘储存容量。
根据英国Safeway的信息总监迈克温曲指出,该公司在两年前就体会到必须要采用不同的方式来取得竞争上的优势。「在英国市场运用传统的技术,如更低的价位、更多的店面、以及更多种类的产品,竞争已经越来越困难了,」温曲先生说:「大部份的竞争对手在价格以及产品范围方面都能与我们匹敌。由于土地以及扩充的成本,没有一家公司有足够的资源可以在扩充方面超越对手。」
温曲先生的说法是,这个问题的答案是:「必须以客户为导向,而非以产品与店家为导向。这意味着我们必须更了解客户个人。为了达成这个目标,我们必须了解六百万客户所做的每一笔交易,以及这些交易彼此之间的关连性。」换句话说,英国Safeway想要知道哪些种类的客户买了哪些种类的产品以及购买的频率,以建立「个人导向的市场」。
(1)一把网住
将资源集中在特定的问题上,并设定可达成的目标之后,英国Safeway在商业智能过程(也就是Data Warehousing/Data Mining过程)中的下一步,就是选择适当的资料来源,将客户的交易资料集中在Data Warehouse中。为了达到这个目的,该公司开始发信用卡给客户,客户用这种信用卡结帐可以享受各种优惠,这种信用卡就成为该公司在500家店面搜集六百万客户资料的「网」。这些客户的消费行为资料不断地被从主数据库中萃取出来,每周存在Data Warehouse中(大约有500GB),使用的平台则为执行Intelligent Miner的RS/6000SP2。
IBM声称该公司在1996推出的Intelligent Miner能提供Data Mining作业所需的完整环境,提供资料准备的设施,以及八种Data Mining技术,包括预测模型、资料分割、以及产品吸引力分析,当然还有图形化的结果显示。 数据挖掘研究院
通常资料在存入Data Warehouse之前,都必须经过各种仔细的转换(Data Cleansing),例如将标称值转换为数值、定义衍生的属性、以及去除空值(Null Values)等等,这都要视应用而定。在英国Safeway的个案里,资料源为单一的交易处理系统,该公司对这些数据质量有足够的信心,而且该公司的目标仅在于大略的估计其客户是哪些人,所以Data Cleansing并不是主要的问题。
在资料被存入Data Warehouse之后,Intelligent Miner会根据客户的相关资料,将客户分为150类。然后再用Association的技术来比较这些资料集合(这些资料包括交易资料以及产品资料),然后将列出产品吸引力的清单(例如「在购买烤肉炭的客户中,75%也会购买打火机燃料」)。温曲先生指出,这些功能是连续发生的:「并没有一位统计师在那里跑来跑去的说:「你知道这件事吗?」这个过程事实上是我们业务的一部份。」
(2)找出模式
温曲先生的说法是,由于Data Mining的贡献,「我们找出了超过人类概念范围的关连性。」例如Intelligent Miner发现某一种乳酪产品虽然销售额排名第209,可是消费额最高的客户中有25%都常常买这种乳酪,这些客户可是英国Safeway最不想得罪的客户。如果使用传统的分析方法的话,这种产品很快就会不卖了,可是事实上这种产品是相当重要的。 数据挖掘研究院
英国Safeway也发现在28种品牌的橘子汁中,有8种特别受到欢迎。因此该公司得以重新安排货架的摆设,使得橘子汁的销量能够增加到最大。「我可以举出数百种与客户购买行为有关的例子,」温曲先生指出:「这些信息实在是无价之宝。」
还有,英国Safeway在了解客户每次采购时会购买哪些产品以后,就可以利用Data Mining中的Sequence Discovery的功能,以侦测出长期的经常购买行为。再将这些资料与主数据库的人口统计资料结合在一起,Safeway的行销部门就可以根据每个家庭的「弱点」,也就是在哪些季节会购买哪些产品的趋势,发出邮件。「根据这些信息,」温曲先生指出:「我们在去年发出了一千两百万封完全根据个别状况设计的邮件,这在我们销售量的成长方面扮演了很重要的角色。」
有些Data Mining的结果会比较容易应用到实际上,有的则不然。针对这个事实,英国Safeway使用另外一种工具来筛选结果,也就是将Data Mining的结果再做Data Mining,以找出有显著兴趣的资料。这种工具虽然目前使用的人不多,可是等到Data Mining越来越普遍后,接受度应该会更高。
英国Safeway采取的Data Mining方式可能是很典型的。该公司把焦点集中在这种技术的商业利益上,保持资料的品质,设定实际的目标,而利用其结果时采取的步骤虽然小,但是实用。换句话说,实际的「Data Mining」只是较大规模的商业智能过程中的一小部份而已。 数据挖掘研究院
2.MCI通讯公司
与其它电话公司一样,MCI想要保有最多的顾客。方法之一就是及时找出可能考虑换到竞争公司的顾客。如果做得到这一点,该公司就可以设法留下客户,例如提供特别的费率和服务。
如何从数百万的顾客之中,找到你要维持的对象昵?MCI的办法是彻底搜寻1亿4千万笔市场家庭资料,而评估每一笔资料的属性,则高达一万个。这些特性包括收入、生活力式、过去通话习惯的详绌资料等。但是哪些特性的组合才是最需要观察的?且数据的范围要订在多少昵?帐单月费快速减少,可能代表顾客完全背公司而去了,但是我们可以从顾客的国际电话中找到更精微的模式吗?或从顾客打电话绐客户服务专线的次数找到模式?
为找出这个模式,MCI定期激活该公司的IBMSP/2超级计算机-该公司的资料仓储(data warehouse),以找出最显著的变项,并密切注意这个变项。到目前为止,在多次重复整理历史资料后,这台SP/2已经汇编出一套含22个详细而高度机密的统计性资料文件。MCI的信息主管LanceB.Boxer指出,没有资料挖采程序的话,不可能开发出任何统计资料文件。
3.USWest公司
和其它电话公司一样,它也希望能找出有家用第二和第三条电话线的强烈需求的家庭。这些需求是为了家中的青少年、传真设备和个人计算机。但是除非电话公司可以完全确定新增线路会产生实质的利益,否则他们是不会把钱投资在一些特别区域的网络总机和电话干线的。甚且,US West说,他们打算精确的找出特定顾客,这些顾客不仅接受公司提供的初级服务,而且会持续使用第二条电话线路,时间久到让公司获有利润。
为了找到这些人,US West使用一个叫做PALMS的程序。与该公司共同设计这套程序的有AT&T的NCR计算机部门,及拥有美国航空公司的AMR公司旗下的Sabre Decision Technologies部门。PALMS的执行平白是威力强大的NCR平行处理计算机。首先,PALMS过滤美国凤凰城地区域数千笔顾客记录的样本资料,这动作花了数小时。每笔家庭记录内含的项目高达250个:收入阶层、每月的电话费、去年维修记录,及该家庭尝试使用并保有如电话等候等服务的历史纪录。最后,得到一个理想的潜在客户统计模型。
然后,PALMS利用这个模型来搜寻数百万笔的顾客纪录-资料量几达一兆位。此程序在找出与其它资料的关系后,如每家的住址、US West的电话干线位置、各地总机的容量,即可辨识出一群潜在的顾客-这些家庭符合该幕式,且US West不必花费太多,就能够为这些家庭提供服务。
US West从1996年11月4日到1997年1月初,进行首波DM活动。这次活动的回复率很高,与花费数百万美元的广播活动不相上下。PALMS甚至能够计算出DM活动什么时候会达到高峰,让电话公司在回复率降低前,先行减少DM邮件。
4.UltraGem公司
在旧金山创立的UltraGem公司,一直和一家不具名的银行,共同预估可调利率抵押贷款的获利率。UltraGem的软件先分析十万笔以上的贷款记录。资料的范围包括:顾客的年龄和邮政编码、贷款的来源、以及以及此次贷款是否从前一次的贷款转换而来。结果:产生了一组规则,这组规则可辨识出可能是最高获利率的贷款申请。这些结合各种变项而产生的规则,「是人类智能无法计算出来的,」UltraGem董事长StevenA.Vere如此说到。现在,该银行能够预测诸如谁能提早还款、谁可能拖延付款等因素,而藉此调整不同的利率与手续费。
5.Wal-MartStores公司
由于该公司最先采用大量的交易资料厍,而改革了零售业。从1980年代起,Wal-Mart每晚从各分店收集了大量的收款机资料。但是,除了使用来自NCR公司强大的计算机,Wal-Mart一直无法使用所有的资料。面对7亿笔令人心生畏惧的潜在预测要计算-每一次计算2,700家分店个别的项目-迫使他们把店面按区域划分,产品类别而分。
去年,Wal-Mart已经把系统转换为由NeoVistaSolutions公司所提供的资料挖采系统。系统运用数百台处理器执行这项工作,协助Wal-Mart预测特定分店中,对某一单项产品的需求。而且它也改善了Wal-Mart「巿场-购物篮」分析的正确性。「市场一购物篮」分析的目的,在查看顾客上门时,倾向购买的产品组合。

