Data Mining功能可包含下列五项功能:
1.分类(classification)
按照分析对象的属性分门别类加以定义,建立类组(class)。例如,将信用申请者的风险属性,区分为高度风险申请者,中度风险申请者及低度风险申请者。使用的技巧有决策树(decision tree),记忆基础推理(memory-based reasoning)等。
2.推估(estimation)
根据既有连续性数值之相关属性数据,以获致某一属性未知之值。例如按照信用申请者之教育程度、行为别来推估其信用卡消费量。使用的技巧包括统计方法上之相关分析、回归分析及类神经网络方法。
3.预测(prediction)
根据对象属性之过去观察值来推估该属性未来之值。例如由顾客过去之刷卡消费量预测其未来之刷卡消费量。使用的技巧包括回归分析、时间数列分析及类神经网络方法。
4.关联分组(affinity grouping)
从所有对象决定那些相关对象应该放在一起。例如超市中相关之盥洗用品(牙刷、牙膏、牙线),放在同一间货架上。在客户营销系统上,此种功能系用来确认交叉销售(cross-selling)的机会以设计出吸引人的产品群组。
5.同质分组(clustering)
将异质母体中区隔为较具同构型之群组(clusters)。同质分组相当于营销术语中的区隔化(segmentation),但是,假定事先未对于区隔加以定义,而数据中自然产生区隔。使用的技巧包括k-means法及agglomeration法。