关联分析常用于发现大型数据集中项目之间的隐含关联,发现的关联可以用关联规则的形式表示。关联规则常用于寻找新的交叉销售机会。关联2A 使用了两种经典的关联分析算法 Apriori 和 FP-Growth,来帮助您寻找数据集中项目之间的关联规则。
例如,从销售数据中发现的规则 {意式面食} ⇒ {虾} 意味着购买意式面食的顾客也可能购买虾。 此信息可用作营销决策的基础,例如产品推荐、促销定价和产品放置。
Apriori 算法:
关联分析首先需要找到频繁项集,然后利用这些频繁项集获取关联规则。Apriori 算法是最著名的频繁项集挖掘算法之一,常用于推荐系统和购物篮分析。
FP-Growth 算法:
FP-Growth 算法是另一种流行的挖掘频繁项集的算法。FP-Growth 算法基于 Apriori 算法原理,但是使用了一种叫做 FP-tree 的方法来寻找频繁项集。FP-Growth 算法在处理大型数据集时通常表现出更高效的性能。
对于某些类型的数据集,FP-Growth 算法比 Apriori 算法执行得更快。您可以使用这两种算法运行您的数据集,并选择执行速度更快的一种。