IT网络文摘的软件学习笔记

学习就是力量

分类导航

机器学习实战 - 读书笔记(12) - 使用FP-growth算法来高效发现频繁项集

发布时间：2016年12月15日作者：文章转自网络，版权归原作者所有，反馈可立刻删除

前言

最近在看Peter Harrington写的“机器学习实战”，这是我的学习心得，这次是第12章 - 使用FP-growth算法来高效发现频繁项集。

基本概念

FP-growth算法
FP-growth算法的性能很好，只需要扫描两次数据集，就能生成频繁项集。但不能用于发现关联规则。
我想应该可以使用Apriori算法发现关联规则。
FP代表频繁模式（Frequent Pattern）。
条件模式基（conditional pattern base）。
条件模式基是以所查找元素项为结尾的路径集合。每一条路径其实都是一条前缀路径（prefix path）。
一条前缀路径是介于所查找元素项与树根节点之间的所有内容。

FP-growth算法 - 用途

快速生成频繁项集
在一批有共性的文章中找到经常出现的匹配词汇（共现词），并进一步发现关联规则。可以用于输入自动补全功能。
发现数据中的共性。比如，可以找到，哪类用户喜欢哪些文章。

核心算法解释

FP-growth算法：生成频繁项集

网友评论

更多精彩分享

学习是年轻人改变自己的最好方式-Java培训机构,青岛Java培训,青岛计算机培训,软件编程培训,seo优化培训,网络推广培训,网络营销培训,SEM培训,网络优化,在线营销培训,Java培训

学习是年轻人改变自己的最好方式