频繁模式挖掘

  • 比如“尿布与啤酒的故事”,尿布与啤酒的经常一同出现便是一组频繁模式,还有例如购物篮数据分析、交叉购物、DNA序列分析、预测分析。
  • 经典的频繁模式挖掘包括Apriori算法、fpgrowth算法、AGM算法、PrefixSapn算法等等…
  • 使用命令:mahout fpg来进行频繁模式挖掘
    mahout-fpg-命令参数

聚类和分类

  • 我的理解聚类就是将大致相似的东西放在一起,还可再聚类。分类就是很明确的分清楚这是什么
  • 还有很多很多东西,比如构建一个推荐引擎,这里暂时不讲
文章目录
  1. 1. 频繁模式挖掘
  2. 2. 聚类和分类

Sides

IT技术分享博客