[Data Science] Frequent Pattern Mining - FP-Growth
Motivation Apriori 알고리즘 및 향상법에 대해 candidate-generation와 test 프로세스가 대부분의 시간을 잡아먹는다. (bottle neck) 그렇다면 candidate generation을 안 하면 되는 거 아닌가? FP-Growth Main Idea Local frequent item을 가지고 더 긴 frequent pattern을 찾아내자..! 예를 들어, 'A'가 frequent pattern이라고 가정한다면, 'A'를 가지고 있는 모든 transaction을 DB|A라고 하자. 만약 DB|A에서 'B'가 local frequent pattern라면 'AB'는 frequent pattern이다. DB|AB에서 recursive하게 반복... 즉, 계속 길이를 grow..