[Data Science] Frequent Pattern Mining - Imporving Apriori
Apriori [Data Science] Frequent Pattern Mining - Apriori Apriori Challenges Apriori 알고리즘은 다음과 같은 문제점이 있다. 이 중 1, 2번 문제를 보완하기 위한 방법에 대해 소개하고자 한다. Transaction database scan이 여러 번 발생한다. → Scan 횟수를 줄여 효율을 높인다. Itemset join 시, 후보 (k+1)-itemset이 많이 나온다. → 후보 itemset 수를 줄여 효율을 높인다. 후보 itemset의 support를 계산하는 양이 많다. → 계산하는 알고리즘을 효율 좋은 알고리즘으로 바꿔 효율을 높인다. DIC: Dynamic Itemset Counting Reduce DB scanning ti..