№ 16 (192), выпуск 5Страницы 48 - 57

Параллельный алгоритм решения задачи анализа рыночной корзины на процессорах CELL

К.С. Пан, М.Л. Цымблер
В работе рассматривается задача глубинного анализа данных - задача нахождения часто втречающихся наборов товаров. Предложен параллельный алгоритм, адаптированный для вычислительных систем на базе процессоров с архитектурой Cell Broadband Engine. Представлены результаты вычислительных экспериментов, показывающие эффективность предложенного алгоритма.
Полный текст
Ключевые слова
глубинный анализ данных (data mining), анализ рыночной корзины, Cell.
Литература
1. Agrawal, R. Mining Association Rules between Sets of Items in Large Databases / R. Agrawal, T. Imielinski, A.N. Swami // Proceedings of the 1993 ACM SIGMOD International Conference on Management of Data. P. 207-216.
2. IBM Corporation. Cell Broadband Engine technology. URL: http://www.alphaworks.ibm.com/topics/cell (дата обращения: 01.06.2009).
3. Buehrer, G. Data Mining on Cell Broadband Engine / G. Buehrer, S. Parthasarathy, M. Goyder // Proceedings of the 22nd International Conference on Supercomputing. 2008. P. 26-35.
4. Zaki, M.J. Parallel and Distributed Association Mining: A Survey // IEEE Concurrency. October 1999. Vol. 7. No. 4. P. 14-25.
5. Zaki, M.J. Parallel data mining for association rules on shared-memory multi-processors / M.J. Zaki, M. Ogihara, S. Parthasarathy, W. Li // Proceedings of the 1996 ACM/IEEE conference on Supercomputing. 1996. Article No. 43.
6. Duan, R. Data Mining Algorithms on the Cell Broadband Engine / R. Duan, A. Strey // Proceedings of the 14th International Euro-Par Conference. 2008. P. 665-675.
7. Han, S. Scalable Parallel Data Mining for Association Rules / S. Han, G. Karypis, V. Kumar // IEEE Transactions on Knowledge and Data Engineering. Vol. 12. Issue 3. P. 337-352.
8. IBM Cell Broadband Engine SDK, Version 3.0 documentation. URL: http://www-01.ibm.com/chips/techlib/techlib.nsf/products/IBM_SDK_for_Multicore_Acceleration (дата обращения: 01.06.2009).
9. Bodon, F. A fast APRIORI implementation // Proceedings of the IEEE ICDM Workshop on Frequent Itemset Mining Implementations (FIMI'03). Vol. 90. Melbourne. 2003.
10. Visualization of Navigation Patterns on a Web Site Using Model Based Clustering. Technical Report MSR-TR-00-18. Microsoft Research. 2000. / I. Cadez, D. Heckerman, C. Meek, at al. URL: http://research.microsoft.com/pubs/69752/tr-2000-18.pdf (дата обращения: 13.12.2009).