Аннотация на русском языке: В данной статье рассматриваются различные способы кластеризации текстов. Рассмотрен метод k средних, агломеративная кластеризация. Приведены способы оценки работы алгоритмов и показаны особенности кластеризации в реальном времени.
The summary in English: This article discusses various ways of text clustering. The method of k means, agglomerative clustering is considered. Methods for evaluating the operation of algorithms are presented and features of real-time clustering are shown.
Ключевые слова:
кластеризация текстов; метод k-средних; агломеративная кластеризация; точность; полнота; F-мера
Key words:
text clustering; k-means; agglomerative clustering; precision; recall; F-measure