Методология как выбрать задачу кластеризации для анализа данных раскрывает один из самых мощных подходов к неконтролируемому обучению, когда метки результатов заранее неизвестны. Кластеризация применяется в маркетинговой аналитике для сегментации клиентов, в биоинформатике для классификации генетических последовательностей и в системах рекомендаций для выявления схожих объектов. Материал показывает, как различные алгоритмы кластеризации работают с данными разной размерности и плотности, какие метрики качества использовать для оценки результатов и как избежать переобучения. Специалисты по анализу данных найдут здесь практические советы по выбору метода в зависимости от характера и объема данных. Овладение этими техниками позволит принимать обоснованные решения при разработке систем автоматической обработки информации.