Using the Minimum Spanning Tree Problem For Data Mining

Dymova, Hanna

dc.contributor.author	Dymova, Hanna
dc.date.accessioned	2024-05-29T11:35:22Z
dc.date.available	2024-05-29T11:35:22Z
dc.date.issued	2024
dc.identifier.citation	Dymova H. Using the Minimum Spanning Tree Problem For Data Mining. Таврійський науковий вісник. Серія: Технічні науки / Херсонський державний аграрно-економічний університет. Херсон: Видавничий дім «Гельветика», 2024. Вип. 1. C. 47-53. DOI: https://doi.org/10.32782/tnv-tech.2024.1.5, https://journals.ksauniv.ks.ua/index.php/tech/article/view/538/500	ru
dc.identifier.uri	http://hdl.handle.net/123456789/9432
dc.description	Стаття присвячена спробі визначення кластерів за допомогою оптимізаційної задачі про мінімальне остовне дерево. Проблема задачі кластеризації полягає в групуванні подібних об'єктів у множину кластерів таким чином, щоб об'єкти всередині одного кластера були схожі між собою, а об'єкти між різними кластерами були відмінними. Одним із підходів до розв'язання цієї проблеми є використання задачі про мінімальне остовне дерево. Ідея використання задачі про мінімальне остовне дерево для кластеризації полягає в тому, щоб побудувати дерево, яке з'єднує всі об'єкти, де ваги ребер відповідають відстаням між об'єктами. Потім, за допомогою деякого методу обрізання, можна видалити певну кількість ребер, щоб розділити дерево на кластери. Для цього необхідно видалити найбільш довгі ребра, щоб розділити дерево на окремі компоненти, які відповідають кластерам. Цей підхід може бути особливо ефективним у випадках, коли необхідно мінімізувати збіги: мінімальне остовне дерево об'єднує вершини з найменшими відстанями, тобто вершини, які найбільше схожі одна на одну, будуть розташовані поруч. Це допомагає зменшити кількість збігів у кластерах та поліпшити якість кластеризації. Мінімальне остовне дерево може бути легко інтерпретоване, оскільки воно показує найближчі зв'язки між вершинами, це дозволяє зрозуміти, які групи даних схильні до групування разом. Він також може бути корисним у випадках, коли маємо справу з великими обсягами даних, оскільки алгоритми побудови мінімального остовного дерева мають низьку обчислювальну складність. Мінімальне остовне дерево дозволяє ігнорувати шум у даних, оскільки він будує з'єднання між найближчими точками, і шумові дані зазвичай будуть далеко від інших точок, а також дозволяє природним чином визначити кількість кластерів. Кількість кластерів відповідає кількості ребер у мінімальному остовному дереві після видалення найбільш довгих ребер. Однак, варто враховувати, що цей підхід може не завжди бути найкращим для всіх типів даних і вимагає уважного аналізу та налаштування параметрів для кожного конкретного випадку.	ru
dc.description.abstract	The article is devoted to an attempt to determine clusters using the optimization problem of a minimum spanning tree. The problem of the clustering problem is to group similar objects into many clusters in such a way that objects within one cluster are similar to each other, and objects between different clusters are different. One approach to solving this problem is to use the minimum spanning tree problem. The idea of using the minimum spanning tree problem for clustering is to build a tree connecting all the objects, where the weights of the edges correspond to the distances between the objects. Then, using some pruning technique, a certain number of edges can be removed to divide the tree into clusters. To do this, it is necessary to remove the longest edges in order to divide the tree into individual components corresponding to clusters. This approach can be especially effective in cases where it is necessary to minimize overlaps: a minimum spanning tree combines vertices with the smallest distances, that is, the vertices that are most similar to each other will be located next to each other. This helps reduce the number of matches in clusters and improve the quality of clustering. A minimum spanning tree can be easily interpreted because it shows the closest connections between vertices, which allows us to understand which groups of data tend to cluster together. It can also be useful in cases where we are dealing with large amounts of data, since minimum spanning tree algorithms have low computational complexity. Minimum Spanning Tree allows you to ignore noise in the data because it builds a connection between nearby points and noisy data will usually be far away from other points, and also allows you to naturally determine the number of clusters. The number of clusters corresponds to the number of edges in the minimum spanning tree after removing the longest edges. However, be aware that this approach may not always be the best for all types of data and requires careful analysis and customization of parameters for each specific case.	ru
dc.language.iso	en	ru
dc.publisher	Таврійський науковий вісник. Серія: Технічні науки / Херсонський державний аграрно-економічний університет. Херсон : Видавничий дім «Гельветика», 2024. Вип. 1.	ru
dc.relation.ispartofseries	Таврійський науковий вісник. Серія: Технічні науки;вип. 1
dc.subject	graph, minimum spanning tree, "greedy" algorithm, shortest path, clustering, data mining.	ru
dc.subject	граф, мінімальне остовне дерево, «жадібний» алгоритм, найкоротший шлях, кластеризація, інтелектуальний аналіз даних.	ru
dc.title	Using the Minimum Spanning Tree Problem For Data Mining	ru
dc.title.alternative	Використання задачі про мінімальне остовне дерево для інтелектуального аналізу даних	ru
dc.type	Article	ru

Файлы в этом документе

Имя: 538-Текст статті- ...

Размер: 510.8Kb

Формат: PDF

Открыть

Using the Minimum Spanning Tree Problem For Data Mining

Файлы в этом документе

Данный элемент включен в следующие коллекции

Поиск в DSpace

Просмотр

Весь DSpace

Эта коллекция

Моя учетная запись