00 DSpace/Manakin Repository

Using the Minimum Spanning Tree Problem For Data Mining

Показати скорочений опис матеріалу

dc.contributor.author Dymova, Hanna
dc.date.accessioned 2024-05-29T11:35:22Z
dc.date.available 2024-05-29T11:35:22Z
dc.date.issued 2024
dc.identifier.citation Dymova H. Using the Minimum Spanning Tree Problem For Data Mining. Таврійський науковий вісник. Серія: Технічні науки / Херсонський державний аграрно-економічний університет. Херсон: Видавничий дім «Гельветика», 2024. Вип. 1. C. 47-53. DOI: https://doi.org/10.32782/tnv-tech.2024.1.5, https://journals.ksauniv.ks.ua/index.php/tech/article/view/538/500 ru
dc.identifier.uri http://hdl.handle.net/123456789/9432
dc.description Стаття присвячена спробі визначення кластерів за допомогою оптимізаційної задачі про мінімальне остовне дерево. Проблема задачі кластеризації полягає в групуванні подібних об'єктів у множину кластерів таким чином, щоб об'єкти всередині одного кластера були схожі між собою, а об'єкти між різними кластерами були відмінними. Одним із підходів до розв'язання цієї проблеми є використання задачі про мінімальне остовне дерево. Ідея використання задачі про мінімальне остовне дерево для кластеризації полягає в тому, щоб побудувати дерево, яке з'єднує всі об'єкти, де ваги ребер відповідають відстаням між об'єктами. Потім, за допомогою деякого методу обрізання, можна видалити певну кількість ребер, щоб розділити дерево на кластери. Для цього необхідно видалити найбільш довгі ребра, щоб розділити дерево на окремі компоненти, які відповідають кластерам. Цей підхід може бути особливо ефективним у випадках, коли необхідно мінімізувати збіги: мінімальне остовне дерево об'єднує вершини з найменшими відстанями, тобто вершини, які найбільше схожі одна на одну, будуть розташовані поруч. Це допомагає зменшити кількість збігів у кластерах та поліпшити якість кластеризації. Мінімальне остовне дерево може бути легко інтерпретоване, оскільки воно показує найближчі зв'язки між вершинами, це дозволяє зрозуміти, які групи даних схильні до групування разом. Він також може бути корисним у випадках, коли маємо справу з великими обсягами даних, оскільки алгоритми побудови мінімального остовного дерева мають низьку обчислювальну складність. Мінімальне остовне дерево дозволяє ігнорувати шум у даних, оскільки він будує з'єднання між найближчими точками, і шумові дані зазвичай будуть далеко від інших точок, а також дозволяє природним чином визначити кількість кластерів. Кількість кластерів відповідає кількості ребер у мінімальному остовному дереві після видалення найбільш довгих ребер. Однак, варто враховувати, що цей підхід може не завжди бути найкращим для всіх типів даних і вимагає уважного аналізу та налаштування параметрів для кожного конкретного випадку. ru
dc.description.abstract The article is devoted to an attempt to determine clusters using the optimization problem of a minimum spanning tree. The problem of the clustering problem is to group similar objects into many clusters in such a way that objects within one cluster are similar to each other, and objects between different clusters are different. One approach to solving this problem is to use the minimum spanning tree problem. The idea of using the minimum spanning tree problem for clustering is to build a tree connecting all the objects, where the weights of the edges correspond to the distances between the objects. Then, using some pruning technique, a certain number of edges can be removed to divide the tree into clusters. To do this, it is necessary to remove the longest edges in order to divide the tree into individual components corresponding to clusters. This approach can be especially effective in cases where it is necessary to minimize overlaps: a minimum spanning tree combines vertices with the smallest distances, that is, the vertices that are most similar to each other will be located next to each other. This helps reduce the number of matches in clusters and improve the quality of clustering. A minimum spanning tree can be easily interpreted because it shows the closest connections between vertices, which allows us to understand which groups of data tend to cluster together. It can also be useful in cases where we are dealing with large amounts of data, since minimum spanning tree algorithms have low computational complexity. Minimum Spanning Tree allows you to ignore noise in the data because it builds a connection between nearby points and noisy data will usually be far away from other points, and also allows you to naturally determine the number of clusters. The number of clusters corresponds to the number of edges in the minimum spanning tree after removing the longest edges. However, be aware that this approach may not always be the best for all types of data and requires careful analysis and customization of parameters for each specific case. ru
dc.language.iso en ru
dc.publisher Таврійський науковий вісник. Серія: Технічні науки / Херсонський державний аграрно-економічний університет. Херсон : Видавничий дім «Гельветика», 2024. Вип. 1. ru
dc.relation.ispartofseries Таврійський науковий вісник. Серія: Технічні науки;вип. 1
dc.subject graph, minimum spanning tree, "greedy" algorithm, shortest path, clustering, data mining. ru
dc.subject граф, мінімальне остовне дерево, «жадібний» алгоритм, найкоротший шлях, кластеризація, інтелектуальний аналіз даних. ru
dc.title Using the Minimum Spanning Tree Problem For Data Mining ru
dc.title.alternative Використання задачі про мінімальне остовне дерево для інтелектуального аналізу даних ru
dc.type Article ru


Долучені файли

Даний матеріал зустрічається у наступних фондах

Показати скорочений опис матеріалу