КОМПОЗИЦИОННЫЙ ГЕОМЕТРИЧЕСКИЙ СПОСОБ АНАЛИЗА ИНФОРМАЦИИ И ЕГО ПРИМЕНЕНИЕ ПРИ РАБОТЕ С БОЛЬШИМИ ДАННЫМИ
Аннотация
В статье предложен композиционный геометрический способ анализа информации в больших дата сетах на этапе их первичной обработки и «очистки». Способ базируется на методах точечного исчисления Балюбы-Найдыша и является подготовительным этапом при использовании композиционного метода геометрического моделирования больших данных. Для эффективного анализа больших данных важно применение соответствующих алгоритмов сортировки по количеству в определенных кластерах (группах). В каждом кластере элементы-точки базы данных имеют одинаковые (в пределах определенного допуска на отклонение), характеристики-координаты, которые их определяют. Используя кластеры с большим количеством точек, можно определить ход процесса, выявить тренды его развития. Кластеры с относительно небольшим количеством точек, в результате анализа, могут быть исключены из рассмотрения, как такие, которые не влияют существенно на развитие ситуации. Представление (объектов) любой базы данных в виде точек, которые имеют, в количестве и качестве, координаты, в полной мере соответствуют их свойствам и характеристикам, будем называть композиционной геометризацией данных. Свойства данных могут быть совершенно разными по сути и содержанию. Во время геометризации базы данных методами композиционного геометрического моделирования применяются одновременно две системы координат. Первая - это трехмерная система координат объектного пространства, в котором происходит течение процесса. При этом, добавляется четвертая координата - это изменение времени. Вторая - это n-мерная система координат пространства параметров, в которой определяются координаты элементов базы данных, параметризируют свойства и характеристики каждого элемента. Процесс геометризации данных намного упрощает следующий этап работы - разработку композиционных геометрических моделей. В частности, минимальное использование машинного ресурса при работе с большими данными значительно удешевляет получение ценных выводов и прогнозов.
Ключевые слова: большие данные, очистка, первичная обработка, точечное БН-исчисление, композиционный метод геометрического моделирования.