ПІДХОДИ ДО ПАРСИНГУ НЕСТАНДАРТНО ОРГАНІЗОВАНИХ ГЕОМЕТРИЧНИХ ДАНИХ

  • М.Ю. Морозова Національний технічний університет «Харківський політехнічний інститут» https://orcid.org/0009-0004-2795-9315
  • О.С. Сидоренко Національний технічний університет «Харківський політехнічний інститут» https://orcid.org/0000-0002-5506-498X

Анотація

Статтю присвячено дослідженню проблеми структурного розриву між нестандартно організованими наборами геометричних даних та вимогами програмних інструментів статистичного аналізу. Здійснено огляд наукових джерел, дотичних темі роботи або суміжним напрямам. Описана у роботі методологія і підходи реалізовані на прикладі набору даних Canonical Polyhedra, що містить метричні та топологічні характеристики про 2907 багатогранників для середовища Wolfram Mathematica. Основною особливістю досліджуваного набору є його специфічна структура, а саме представлення просторових об’єктів не у вигляді традиційних таблиць, а у формі абстрактних синтаксичних дерев. У статті детально проаналізовано архітектуру набору: визначено основні вузли даних, а також виділено символьні математичні записи, що потенційно можуть викликати труднощі в парсингу. У наборі даних деякі характеристики геометричних фігур представлені не числовим, а символьним записом. Це забезпечує абсолютну математичну точність даних, проте робить їх непридатними для автоматизованих обчислень без попередньої трансформації. Таким чином, додатково обґрунтовано неспроможність аналізу набору за допомогою базових програмних бібліотек для роботи з даними. Основу методології дослідження складає практична розробка рекурсивного алгоритму парсингу на прикладі конкретного набору даних. Опис алгоритму подано в універсальному загальному вигляді, що робить його доступним для подальшого застосування серед ширшого кола питань. У роботі описано логіку обходження вузлів синтаксичного дерева, ідентифікацію їхніх заголовків і нормалізацію типів даних. Результатом такого підходу є перетворення абстрактного синтаксичного дерева у нормалізовану таблицю, придатну для подальшого статистичного аналізу. Практична значущість дослідження полягає у виділенні універсальних підходів до парсингу складних вкладених ієрархій даних, що часто є джерелом цінної інформації про просторові геометричні фігури для їхнього подальшого вивчення і застосування у галузях обчислювальної геометрії, машинного навчання тощо.

Ключові слова: набір даних, статистичний аналіз, парсинг, система комп’ютерної математики, багатогранник.

Завантаження

Дані завантаження ще не доступні.
Опубліковано
2026-05-30
Як цитувати
Морозова , М., & Сидоренко , О. (2026). ПІДХОДИ ДО ПАРСИНГУ НЕСТАНДАРТНО ОРГАНІЗОВАНИХ ГЕОМЕТРИЧНИХ ДАНИХ. Сучасні проблеми моделювання, (29), 210-219. https://doi.org/10.33842/2313-125X-2026-29-210-219