УЗАГАЛЬНЕНИЙ ПІДХІД ДО ВИБІРКОВОГО ПОШУКУ ОБ’ЄКТІВ НА ЗОБРАЖЕННЯХ
Анотація
Роботу присвячено процесу дослідження та розробці власного підходу для розпізнавання обʼєктів на зображеннях у випадках вибіркового пошуку. У сучасному світі у сфері комп’ютерного зору та обробки зображень, розпізнавання об’єктів є одним із найважливіших напрямків досліджень. Застосування нейронних мереж, таких як YOLO (You Only Look Once) та R-CNN (Region-based Convolutional Neural Network), виявилося дуже ефективним у вирішенні цієї задачі. Ці алгоритми здатні знаходити об’єкти на зображеннях та повертати обмежувальні рамки, які точно описують ці об’єкти. Однак, у деяких випадках, коли ми працюємо з інтерактивними програмами, наприклад, обираємо об’єкт, клацаючи або торкаючись розпізнаної області, виникає проблема вибору правильного об’єкта та його обмежувальної рамки. Це може вплинути на точність визначення обраного об’єкта в контексті вибіркового пошуку. Виникає необхідність знайти таку область пошуку, яка дозволить нам належним чином визначити обраний об’єкт, особливо у випадку перетину обмежувальних рамок. Ефективний підхід до визначення розміру області пошуку та візуалізація процесу дослідження можуть покращити точність і швидкість вибору об’єктів, забезпечуючи більш зручний та ефективний пошук об’єктів на зображеннях. Ми пропонуємо вирішення проблеми перетину обмежувальних рамок, що виникає при роботі нейронних мереж типу YOLO та R-CNN, розробивши метод оцінки оптимального розміру області пошуку, який дозволить знайти відповідний об’єкт та його обмежувальну рамку та пропонуємо узагальнений підхід до візуалізації процесу дослідження, що дозволить наочно представити перекриття обмежувальних рамок та полегшить вибір оптимального об’єкта. Для підтвердження ефективності запропонованого методу ми проводимо експерименти на відповідному наборі даних та порівнюємо їх. Результати таких досліджень можуть мати значний практичний вплив на розробку систем розпізнавання об’єктів і покращення їх функціональності в цілому. Майбутні дослідження можуть фокусуватися на розширенні набору даних для випадків вибіркового пошуку, включаючи різні сценарії перекриття обмежувальних рамок та об’єктів з різною формою та розмірами.
Ключові слова: Дрони, вибірковий пошук обʼєктів, обмежувальні рамки, нейронні мережі, YOLO, R-CNN, алгоритм розпізнавання.