Земляна проказа: методологія. Як ми навчили комп'ютер шукати локації нелегального видобутку бурштину
Ми підготувати детальний опис того, як робили наш проект "Земляна проказа", котрий показує переважну більшість місць із нелегального видобутку бурштину. Це найбільш повний перелік з нам відомих. Метод, який ми застосували, можна використати для пошуку будь яких інших цікавих об'єктів, які можна роздивитись на зображеннях, зроблених з космосу.
Детальний опис методології читайте на сторінці Текстів на github. Там само знаходяться зразки комп’ютерного коду, який можна використати у своїх проектах.
Декілька цікавих фактів про методологію:
- Більшість супутникових зображень, які ми використали, ми взяли з карт Bing Maps (сервіс Microsoft): для території можливого видобутку бурштину, тобто, для Волинської, Рівненської, та Житомирської областей, цей провайдер надає найбільш детальні та свіжі зображення (більшість знімків зроблено у 2015 році). Тому карта, яку ви бачите, містить сліди видобутку бурштину станом на 2015 рік (один із найбільш активних років видобутку).
- Для того, щоб перевірити всю потенційну територію (це ~70,000 км2), найпотужніший в редакції комп’ютер обробив близько 450,000 зображень. На це пішло близько 100 годин часу.
- Після того, як ми знайшли місця видобутку на зображеннях, ми оцінили площу враженої території. За нашими підрахунками, від видобутку постраждало щонайменше 1,000 гектарів території. За офіційними даними - трохи більше 5,000 гектарів. Не виключено, що офіційна оцінка дещо перебільшена. Однак напевне це можна буде стверджувати після того, як відбудеться чергове оновлення космічних знімків. Ще одне припущення - офіційні структури можуть завищувати цифру, щоб отримати більше грошей з бюджету на відновлення постраждалої території.
- Початкові місця видобутку бурштину нам допомогли знайти учасники Open Data Day Kyiv.
- У першому варіанті моделі ми помилково прийняли території деяких вирубок, на місці яких залишалися ями, за місця видобутку бурштину.
- Нейронна мережа, яку ми використали для нашої моделі, була початково натренована з використанням звичайних об’єктів, що часто зустрічаються на фото: тобто, на котиках, песиках, машинах, посуді, квітах. Але цього було достатньо, щоб вибирати характерні особливості зображень з супутникових знімків регіону, таких як ділянки лісу, поля, річки, будинки.
Нагадаємо, що повністю проект можна побачити за цим посиланням:
http:/