Я

Як уряд відкриває дані: перший місяць виконання постанови

Кабінет Міністрів розширив перелік обов’язкових до публікації наборів даних. Органи влади мають три місяці, щоб виконати постанову. Ми дослідили, якими є перші результати виконання постанови та які проблеми виникають при публікації.

Автори: Катерина Оніліогву керівник напряму відкритих даних, проект "Прозорість і підзвітність у державному управлінні та послугах"; Богдан Тишкевич, Петро Боднар, аналітики Текстів.

Україна активно відкриває дані і вже досягла певних успіхів, про що свідчать міжнародні рейтинги. Попит на відкриті дані постійно росте, тому уряд удосконалює законодавство, щоб стимулювати максимальну відкритість через публікацію даних. 20 грудня 2017 року Кабмін ухвалив зміни до Положення “Про набори даних, які підлягають оприлюдненню у формі відкритих даних”, затвердженого Постановою №835, а з 9 лютого 2018 року вона вступила в дію.

Це один із основних документів політики відкритих даних в Україні, що є фундацією принципу "open by default". Постанова вдвічі розширила перелік обов’язкових для оприлюднення наборів даних на Єдиному державному веб-порталі відкритих даних. Органи влади мають три місяці на публікацію наборів даних із моменту введення в дію, і саме громадськість, яка на даний момент є головним користувачем відкритих даних, може виконати важливу функцію контролю виконання Постанови.

Скільки наборів уже оприлюдено?

Після першого місяця 218 із 558 (або 39%) наборів даних, передбачених змінами до постанови КМУ №835, опубліковані на data.gov.ua.

Хто поки є найкращими розпорядниками?

Вже після першого місяця 7 із 56 ЦОВВ впровадили зміни до постанови повністю і оприлюднили всі передбачені набори даних. Міністерство юстиції України та Національний банк України вже певний час є лідерами у відкритті даних серед ЦОВВ. Про це свідчить не тільки моніторинг, але й громадська оцінка. У вересні 2017 року на Open Data Awards Міністерство юстиції отримало Open Data Goverment Award, а НБУ було одним із ТОП-3 номінантів.

27 ЦОВВ виконали постанову частково, а 22 не виклали жодного набору даних. Важливо зазначити, що певні набори публікуються та постійно оновлюються ще з першої редакціії постанови. Також кожний ЦОВВ має різну кількість наборів для оприлюдення, тому не всі можуть показати швидкі результати та потребують довшого часу для публікації наборів.

Які проблеми виникають при публікації відкритих даних?

Якість відкритих даних залишається викликом для ЦОВВ. Спільною для всіх проблемою залишається невідповідність типів до форматів даних, мала частка наборів у машиночитаних форматах та некоректно оформлені ключові слова. Найбільш цінними для користувачів є саме структуровані та машиночитані дані. Тому такі проблеми ускладнюють використання даних громадськими організаціями та бізнесом, адже вони повинні витратити багато часу для очищення та організації цих даних.

Невідповідність форматів типам даних є однією з перших перешкод. Дуже часто структуровані дані (наприклад, реєстри, переліки, кадастри, довідники) публікуються в текстовому вигляді. Серед ТОП-10 розпорядників за кількістю опублікованих наборів даних у Мінінфраструктури та ДФС формати всіх наборів повністю відповідають їх типу. Натомість, у Держстату лише третина форматів відповідає типові, а у МОЗ та МЕРТу — близько половини.

Немашиночитані формати є суттєвою перешкодою для використання. Найбільш популярними форматами публікації відкритих даних серед розпорядників є файли MS Exсel. Формати .xls та .xlsx зустрічаються у понад третини наборів (34,2%), другий за популярністю csv — 19,7%, третій pdf – 12,9%. Загалом, у машиночитаних форматах викладена третина наборів даних (33,4%). Однак велика кількість csv-файлів, розміщені на порталі, не відповідають критеріям чистих даних і є перезбереженими таблицями Excel. Серед розпорядників, що оприлюднили найбільше наборів даних, найбільша частка машиночитаних форматів у ДФС та Мінюсту, відсутні — у Міненерговугілля та Держпродспоживслужби.

Неправильне оформлення ключових слів — найчастіше розпорядники не розділяють ключові слова належним чином або перекопійовують у рядок назви наборів даних. Із 217 оприлюднених наборів даних на data.gov.ua лише 27,6% містять коректно сформульовані ключові слова. Серед ТОП-10 ЦОВВ за кількістю оприлюднених на data.gov.ua наборів даних найбільш коректно ключові слова оформлені у НБУ, Мін'юсту та ДФС. Ключові слова потрібні для того, аби набори даних можна було об’єднати в тематичні групи, за якими користувачам їх легко знайти та ідентифікувати. Саме тому як ключові слід використовувати короткі слова, які в загальній формі описують зміст набору даних.

Висновок

Для покращення якості виконання постанови ті ЦОВВ, що вже відкривають або планують відкривати дані, насамперед повинні думати про потенційних користувачів цих наборів, адже набори набагато цінніші, коли вони якісні, доступні та машиночитані. Важливо також комунікувати з потенційними користувачами та донести інформацію про цінний набір даних до всіх зацікавлених осіб.

Значна частина наборів даних залишаються невикористаними з тієї простої причини, що потенційні користувачі не знають про їхнє існування. Розпорядник може та має докласти зусиль до поширення інформації про оприлюднений набір даних і таким чином посприяти залученню журналістів, аналітиків та розробників до його використання. Після публікації слід також підтримувати зв’язок із користувачами та брати до уваги зворотний зв’язок щодо якості наборів. Ще одна тактика, що використовується за кордоном для покращення якості даних, − це "dog feeding", коли органи використовують свої опубліковані набори та тестують, наскільки вони придатні до користування.

Попереду ще два місяці, протягом яких виконавці оновленої Постанови №835 мають опублікувати свої дані відповідно до вимог і потреб громадськості.

Файл із первинними даними та розгорнутою статистикою доступний за посиланням.

835 постанова цовв кабмін моніторинг реформи набори даних інфографіка відкриті дані уряд

Знак гривні
Знак гривні