Хто зриває виконання Постанови Кабміну про відкриті дані? Моніторинг “Текстів”
Виконання Постанови Кабміну про відкриті дані під загрозою зриву. 21 квітня спливає шестимісячний термін, відведений органам державної влади на публікацію на Порталі відкритих даних, зазначених у Постанові наборів інформації.
Станом на 2 квітня 2016 року на порталі відкритих даних було доступно 126 наборів даних із необхідних 302, тобто лише 41,7 % від потрібної кількості. Дванадцять відомств не опублікували жодного набору даних із зазначених у Постанові.
Дослідження: Андрій Газін, Марія Щурська
Для збільшення клікайте на зображення
Важливе зауваження - тут ми оцінюємо лише ті набори даних, які підлягають оприлюдненню відповідно до Постанови. І не оцінюємо так звані “типові” набори даних, себто однакові для всіх розпорядників даних. Отже, якщо хтось опублікував типовий або не зазначений у Постанові набір даних, - молодці, але це не є предметом нашого інтересу.
Тому не дуже радійте, коли бачите, що на Порталі відкритих даних опубліковано вже 512 наборів даних. Значна частка з цього - саме типові набори даних, які не представляють великого інтересу. Також зауважте, що значна частина з опублікованих наборів даних - дуже низької якості і не відповідає самому визначенню “відкритих даних”. Держагентство з електронного урядування веде з розпорядниками роз’яснювальну роботу, але на швидкий результат тут розраховувати не варто.
Оцінка кількості опублікованих наборів даних
Лише чотири відомства опублікували всі необхідні набори даних на Порталі: Верховна рада України (3 з 3 наборів даних), Міністерство молоді і спорту (8 з 8 наборів даних), Національна комісія, що здійснює державне регулювання у сферах енергетики та комунальних послуг (1 з 1 набору даних), Міністерство культури (4 з 4 наборів даних).
Верховна рада та НКРЕКП опублікували всі набори даних у машиночитаних форматах, Міністерство молоді та спорту опублікувало 3 набори даних у машиночитаних форматах і 5 наборів даних у немашиночитаних форматах, а Міністерство культури опублікувало 2 набори даних у машиночитаних форматах і 2 набори у немашиночитаних форматах.
Відомства, які не виклали жодного набору даних з обов’язкових до оприлюднення відповідно до Постанови: Міністерство фінансів, Державна реєстраційна служба, Міністерство освіти і науки, Держрибагентство, Міністерство закордонних справ, Міністерство юстиції, Міністерство охорони здоров’я, Міністерство аграрної політики та продовольства, Держветфітослужба, Національна комісія, що здійснює державне регулювання у сферах енергетики та комунальних послуг, Національна рада, України з питань телебачення і радіомовлення, Вищий господарський суд.
Оцінка якості опублікованих наборів даних
З 126 опублікованих наборів даних у структурованих форматах (CSV, XML, JSON) доступні 65.
Найпоширенішими помилками розпорядників даних є публікація наборів даних у не призначених для структурованих даних файлових форматах PDF і DOC(X), або ж публікація даних у немашиночитаному вигляді (наприклад, у форматах CSV та XLS(X), але з об’єднаними комірками).
Також присутні набори даних у невалідних файлових форматах. Так, Міністерство внутрішніх справ опублікувало набори даних у файлових форматах JSON, котрі не підлягають автоматичній обробці через помилки в структурі файлу (відсутність квадратних дужок на початку та в кінці, а також відсутність роздільникових ком між елементами).
Як ми оцінювали?
Дослідження враховує лише ті набори даних, які зазначені в Постанові для кожного окремого розпорядника. Себто, поза межами дослідження лишаються так звані типові набори даних, які мають опублікувати всі розпорядники, а також ті набори даних, які не зазначені в Постанові, але опубліковані на Порталі. За межами аналізу також лишилась публікація наборів даних у відповідних розділах на офіційних сайтах міністерств і відомств.
Для оцінки опублікованих наборів даних застосовувались наступні критерії:
- наявність набору даних (опублікований набір на порталі чи ні).
- відповідність файлового формату типу даних. Наприклад, чи структуровані дані публікуються у відповідних файлових форматах - (X)HTML, RDF, XML, JSON, CSV, XLS(X), ODS, YAML;
- машиночитаність набору даних. Тут дві складових - 1) чи файловий формат набору даних дозволяє його автоматичну обробку; 2) чи спосіб структурування даних у файлі дозволяє їх автоматичну обробку - себто, чи не містять таблиці об’єднаних комірок;
- наявність структури даних. Структура набору відкритих даних має включати елементів набору даних, їх формат, параметри та призначення. Структура повинна оприлюднюватись у форматах XSD, JSON, CSV або у аналогічних форматах.
Проект здійснено за підтримки «Ініціативи з розвитку аналітичних центрів в Україні», яку виконує Міжнародний фонд «Відродження» (МФВ) за фінансової підтримки Посольства Швеції в Україні (SIDA) та фонду NED.
Думки та позиції, викладені у цій публікації, є позицією автора та не обов'язково відображають позицію уряду Швеції.