Держоргани зволікають з оприлюдненням наборів відкритих даних із оновленої Постанови КМУ №835
П’ятого червня 2019 року набули чинності зміни до Постанови КМУ № 835 «Про затвердження Положення про набори даних, які підлягають оприлюдненню в формі відкритих даних». Уряд розширив перелік наборів з 616 до 887, запровадив щорічну оцінку роботи розпорядників, посилив контроль якості даних через премодерацію. Texty.org.ua за підтримки проекту USAID / UK aid «Прозорість та підзвітність у державному управлінні та послугах» та Державного агентства з питань електронного урядування України проводять щомісячний моніторинг виконання нової редакції постанови центральними органами влади. Результати моніторингу за червень можна переглянути за посиланням. Цього місяця, крім аналізу динаміки оприлюднення датасетів, ми приділимо увагу якості відкритих даних.
Автори: Богдан Тишкевич — аналітик, Texty.org.ua, Катерина Оніліогву — керівник напряму відкритих даних проекту «Прозорість та підзвітність у державному управлінні та послугах», інфографіка — Надя Кельм
У період з 5 липня по 5 серпня 2019 року центральні органи оприлюднили всього 8 нових наборів даних. Це один з найнижчих показників за весь час нашого моніторингу. Таким чином, рівень виконання Постанови КМУ №835 майже не змінився і становить 42% (339 наборів з 800). 14 розпорядників оприлюднили всі набори на data.gov.ua, 31 — щонайменше 1, а 21 — жодного.
Серед оприлюднених наборів є чимало цінних. Зокрема, МВС відкрило два розшукові реєстри, серед них інформація про викрадені, втрачені мобільні телефони. Відновилася публікація реєстру корупціонерів. Нагадаємо, в новій редакції Постанови КМУ №835 цей набір перейшов у відання НАЗК. Із червня він не оновлювався Мін’юстом. Минулого тижня на цей факт звернув увагу OpenDataBot. Згодом НАЗК відреагувало, і публікація набору відновилася. На data.gov.ua з’явилися нові ліцензійні рестри: спеціальні дозволи на користування надрами від Держгеонадр і ліцензії на промисловий вилов водних біоресурсів за межами юрисдикції України від Держрибагентства.
Як і раніше, жодного з окремо визначених у Постанові наборів не оприлюднили МОЗ, МОН, Мінкультури, Мінрегіон, МТОТ, Держлікслужба, Держпраці, Держпродспоживслужба, Держкіно, Національне агентство із забезпечення якості вищої освіти, Національне агентство України з питань державної служби, Державне агентство України з управління зоною відчуження, Державна регуляторна служба України, НАБУ, АТ «НАК Нафтогаз України», Вища кваліфікаційна комісія суддів, Вища рада правосуддя, Український гідрометеорологічний центр та деякі інші розпорядники.
Якість відкритих даних
Якість відкритих даних оцінюється за багатьма параметрами. Ми проаналізували три ключові з них: (1) дотримання частоти оновлення наборів, (2) формати, яким віддають перевагу розпорядники, (3) використання стандартів даних.
Дотримання частоти оновлення. Станом на 5 серпня, серед 826 наборів даних, оприлюднених центральними органами влади, 81 є несвоєчасно оновленим. Найбільше невчасно оновлених наборів мають Держенергоефективності (5) і Морська адміністрація (4). Переважна більшість держоранів не має проблем зі своєчасним оновленням датасетів. Разом із цим існують і деякі негативні тенденції. Третина наборів має частоту оновлення відразу після внесення змін. За таких умов складно визначити, актуальні дані, чи ні. Інша третина має частоту оновлення щопівроку та рідше. При визначенні частоти оновлення наборів важливо враховувати, що дані, які частіше оновлюються, мають вищу цінність.
Використання форматів. З часу впровадження нової версії data.gov.ua, Державному агентству з питань електронного урядування України вдалося позитивно вплинути на якість оприлюднених наборів. Завдяки премодерації, частка наборів у текстових форматах знизилась з майже з 14 до 3%, зникли набори в графічних форматах та Macromedia Flash. Саме дані в таких форматах є найменш придатними для перевикористання.
Багато наборів досі лишаються слабко структурованими: розпорядники використовують в таблицях заголовки, об’єднані комірки, примітки, форматування. Важливо підвищувати інтероперабельність даних (можливість поєднувати дані з різних джерел). Наприклад, останній набір Морської адміністрації, Перелік баз для стоянки маломірних (малих) суден, містить структуровані дані у машиночитаному форматі. Однак, він не включає ідентифікаторів компаній — власників стоянок. Через це дані набору неможливо поєднати з будь-яким іншим рестром.
Стандартизація атрибутів (колонок таблиць). Портал відкритих даних — надзвичайно потужний інструмент. Дані з будь-якої таблиці, що завантажена на data.gov.ua, можна легко отримати через API порталу. Іншими словами, розпорядник може завантажувати дані в зручному для себе табличному форматі (наприклад, XLSX), портал оброблюватиме таблиці.
Розробники отримуватимуть ці ж самі дані за запитами в форматі JSON. Це надзвичайно зручно для обох сторін. Однак, для цього розпорядники мають дотримуватися кількох вимог:
таблиці мають містити добре структуровані дані;
назви колонок (атрибути) мають бути представлені латинкою без пробілів та знаків пунктуації.
Наразі таких наборів на порталі всього 48 з 826. Найбільше їх оприлюднило Міненерговугілля (9), Морська адміністрація (5), Держводагентство, Національна комісія з цінних паперів та фондового ринку (4).
Ключовою відмінністю впровадження третьої редакції Постанови КМУ №835 від попередніх є те, що відтепер якість оприлюднених наборів контролюється модераторами порталу. Це створює додаткові виклики для розпорядників, але водночас дає можливість громадськості та бізнесу отримати якісніші дані. Тепер розпорядники мають всього місяць, щоб оприлюднити більше половини наборів даних, і вже незабаром ми підіб’ємо підсумки виконання третьої редакції Постанови КМУ №835.