У Києві тести щодо COVID-19 роблять найповільніше. Яка швидкість тестування в усіх областях?
Аналіз даних дає можливість визначити, в яких регіонах України спливає найбільше часу між реєстрацією нового випадку та його підтвердженням (після позитивного результату ПЛР-тесту). На графіку — ситуація за останні три тижні.
Під час роботи над нашим інтерактивним проєктом про перебіг COVID-19 в областях потрібно було вирішити таку задачу: з якою затримкою результати тестів потрапляють в офіційну "статистику" від Національної Служби Здоров'я України? Ця затримка пов'язана (головним чином) із часом, який знадобиться, щоб провести тестування.
Нижче для кожної області ви можете побачити розподіл кількості днів, необхідних для того, щоб отримати результат тесту. Наприклад, для м. Київ (де ситуація наразі найгірша) результати через один день після тесту отримує менше ніж 20% людей, тоді як в Тернопільській області — майже 100% людей отримують результат в перший день (ситуація найкраща). Відповідно, середній час очікування для Києва становить близько 4 днів (3.68, як видно на графіку), а для Тернополя такий час дорівнює одному дню.
Отже, як видно з графіка, найповільніше результати тестів з'являються у м. Києві та Київській області, а також на Закарпатті, Миколаївщині, Львівщині та в Івано-франківській і Рівненській областях. У Миколаєві дуже незвичний розподіл: після першого дня з'являється результат лише 10% тестів, зате на другий день — одразу ще 80%.
Чернівецька, Одеська, Вінницька та Житомирська області, враховуючи значну загальну кількість хворих, тестують доволі успішно — приблизно за 1.5 дні. Найдивніші — Донецька та Луганська області: для них в перший день майже завжди з'являється більше хворих, ніж в остаточному результаті — але вже починаючи з другого дня це число трохи зменшують.
Наші висновки для різних регіонів значною мірою збігаються з якісною оцінкою швидкості тестувань з інших джерел — наприклад, звідси.
Трохи технічних подробиць про те, як ми визначали затримку результатів тестування для кожної області. НСЗУ публікує свої дані щодня приблизно в обід. Результати викладають за попередню дату. Для кожної дати вони дають кількість хворих, яким був проведений тест станом на цю дату ( і результат якого виявився позитивним). Однак якщо ми говоримо, наприклад, про дату тестування 24 червня, то (сьогодні, 26 червня) пройшло лише два дні. Не для всіх пацієнтів, яким робили тест 24-го, вже відомий результат — лише для якоїсь частини. Ця кількість сьогодні, 26.06.2020, є в даних НСЗУ. Однак, завтра результатів буде більше, і це число — кількість хворих за 24 червня — буде збільшене. І така корекція може тривати доволі довго — в деяких випадках це можуть бути тижні. Втім, зазвичай найбільші зміни відбуваються в перші два-три дні.
Отже, якщо щодня записувати кожну поточну версію даних по хворим, то згодом — коли мине, наприклад, два тижні — можна буде порахувати, скільки нових хворих з датою тестування 24-го червня додалося 25 червня, 26-го і так далі, і порахувати частку від загальної кількості хворих. Наприклад: в перший день після тестування додалося 50% результатів, у другий — 30%, у третій — 20%. Згодом ми можемо побачити, що число перестає змінюватися: це означає, що всі результати тестів отримані, і таким чином ми можемо визначити затримку по днях: очікування результатів для 50% тестувань тривало один день, для 30% — два дні, для 20% — три дні (це лише приклад — в дійсності відсотки будуть відрізнятися). Саме так ми порахували тривалість тестувань для кожної області, які ви побачили на графіку.
Через те, що НСЗУ щоденно публікує дані на платформі github, яка зберігає всі модифіковані версії файлів, технічно зробити це було нескладно.