В

Виняткове й буденне: 144 години у Києві. Аналіз фото з Інстаграму у останні дні Революції Гідності.

Розпочнемо з візуалізації всіх 13 208 зображень, що були поширені 6165 користувачами Instagram у центральній частині Києва, впродовж 17-22 лютого 2014.

Фото аналізував: Everyday.net, переклад Юрій Малахов

Ми розмістили зображення на площині у відповідності до дати та часу публікації (Позначки часу на кожному із зображень не є звичною частиною інтерфейсу Instagram – ми проставили їх власноруч. Також, ми розділили загальний часовий інтервал на шестигодинні проміжки та додали стислий опис подій, що відбувались кожного дня).

Для збільшення зображення клікніть на нього

Підпис до ілюстрації:

6:28, 17 лют – напередодні демонстрацій;

18:16 – ВО «Майдан» закликало усіх небайдужих громадян взяти участь у «мирному наступі»;

05:59, 18 лют – ранок розпочався масовими демонстраціями. Сутички з урядовими силами розпочались коло 10-ї години та тривали весь день; 12:15 – масові заворушення у кількох центральних районах міста;

18:16 – міліція розпочинає витісняти протестувальників з Майдану Незалежності;

станом на 23:30 на площі залишається близько 20 тисяч людей;

00:39, 19 лют – влада закрила Київський метрополітен, основні дороги блоковано міліцією;

12:13 – протестувальники на Майдані готуються до нових зіткнень, багато людей прибуває, щоб зробити фото;

18:20 – після зустрічі в Адміністрації Президента обидві сторони декларують перемир’я та оголошують про початок переговорів;

06:50, 20 лют – кривава бійня між протестувальниками та урядовими силами;

12:38 – екстрене засідання Верховної Ради;

00:47, 21 лют – після нічних переговорів між президентом та лідерами опозиції досягнуто компромісної угоди;

16:17 – зникли сотні спецпризначенців, котрі охороняли урядовий квартал. Місцерозташування Януковича – невідоме;

18:19, 22 лют – з тюрми випущено екс-прем’єрку Юлію Тимошенко, вона прибула на Майдан та привітала понад 100-тисячний натовп.

Часовий проміжок розбито на 6-годинні інтервали, використовуючи позначки часу, що були додані на Instagram-фото.

При натисканні на зображення, воно відкриється у більш високій якості. Це дасть вам змогу роздивитись його детальніше, а також порівняти потік Instagram-зображень із стислими витягами з Вікіпедії.

Однак, якщо спробувати охопити поглядом весь комплекс зображень, то можна виявити більш загальні візуальні патерни. Шість хвилеподібних переходів від світліших до темніших зображень співвідносяться з шістьома днями (тьмяні зображення було поширено вночі, яскравіші – вдень).

За такого масштабування важко розгледіти якісь свідчення виняткових подій, що відбувались у той період часу. Здається, наче Революції взагалі не було.

Нижче наведено два збільшених фрагменти візуалізації. На першому розміщені зображення, що були поширені 18 лютого пізно увечері (під час атаки Майдану урядовими силами). Другий фрагмент репрезентує зображення ранку 19 лютого.

Тільки наблизившись, ми побачимо фото подій на Майдані Незалежності (пожежі та натовпи людей, український прапор на першому фрагменті) поруч із зображеннями, що стосуються інших подій та предметів. Кількість виняткових незвичайних зображень залежить від того, яку частину візуалізації ми збільшимо. Зокрема, на другому фрагменті також присутньо кілька зображень, що стосуються подій минулої ночі, але потрібно дивитись уважніше, для того щоб їх помітити.

Час

Тепер спробуємо візуалізувати всі зображення, поширені 17-22 лютого, у вигляді графіку. Кожен пік відповідає 24-годинному проміжку часу. Сірим позначено загальну кількість зображень, а червоним – ті, що були поширені з Майдану Незалежності – 1900 зображень або 14% від решти.

Всі зображення (13208); зображення поширені з Майдану Незалежності (прибл. 1900)

Якщо ми поглянемо на сіру частину графіку, то всі дні здаватимуться більш-менш однаковими. Незначна кількість зображень уранці, більше вдень та поступове зменшення кількості ввечері. Останній день в цьому проміжку (22 лютого) дещо відрізняється від решти, можливо тому, що це субота, коли люди прокидаються та повертаються додому пізніше. Знову ж таки, судячи лише з кількості зображень, дуже легко прийти до висновку, що ніякої революції не відбувалось.

Але поглянувши на зображення, поширені з Майдану Незалежності (червоний колір), ми побачимо цілком іншу картину. У перший день (17 лютого), перед початком подій, зображення практично відсутні. Наступного дня, у кількох центральних районах розпочинаються сутички між протестувальниками та урядовими силами (18 лютого). Штурм Майдану розпочинається о 8 вечора та триває майже всю ніч. Приблизно коло 6-ої вечора, ми можемо розгледіти чималий стрибок на графіку. 19 лютого сутички на площі відсутні, але все більше і більше людей прибуває сюди, щоб підготуватись до наступної хвилі зіткнень. Багато людей також приходить, щоб просто подивитись та задокументувати події за допомогою своїх телефонів, таким чином високий рівень активності спостерігається аж до кінця вибраного періоду.

Простір

Розбивши часовий інтервал на два потоки – окремо зображення поширені з центральної частини Києва та з Майдану Незалежності – ми змогли чітко виявити виняткові події, а також охарактеризувати їх часовий профіль (червона частина попереднього графіку).

А тепер, спробуємо переключитися з часового виміру на просторовий та закартувати локації усіх відібраних зображень. Перша карта відображає місця поширення зображень напередодні початку сутичок (17 лютого). На другій карті можна побачити місця поширення фотографій у наступні 5 днів, тобто 18-22 лютого. (Оскільки наша вибірка була обмежена прямокутником із центром на Майдані Незалежності, точки за межами цієї області – відсутні).

Таким чином, 17 лютого ми не спостерігаємо жодної пікової активності на Майдані Незалежності, але в наступні п’ять виняткових днів (бої навколо площі та масові мітинги після них) – це місце чітко вирізняється з поміж інших.

Можемо також «нарізати» наші карти вздовж однієї з координат (довготи або широти). Нижче, графіки відображають залежність кількості опублікованих фотографій (вертикаль) від координати широти (горизонталь) станом на 17 лютого (зліва) та на 18-22 (справа).

Count – кількість; lat – координати довготи

Дивлячись на ці карти та графіки, ми бачимо те ж саме, що й при аналізі часового аспекту – однак тепер виняткові події стають помітними ще більш виразно. Так, на графіку від 17 лютого Майдан Незалежності є лише частиною загальної активності у центрі міста, але в наступні 5 днів він повністю домінує над іншими локаціями.

Що таке #euromaidan?

Наша вибірка характеризувалась сімома різними теґами Майдану, що мали різне написання англійською, українською та російською мовами. Кожен з цих теґів потенційно міг мати різне значення для людей, що їх використовували.

Теґи: #майдан, #maidan, #euromaidan, #євромайдан, #евромайдан, #euromaydan, #Euromaidan.

В цілому, 1340 зображень були позначені хоча б одним із цих теґів (10% від загальної кількості). Ми розмістили ці зображення на площині у відповідності до дати та часу їх публікації.

Збільшивши масштаб, стає помітно, що серед більшості зображень, позначених «майданівськими» теґами, деякі явно не пов’язані з винятковими подіями того періоду (наприклад селфі у четвертому рядку першої колонки).

До нашої візуалізації ми також додали зображення, не позначені теґами. Після їх аналізу, виявилось, що зрідка на них були відображені тогочасні події. Розглянувши зображення, що були поширені навколо площі, ми помітили, що деякі з них були ніяк не пов’язані з Революцією. Тобто, ми не можемо покладатись лише на теґи, щоб однозначно зрозуміти контекст зображення. Таким чином, наші результати вказують на потенційну проблему, що може постати перед аналітиками, котрі вивчають суспільні потрясіння за допомогою соціальних медіа. Можливо, такі зображення варто трактувати як «шум», котрий можна лише прибрати із «сигналу», але для нас вони були справді цінною знахідкою. Це показало нам, що повсякденні та виняткові речі не просто «співіснують» поруч (так як було представлено на найпершій візуалізації). Навпаки, вони «просочуються» одне в одного, якщо можна так сказати.

Такі взаємопроникнення мають свої власні закономірності. Із 1340 зображень, що були позначені хоча б одним «майданівським» теґом, 30% мали також й інші теґи. Зображення лише з «майданівськими» теґами зазвичай були пов’язані з революційними подіями. Однак, присутність інших теґів збільшувало вірогідність появи чогось іншого на зображенні.

Підсумовуючи це параграф, ось деякі з зображень, позначених «майданівськими» теґами, що не виявляли ніякого очевидного зв’язку з подіями на площі.

“Сказати зображенням”

Додаючи одразу кілька теґів до зображення, людина розмножує його, оскільки тепер воно з’являтиметься в більшій кількості пошукових видач. Наприклад, якщо зображення позначене теґами #euromaidan та #майдан, то використовуючи Instagram для пошуку за кожним із них, ви побачите цю картинку два рази.

Коли користувач одночасно використовує кілька «майданівських» теґів для одного зображення, кожний із них потенційно повідомляє щось інше. Слово «Майдан» написане англійською, українською чи російською – це не одне й те саме. Таким чином, люди одночасно використовують кілька теґів не лише для того, щоб ширше розповсюдити свої зображення, але й щоб достукатися до іншомовних спільнот. Додавання нових теґів до зображень, це як спроба сказати щось іще про них.

Наша наступна візуалізація ґрунтується саме на цій ідеї. Як і минула, вона відображає всі зображення, що були позначені хоча б одним з «майданівських» теґів, але відмінність у тому, що кожне із зображень дублюється скільки разів, скількома теґами воно позначене. Наприклад, якщо зображення має теґи #euromaidan та #майдан, воно відображається двічі. В результаті, кількість зображень на візуалізації зросла з 1340 до 2917. (Зображення розташовані у відповідності до дати та часу публікації).

Ось збільшений фрагмент:

Кластери

Різновиди та частота застосування теґів користувачами може багато чого розповісти нам про зображення, але часом це може бути оманливим. Навіть тоді, коли теґи підібрані ідеально, вони не повністю розкривають суть зображення, а також такі його характеристики як композиція, фокус тощо. Якщо «одне зображення вартує тисячі слів», тоді ми з вами опиняємося повнісінькими невдахами, адже жодне зображення в Instagram не володіє такою кількістю міток.

Для прикладу розглянемо Instagram-фото людини. Теґи можуть розповісти нам про її стать (#хлопець, #дівчина), настрій (#сумно), можливо про місцезнаходження (#пляж) – але таким чином ми не отримаємо жодної інформації про композицію фото, його кольори та інші візуальні характеристики.

Спробуємо вилучити мову на наступному етапі аналізу. Замість цього використаємо програмні алгоритми, що допоможуть автоматично розбити нашу вибірку на окремі групи, залежно від візуальної схожості зображень. До кожної групи ввійдуть зображення, що мають щось спільне. Ця досить поширена методика (кластерний аналіз) не передбачає жодного використання комп’ютером даних про зміст зображення, машина аналізує лише їх візуальні характеристики.

Використавши цей метод, нам вдалось розділити усю вибірку зображень на 60 кластерів. Кілька із них майже повністю складалися з зображень, так чи інакше пов’язаних з Майданом, але більшість – ні. Зазвичай вони репрезентували звичну «буденність» Києва, так як це можна зробити за допомогою Instagram: подвійні портрети, об’єкти на білому тлі, види міста із світлим небом та темнішою нижньою частиною тощо. Нижче наведено три приклади подібних кластерів. У перший потрапили зображення, на яких переважно присутній один із видів на місто, з світлішою верхньою та темнішою нижньою частинами:

До другого увійшли зображення, що містять графіку або текст, або ж зображення об’єктів на білому тлі:

В третьому кластері перебували одиночні зображення предметів/осіб, поміщених у центр кадру та обрамлених світлим тлом. Ці приклади ілюструють можливість того, як серед великої, на позір однорідної, вибірки можна виявити окремі візуально подібні групи зображень. За допомогою кластерного аналізу ми можемо виявити окремі типи зображень, що їх містить наша вибірка, це набагато важче зробити, аналізуючи її цілком.

Кластеризація зображень за їх візуальними характеристиками також дозволяє нам прояснити ще один тип зв’язків між буденним та винятковим. Кожен з наведених вище кластерів містить переважно повсякденні зображення, але через подібність у композиції до них все таки потрапляють деякі «майданівські» зображення. У першому – це ландшафти, що за кольорами нагадують прапор України, а також фото спаленого будинку Профспілок, у третьому – зображення, що місять політичний текст на фоні свічки та деякі інші.

Теґи

Користувачі Instagram присвоїли 5845 унікальних теґів зображенням, що були поширені 17-22 лютого з центральної частини Києва. Загалом, їх було використано 21 465 разів.

Чи побачимо ми ті ж самі закономірності що й раніше, проаналізувавши ці теґи?

Наступна таблиця демонструє нам десятку найпопулярніших теґів для кожного із шести лютневих днів. Теґи розміщені у відповідності до частоти їх застосування користувачами.

Напередодні сутичок (17 лютого), ми бачимо типовий Instagram-патерн, характерний для будь-якого іншого місця в світі. Першими йдуть географічні теґи, що позначають місцезнаходження користувача, за ними – «універсальні» неспецифічні Instagram-мітки: #love, #follow, followme, #instagood, #me, #photooftheday. Останні входять до п’ятнадцятки найпопулярніших теґів у світі практично щоденно (щоб побачити топ-100 Instagram-теґів для будь-якого дня перейдіть на http://websta.me/hot/).

Як тільки розпочались перші зіткнення, слова “EuroMaidan,” “Maidan” та “revolution” одразу ж виплигнули на гору. 18 лютого лише два універсальних Instagram-теґи утримались на низу десятки (#love та #followme). 19 лютого абсолютно виняткове: жодного стандартного Instagram-теґу в списку. 20 та 21 числа, поодинокий стандартний теґ #love з’являється на десятій позиції, а 22 лютого, після остаточного завершення сутичок та тріумфу революції, два стандартних теґи проникають назад у список (#followme та #instagood).

Загалом, ми спостерігаємо бездоганну дугу. Перед початком виняткових подій, “рутина Instagramу” повністю домінує в списку (17 лютого). Потім вона повністю зникає (19 лютого) та поступово починає повертатись назад (20-22 числа). Виняткові події місцевого значення витіснили глобальну рутину – але тільки на короткий період часу.

Географія, Майдан, Instagram-рутина

Ми бачимо досить чітку закономірність, однак вона викликає одне запитання. Частка зображень поширених з Майдану Незалежності становить 14% від усіх 13 208 зображень, поширених з центральної частини Києва. Але коли ми починаємо аналізувати всю вибірку теґів, то бачимо повне домінування «майданівських» міток у революційні дні. Чому так? Одним із можливих пояснень є те, що люди, котрі не ходили на Майдан все рівно були занепокоєні подіями, що розгортались, та використовували специфічні теґи, щоб висловити своє ставлення до Революції.

Щоб краще побачити яким сильним було місцеве “виверження” локальних теґів у Києві 18-21 лютого 2014 року, поглянемо на топ-мітки у інших містах світу. Наступна таблиця показує п’ятірку найпопулярніших теґів у 5 містах, впродовж одного тижня (5-11 грудня 2013). Кожне місто репрезентоване вибіркою з 20 000 зображень, що були поширені у центральній частині міста у той час. Для нашого досліду ми вибрали територію того ж розміру, що й згодом для Києва (зображення ми завантажили з Instagram у рамках проекту Selfiecity).

Лінгвістична подібність Instagram-зліпків цих міст є разючою. У всіх містах повторюється практично однаковий набір теґів, спостерігаються лише невеликі відмінності у частоті їх вживання. Єдиним винятком є теґ #thaiuprizing в Бангкоці та один кириличний географічний теґ у Москві.

Користувачі

Наклавши на графік частоту використання теґів та кількість користувачів, ми виявимо ще більш вражаючий патерн взаємодії буденного й виняткового у ті шість днів. Нижче, по вертикальній осі графіку відкладено частоту вживання найпопулярніших теґів, по горизонтальній – кількість користувачів, що використала окремий теґ. (Щоб зробити графік доступнішим, ми використали логарифмічну шкалу, а також надали точкам довільне коливання. Ви можете побачити оригінальний графік за посиланням).

Більшість теґів розташувалась вздовж прямої лінії, вказуючи на очевидну закономірність: чим більше людей використовує конкретну мітку, тим вища її частота вживання. Набагато цікавіше поглянути на теґи, що випадають із основного тренду.

У правому верхньому кутку ми бачимо мітку #майдан. Цей теґ було вжито найбільшу кількість разів за шестиденний період часу. Тепер поглянемо на групу теґів у нижньому лівому кутку: #ballet, #balletomania, #ballerina та деякі інші. Можливо в той час у Києві відбувалась якась балетна подія.

Ці теґи розташувались поза лінією тренду, оскільки вони всі були поширені лише одним користувачем Instagram. Позначивши понад 40 фотографій теґом #ballet, він явно порушив бездоганність даного патерну. Таким чином, дивлячись на цей графік, можна легко зробити помилкове судження про те, що певна подія, пов’язана з балетом, була більш винятковою ніж Майдан. Це гарний приклад того, як соціальні медіа можуть «виносити на поверхню» надміру персоналізовані «реальності», котрі існують паралельно з тим, що інші люди вважають набагато важливішим.

Мови

Сім «майданівських» теґів, що ними позначали зображення в Instagram, охоплюють три різних мови:

#maidan (англійська)

#euromaidan (англійська)

#euromaydan (англійська)

#Euromaidan (англійська)

#майдан (може бути як українська, так і російська)

#євромайдан (українська)

#евромайдан (російська)

Зазвичай люди позначали одне зображення одразу кількома «майданівськими» теґами. Список, представлений нижче, демонструє частоту вживання різних міток (враховані лише ті, що стосуються Майдану):

338 зображень мали один теґ

610 зображень мали два теґи

80 зображень мали три теґи

219 зображень мали чотири теґи

64 зображення мали п’ять теґів

6 зображень мали шість теґів

Що власне ми можемо дізнатись, співставивши два вищенаведені факти? Вища інтенсивність синього кольору на матричній діаграмі, розташованій нижче, вказує на вищу частоту спільного трапляння теґів. (Оскільки один і той же теґ не може зустрічатись в парі із самим собою, ми розмістили великі чорні круги по діагоналі діаграми).

Більшість точок перетину двох теґів до певної міри блакитні, а це свідчить про те, що вони використовувались разом досить часто. Це твердження справедливо для всіх трьох мов, усі вони використовувались однаково, без суттєвого переважання однієї мови над іншою.

Оскільки ми аналізуємо мови, можемо також повернутись до нашої таблиці, що відображала топ-10 теґів для кожного із шести лютневих днів, та нанести дані по кожній із мов на графік:

Домінування англійської не є чимось дивним, але чому ми бачимо практично однакову кількість україно- та російськомовних теґів (англійська: 2553; українська: 637; російська: 598)? Цей патерн відображає повсякденне використання двох мов в Україні. За даними опитування 2003 року у Києві, на запитання «Якою мовою ви користуєтесь у повсякденному житті?»: 52% відповіли «переважно російською»; 32% – «обома в рівній мірі»; 14% – «переважно українською» та 4,3% обрали варіант «лише українською». Згідно опитування 2006 року: російською вдома розмовляють 52%, українською – 23%, а 24% послуговуються обома мовами (http://en.wikipedia.org/wiki/Kiev#Demographics).

Таким чином, використання україно- або російськомовних теґів не свідчить про проукраїнські або проросійські погляди. А висока частка російськомовних теґів не означає, що більшість Instagram-користувачів у Києві підтримували проросійську політику. Навпаки, оскільки використання англомовних теґів було найчастішим, ми можемо зробити висновок, що більшість користувачів Instagram у Києві орієнтуються на Захід та є більш зануреними у глобальний світовий контекст, аніж деякі інші громадяни України.

майдан журналістика даних

Знак гривні
Знак гривні