Гарвард оцифрував судовий реєстр, аби навчити штучний інтелект

Бібліотека Школи права Гарвардського університету завершила проект Caselaw Access Project зі збору відкритих даних про судові справи, що проходили на території США. База даних з близько 6,4 мільйона судових справ має допомогти ефективніше навчати комп’ютерні алгоритми, які допомагатимуть ухвалювати рішення в судах.

Про це пише Громадське.

Дослідники зі Школи права Гарвардського університету протягом кількох років сканували та аналізували відкриті матеріали, що належать бібліотеці університету. Матеріали містили ухвали та стенографії по кожній судовій справі. Перші документи датуються 1658 роком, а останні — 2018. Всього для створення бази даних дослідники оцифрували близько 40 мільйонів сторінок, а загальна кількість справ перевищила 6,4 мільйона.

Ці данні, на думку розробників допоможуть навчити нейромережу, яка зможе допомагати ухвалювати рішення і полегшувати процес в суді.

База даних також може стати корисною не тільки розробникам, але і юристам. Щоб отримати доступ до неї необхідно зареєструватися на сайті проекту. До того ж, наразі діє обмеження на звантаження: розробники дозволяють отримувати тільки 500 документів в день. Це обмеження ввели партнери проекту — технологічний стартап Ravel Law. Воно діятиме приблизно до березня 2024 року, після чого доступ до всіх документів має стати вільним. Базові дані (назви справ, дата і суд) доступні повністю вже зараз.

Раніше в США створили штучний інтелект, який може розпізнавати обман у суді.

технології суд