1399
Контент-маркетинг Читати 12 хвилин 9 травня 2023

Кому належать напрацювання штучного інтелекту та дані для навчання моделей?

Кому належать напрацювання штучного інтелекту та дані для навчання моделей?
Зоряна Матюшенко
Зоряна Матюшенко
ІТ-юристка в Legal IT Group

ШІ стрімко набуває популярності, викликає щире захоплення та занепокоєння водночас, адже з його допомогою значно простіше отримати бажану ілюстрацію під запит, статтю чи промо-текст.

Однак, якщо подумати на крок далі, то хто є автором робіт, створених ШІ? Чи правомірним є використання об’єктів авторського права інших осіб для тренування моделей ШІ? Пропоную розглянути ці та інші питання у цій статті.

Права на створені ШІ об’єкти

Отже, на перший погляд, ChatGPT, Midjourhey та Dall-e видаються чудовими помічниками контент-мейкерів, копірайтерів, розробників та багатьох інших. Попри це на етапі роботи з ним виникає питання: чи справді вихідний матеріал можна вважати своїм?

Однозначної відповіді, як це часто буває у юридичному світі, немає, адже it depends, як то кажуть. Технології рухаються значно швидше за законодавство, тому не всі моменти є чітко врегульованими. Однак, певне регулювання все ж існує, тому його і розглянемо.

Сам ChatGPT відповідає, що у більшості випадків авторство на вихідний матеріал належить розробникам алгоритмів та технологій, які використовуються для його роботи. Однак, якщо вхідні матеріали були надані користувачем, він може мати право на авторство на створений контент. Крім того, у різних країнах існують відмінні правові норми та вимоги щодо авторства, тому від цього також може залежати, хто буде автором згенерованого контенту.

І хоч ChatGPT часто вдається до так званих «галюцинацій», коли вигадує інформацію, якої не існує, то у цьому випадку він близький до правди.

У США Відомство з авторських прав (U.S. Copyright Office) вже отримує заявки на реєстрацію творів, що включають контент, створений ШІ. 16 березня 2023 року згаданий Copyright Office видав гайдлайн «Copyright Registration Guidance: Works Containing Material Generated by Artificial Intelligence»

Відповідно до Гайдлайну ключовим моментом, на основі якого приймається рішення щодо реєстрації контенту, створеного ШІ, є наявність «людського авторства» (“human authorship”). Так, оцінюючи твори, що містять матеріал, створений ШІ, Copyright Office спиратиметься на те, чи є такий твір людського авторства, а комп’ютер лише допоміжним інструментом. Інакше кажучи, чи є внесок ШІ результатом «власної оригінальної розумової концепції». Захищатися авторським правом буде також матеріал, створений ШІ та суттєво видозмінений людиною опісля. Якщо ж участь людини обмежилася описом чи «промптом» (запитом) для ШІ, то результат не підлягатиме реєстрації. 

Як вже можна було здогадатися, універсальних критеріїв для визначення ступеня такої креативної участі людини немає. Рішення приймається індивідуально у кожній ситуації.

Слід також враховувати те, що ChatGPT не вказує джерела, звідки він бере текст. З огляду на це, не можна бути впевненим, що сама модель користується ними законно. Відтак, є ризик того, що текст, згенерований ШІ, є плагіатом або в інший спосіб порушує, права третіх осіб.

Окрім цього, ніхто не застрахований від подібності контенту, виданого за вашим запитом та за запитом когось іншого. Претендуючи на унікальність та одночасне «спрощення життя» можна отримати 5 однакових чи дуже подібних зразків згенерованого контенту у різних точках світу. Також слід бути обачним із тим, що контент, згенерований ШІ, не обов’язково є точним через вже згадані «галюцинації».

У законодавстві України спостерігаємо той самий принцип, за якого автором може бути лише людина і матиме права на контент лише у тому разі, якщо долучилася творчою діяльністю до його створення.

Британське законодавство визначає, що автором згенерованого комп’ютером твору є особа, яка здійснила заходи, необхідні для створення твору (section 9(3) The Copyright, Designs and Patents Act (CDPA) 1988). У CDPA також є поняття твору, створеного комп’ютером за таких обставин, що не існує автора-людини. Таким чином, для згенерованого комп'ютером твору у Сполученому Королівстві, авторство людини не впливає на те, чи є цей твір об'єктом авторського права. Це є доволі специфічним регулюванням, порівняно зі світовими тенденціями.

Універсальної пігулки не існує, а тому у кожній ситуації авторство визначатиметься індивідуально, залежно від обставин та законодавства, що застосовується. Однак, прослідковується ключовий принцип: ступінь творчої залученості користувача у створенні твору ШІ має вирішальне значення при визначенні авторства.

Права на дані для тренування моделей ШІ

Іншим аспектом, вартим уваги щодо ШІ, є використання об’єктів авторства третіх осіб для тренування моделей ШІ.

Нещодавно у США художники Сара Андерсен, Келлі Мак-Кернан і Карла Ортіс подали судовий позов проти творців артгенераторів на основі ШІ – Stable Diffusion, Midjourney і DreamUp. Вони стверджують, що організації порушили права мільйонів художників, навчивши свої моделі ШІ на п’яти мільярдах зображень, зібраних з інтернету без згоди оригінальних художників.

Крім того, фотостокова платформа Getty Images подала позов проти компанії Stability AI за порушення авторських прав при тренуванні ШІ. 

Потенційно позови про порушення прав можуть бути спрямовані не лише проти розробників програм зі штучним інтелектом, а й проти будь-кого, хто намагатиметься використати у комерційній діяльності згенеровані ними результати.

Компанія OpenAI у 2019 році, у коментарі до Бюро патентів і торгових марок США (United States Patent and Trademark Office) заявила, що використання алгоритмів машинного навчання, які аналізують дані, захищені авторським правом, для навчання, повинно підпадати під добросовісне використання (fair use). Представники компанії також наголошували на тому, що протилежна позиція матиме «катастрофічні наслідки», «може призвести до виведення інновацій в іноземну юрисдикцію» та «серйозно перешкоджатиме творчим дослідженням у галузі ШІ». Власне, fair use є основним аргументом компаній-розробників продуктів з ШІ на користь використання об’єктів авторства третіх осіб для навчання своїх програм.

Справді, у США діє доктрина fair use, яка дозволяє використання твору, захищеного авторським правом, без дозволу власника авторського права для таких цілей як критика, коментарі, повідомлення новин, навчання, наукова діяльність або дослідження. 

Однак, межа між правомірним використанням творів третіх осіб у рамках доктрини fair use та порушенням авторських прав доволі тонка і розмита, а тому позиція різних сторін може обростати зустрічними аргументами. У справах, пов'язаних із добросовісним використанням ШІ творів авторства третіх осіб, є багато ускладнюючих факторів, зокрема місцезнаходження компанії (правова юрисдикція) та мета такого використання. Має значення також обсяг захищеного матеріалу, який використовувався. Саме тому лише суд після комплексного розгляду конкретного кейсу зможе дійти висновку щодо того, чи може вважатися добросовісним використання творів, авторські права на які належать третім особам, для навчання моделей ШІ.

Якщо порівняти таке використання некомерційними та комерційними компаніями, то некомерційні компанії більш ймовірно зможуть посилатися на те, що їхній випадок справді підпадає під fair use. Комерційна мета значно зменшує шанси на захист доктриною добросовісного використання. Проте, знову ж таки, case by case :)

Водночас у ЄС чинною є Директива Європейського парламенту та ради про авторське право та суміжні права на Єдиному цифровому ринку, положеннями статті 4 якої допускається відтворення і вилучення правомірно доступних творів та інших об'єктів для цілей глибинного аналізу текстів і даних. Так, це положення можна використовувати на захист такого використання творів третіх осіб для навчання моделей ШІ у ЄС.

Однак, і тут не слід розслаблятися. По-перше, судова практика може трактувати це положення інакше і створювати нові прецеденти. По-друге, ще не прийнятий AI Act, але пропозиції якого активно обговорюються, містить положення, яке зобов’язує розкривати органам нагляду за ринком будь-який захищений авторським правом матеріал, що використовується для розробки ШІ, тобто для навчання також. У свою чергу, це може докорінно змінити ситуацію.

Іншу сторону претензій до генераторів ШІ-арту можна побачити у колективному позові про порушення авторських прав проти Microsoft, GitHub та OpenAI. У позові стверджується, що ці компанії порушили закон про авторське право, свідомо використовуючи захищений відкритий код для навчання свого ШІ. Цей позов від інших відрізняє те, що він не містить прямих звинувачень у порушенні авторських прав, а спирається на положення Закону про авторське право в цифрову епоху (Digital Millennium Copyright Act), яке забороняє видаляти з твору «інформацію про управління авторськими правами», яка може включати відомості про авторство та ліцензію.

Практика наразі лише на початку свого формування, тому спрогнозувати, якими будуть майбутні судові рішення, складно. Можна припустити, що перші рішення задаватимуть подальшу тенденцію до розгляду подібних справ. Водночас, кожна справа розглядатиметься з урахуванням індивідуальних обставин, а тому рішення можуть прийматися без прив’язки до попередніх у схожих кейсах.

Хотіли б дослідити світ генеративного штучного інтелекту та знайти надійного помічника для роботи з контентом? 

Спробуйте інструменти Serpstat! Активуйте тестовий доступ до сервісу на 7 днів та оцініть всі переваги прогресивних рішень для оптимізації сайту. 

Зареєструватись!

Використання штучного інтелекту в юриспруденції

Юристи також знаходять застосування штучному інтелекту в роботі. Передусім ШІ може допомогти з юридичними дослідженнями. Якщо потрібно відшукати інформацію у зовсім невідомій сфері, то можна прийти за навігацією до ШІ. Звісно, орієнтири треба перевіряти і не варто очікувати, що вся робота буде зроблена за вас :) 

ШІ може надзвичайно швидко опрацьовувати великі об’єми інформації, що може стати в нагоді при виконанні певних часозатратних завдань. Окрім того, корисними інструменти ШІ можуть бути при автоматизації документообігу та білінгу і навіть підготовці драфтів документів.

При тому, слід бути обачними з ресурсами, які використовуються, і пам’ятати про безпеку даних.

Використання ШІ в юридичній галузі.
Джерело: https://technative.io/how-legal-ai-became-more-accurate-than-lawyers/ 

Використання ШІ в юридичній галузі.

Висновок

Підсумувати можна тим, що використання згенерованого контенту, хоч і балансує на межі з ризиками, але все ж, безумовно, є дуже прогресивним інструментом. Враховуючи стрімкий розвиток технологій ШІ, незабаром можна очікувати появу більш детального правового регулювання та формування судової практики. 

Межа щодо визначення авторства такого контенту є доволі розмитою, а також існує імовірність порушення авторських прав третіх осіб ще на етапі створення ШІ-арту, тексту чи іншого вихідного результату. Тому використовувати ШІ потрібно відповідально, аби він справді ефективно допомагав.

Так, залежно від ситуації та застосовної юрисдикції контент, створений ШІ може належати:

Крім того, згенерований контент може не просто містити частку творчості третьої особи, а і порушувати її авторські права на результати своєї творчості.

Питання правомірності використання об’єктів авторства третіх осіб без згоди авторів для навчання моделей ШІ також залишається дискусійним. У США діє доктрина fair use, яка, однак, не встановлює одного чіткого правила на всі випадки, а тому слід комплексно враховувати сукупність таких обставин як мета використання, юрисдикція, обсяг і природа контенту, частка «чужого» матеріалу у кінцевих результатах та ін.

Перекласти всі робочі завдання на штучний інтелект не вийде, але спростити життя він, звісно, може. У перспективі ШІ може стати буденним інструментом, який підвищує ефективність роботи. Звісно, важливо пам’ятати про безпеку та конфіденційність і відповідально підходити до взаємодії зі штучним інтелектом.

У ЄС регулювання наразі більш лояльне щодо авторства робіт, згенерованих ШІ, але йде активна робота над новим AI Act, який може стати новим глобальним стандартом у цій сфері. Тому тримаємо руку на пульсі і слідкуємо за динамічним розвитком законодавства.

Думка авторів гостьових дописів може не збігатися з думкою редакції та спеціалістів Serpstat.

Оцініть статтю за п’ятибальною шкалою

Ця стаття вже була оцінена 6 людьми середньою оцінкою 5 із 5 можливих
Знайшли помилку? Виділіть її та натисніть Ctrl + Enter, щоб повідомити нам.

Використовуйте кращі SEO інструменти

Інструмент аналізу тексту

Вдосконалити свій контент використовуючи потужний інструмент аналіз тексту

Тренди ключових слів

Дізнайтеся популярні тренди ключових слів для ефективної роботи з контентом

Можливості Serpstat

Можливості Serpstat – потужне комплексне рішення для ефективного просування сайтів

Інструменти ШІ для контенту

Інструменти ШІ для контенту – покращуйте якість та швидкість роботи з текстом

Поділіться статтею з вашими друзями

Ви впевнені?

Знайомство з сервісом

Serpstat економить час, як і ми готові заощадити ваш, на знайомстві з ключовими можливостями сервісу.

Наш фахівець зв'яжеться з вами і за підсумком запропонує відповідний варіант, який може включати персональну демонстрацію, пробний період, навчальні статті та записи вебінарів, консультацію фахівця, а також комфортні умови для старту використання Serpstat.

Ім’я

Введіть адресу електронної пошти

Телефон

Будемо раді вашому коментарю

Дякуємо, ми зберегли ваші нові налаштування розсилок.

Повідомити про помилку

Скасувати
Відкрити чат технічної підтримки
mail pocket flipboard Messenger telegramm