Bagaimana AI Menggunakan Karya Seni sebagai Dataset? Mekanisme, Risiko, dan Permasalahan Hukumnya

 1. Pengantar: AI Belajar dari Karya Seni Manusia

Dalam beberapa tahun terakhir, teknologi Generative AI seperti Stable Diffusion, Midjourney, dan DALL·E berkembang pesat. Kemampuan AI untuk menciptakan gambar baru, ilustrasi, hingga karya seni digital membuatnya menjadi alat favorit di industri kreatif.

Namun kemampuan ini datang dari satu hal penting:
AI dilatih menggunakan dataset yang berisi jutaan karya seni manusia.

Masalahnya, banyak dataset tersebut dikumpulkan secara masif dari internet tanpa izin dari pelaku seni. Hal ini selaras dengan temuan tesis saya, di mana Developer AI:

“melakukan transformasi seluruh isi dataset… termasuk karya seni berhak cipta, agar dapat dipelajari oleh AI”

Dan di sinilah konflik hukum dimulai.

 2. Bagaimana AI Memproses Karya Seni dalam Dataset

AI generatif belajar menggunakan teknik machine learning dan deep learning. Prosesnya:

a. Developer AI mengumpulkan karya seni dari berbagai sumber

• Website
• Media sosial
• Platform gambar
• Dataset open-source seperti LAION-5B atau COCO

Sebagian dataset bersifat tertutup (close-source) dan berlisensi…
Namun sebagian besar dataset open-source mengambil data secara acak termasuk karya berhak cipta.

b. AI membaca, menyalin, dan mengurai seluruh isi karya seni

Dalam berkas tesis secara jelas dijelaskan:

“AI menggunakan seluruh bagian dari karya tersebut agar mendapatkan hasil yang bagus.”

AI tidak sekadar melihat gambarnya.
AI mengurai warna, pola, brushstroke, komposisi, hingga gaya seniman.

c. AI membuat model internal yang meniru gaya visual

Model AI tidak menyimpan gambar asli, tetapi menyimpan representasi statistik dari karya tersebut.

d. Ketika pengguna memberi prompt, AI menghasilkan karya baru

Output ini sering terlihat seperti karya asli seniman—bahkan bisa “mencantumkan” nama seniman dalam prompt.

 3. Masalah Hukum yang Timbul: Hak CIpta Dilanggar

Berdasarkan penelitian dalam tesis:

(1) Pelanggaran hak ekonomi

Pasal 8 UU Hak Cipta memberi hak kepada pencipta untuk mendapatkan manfaat ekonomi dari karyanya.

Namun AI dilatih dengan karya seni tanpa izin, dan bahkan digunakan untuk tujuan komersial oleh developer.

(2) Pelanggaran hak moral

AI tidak menyebut nama pencipta & memodifikasi gaya seniman.

Ini melanggar Pasal 5 & 7 UUHC.

(3) Penggunaan untuk komersial → pidana

Jika dataset dipakai untuk layanan berbayar, API, atau platform komersial, developer AI dapat dikenai:

Pasal 113 ayat (3) UU Hak Cipta — pidana atas pelanggaran hak cipta.

(4) AI bukan subjek hukum

Developer sering beralasan “AI-lah yang meniru, bukan manusia.”

Namun secara hukum, AI tidak punya kapasitas sebagai subjek hukum.

“Pertanggungjawaban melekat pada Developer AI sebagai pihak yang mengendalikan proses teknis dan bisnis.”

 4. Mengapa Open-Source Dataset Berbahaya?

Dataset open-source seperti LAION-5B mengambil data dari internet tanpa pemeriksaan hak cipta.

Tesis menjelaskan:

“Open-source dataset berkemungkinan memiliki karya berhak cipta.”

Karena itulah banyak perusahaan AI global digugat.

Contoh kasus di tesis:

  • Stability AI vs Getty Images (gugatan 2023)

  • Midjourney & DeviantArt (gugatan oleh Sarah Andersen)

 5. Kesimpulan

AI hanya bisa hebat karena belajar dari karya seni manusia.

Namun jika prosesnya dilakukan tanpa izin, maka:

  • melanggar hak moral

  • melanggar hak ekonomi

  • dapat dikenai pidana

  • dan Developer AI tetap bertanggung jawab secara hukum

Oleh karena itu, dunia teknologi dan dunia seni memerlukan model lisensi, perizinan, dan kompensasi agar AI berkembang tanpa merugikan pencipta asli.

Comments

Popular posts from this blog

Use of Stock Images, Icons, and UI Assets in Games: Legal Rules Developers Must Know

Music Copyright in Games: Licensing, Usage Rules, and Legal Risks for Developers

What Makes AI Training Data Illegal? A Breakdown of the Most Common Dataset Violations in AI Development