Apakah kalian ingat mengenai pembahasan pada artikel sebelumnya? Dari artikel berjudul “AI dapat Berhalusinasi?” sebelumnya, kita tahu bahwa kecerdasan buatan atau yang lebih akrab kita sebut dengan AI, memerlukan data pelatihan dalam jumlah besar untuk melatih algoritmanya agar dapat memberi respon berkualitas layaknya manusia. Sehingga, ketersediaan data menjadi satu di antara faktor paling krusial dalam pengembangan AI modern.
Berdasarkan pernyataan yang dibagikan oleh CNBC, seorang Chief Legal Officer Reddit, yaitu Ben Lee mengatakan bahwa, perusahaan yang bergerak pada bidang ini berlomba-lomba untuk menghasilkan konten manusia yang berkualitas. Akan tetapi tekanan tersebut justru mendorong ekonomi pencucian data (industrial-scale ‘data laundering’ economy) yang marak, demi menghasilkan konten yang berkualitas tersebut.
Perusahaan meretas data, lalu menjualnya kembali kepada mereka yang menginginkan data pelatihan untuk AI milik mereka. Praktik tersebut yang seringkali memicu kemarahan para konten kreator karena merasa konten mereka telah dicuri dan dimanfaatkan tanpa izin untuk melatih AI. Tidak jarang para konten kreator bahkan menilai AI seolah telah menjiplak konten mereka, kemudian menghasilkan konten yang serupa tanpa memberi kredit maupun kompensasi. Hal inilah yang kemudian memicu perdebatan mengenai etika penggunaan data publik dan eksploitasi digital di mana hak cipta diabaikan demi keuntungan industri AI.
Apakah kalian tahu satu di antara banyak platform komunitas daring global terbesar dengan 100.000 lebih forum di internet? Aplikasi dengan ikon alien berwarna oranye, yaitu Reddit. Jutaan user aktif yang dimiliki oleh Reddit, membuat peneliti di bidang AI berpendapat bahwa volume percakapan Reddit yang dimoderasi secara besar dapat membantu chatbot AI menghasilkan respon percakapan natural yang mirip dengan manusia.
Apa yang Terjadi?
Permasalahannya adalah, pada hari Rabu 22 Oktober yang lalu, Reddit telah menggugat Perplexity AI di pengadilan federal terkait tuduhan bahwa Perplexity dan mitra data-nya telah melakukan skema berskala industri untuk mengikis dan mengeruk konten yang dibuat oleh pengguna platform Reddit secara ilegal.
Mitra data Perplexity AI yang dimaksud terdiri dari tiga perusahaan data scraper yaitu SerpApi, Oxylabs, and AWM Proxy yang juga menjadi terdakwa dalam gugatan Reddit. Tapi sebelumnya, apa itu perusahaan data scraper? perusahaan data scraper merupakan perusahaan yang mengumpulkan data dari sumber online untuk berbagai tujuan. Gugatan Reddit terhadap ketiga perusahaan tersebut, terkait dengan tuduhan pengumpulan data yang memiliki hak cipta Reddit secara ilegal, yaitu dengan menyamarkan identitas, menyembunyikan lokasi, dan mengaburkan web scraper mereka sebagai pengguna biasa.
Bersumber dari zonagadget.co.id, tim hukum Reddit mengungkapkan bahwa mereka telah menanam jebakan di platform mereka. Jebakan tersebut berupa unggahan tersembunyi pada platform Reddit yang dirancang agar hanya dapat ditemukan oleh crawler Google, yang merupakan perusahaan yang telah menjalin kemitraan berizin dengan Reddit untuk menggunakan data secara resmi, bersandingan dengan OpenAI. Bukti konklusif muncul ketika unggahan tersembunyi tersebut muncul di dalam Perplexity padahal perusahaan tersebut tidak memiliki lisensi resmi untuk menggunakan konten Reddit. Temuan tersebut dianggap Reddit sebagai bukti yang mengindikasikan bahwa scraping secara ilegal terjadi.
Dalam dokumen gugatan, Reddit bahkan menyatakan jumlah rujukan AI yang diambil Perplexity dari forum tersebut meningkat hingga 40 kali lipat. Padahal, tahun lalu Reddit telah mengirimkan surat larangan pada Perplexity agar tidak melakukan pengerukan data forum mereka tanpa lisensi.
Menanggapi gugatan tersebut, Perplexity, dalam sebuah unggahan di platform Reddit berargumen bahwa mereka tidak melatih model AI berdasarkan konten Reddit, melainkan hanya merangkum dan mengutip diskusi publik di Reddit. Oleh karena itu, mereka menyatakan bahwa “mustahil” untuk menandatangani perjanjian lisensi. Perplexity juga berpendapat bahwa data online yang bersifat publik seharusnya tidak dapat dibatasi penggunaannya.
Pembantahan terhadap gugatan Reddit tidak hanya datang dari Perplexity, tetapi juga datang dari perusahaan lain yang termasuk dalam gugatan Reddit. Berdasarkan laman Decrypt, seorang representatif dari SerpApi mengatakan bahwa mereka tidak menerima komunikasi ataupun layanan dari Reddit, lalu menambahkan bahwa mereka sangat tidak setuju dengan tuduhan Reddit dan berniat untuk membawa perihal ini ke jalur hukum.
Sedangkan chief governance and strategy officer dari Oxylabs, Denas Grybauskas mengatakan bahwa “No company should claim ownership of public data that does not belong to them. It is possible that it is just an attempt to sell the same public data at an inflated price.” Menurutnya, perusahaan tidak seharusnya melakukan klaim kepemilikan terhadap data publik yang bukan milik mereka, dan tindakan tersebut mungkin saja hanya percobaan untuk menjual data publik dengan harga yang tinggi.
Sebagai respon dari pendapat mereka yang mengatakan bahwa konten publik seharusnya tidak dapat dibatasi, Reddit menegaskan “respect for creators and communities isn’t optional” dan bahwa setiap unggahan dari pengguna memiliki nilai terukur yang harus dihargai dalam ekonomi AI.
Bagaimana menurut kalian?
Sumber:
Divisi Komunikasi dan Infomasi
Himpunan Mahasiswa Sistem Informasi Universitas Tanjungpura 2025/2026
0 Komentar