Penghapusan data menghambat kemajuan gugatan OpenAI
Di tengah gugatan hak cipta yang mendapat banyak perhatian, penghapusan bukti yang tidak disengaja oleh OpenAI telah mempersulit upaya untuk melacak bagaimana sistem AI-nya dilatih, sehingga para penggugat harus memulai pencarian mereka lagi.
OpenAI tengah diselidiki setelah para teknisi secara tidak sengaja menghapus bukti-bukti penting dalam gugatan hak cipta yang diajukan oleh The New York Times dan Daily News. Para penerbit menuduh OpenAI menggunakan konten berhak cipta mereka untuk melatih model AI tanpa izin.
Masalah ini muncul ketika OpenAI menyediakan mesin virtual bagi penggugat untuk mencari materi yang dilanggar dalam kumpulan data pelatihannya. Pada tanggal 14 November 2024, teknisi OpenAI menghapus data pencarian yang tersimpan di salah satu mesin tersebut. Meskipun sebagian besar data berhasil dipulihkan, hilangnya struktur folder dan nama file membuat informasi tersebut tidak dapat digunakan untuk melacak sumber tertentu dalam proses pelatihan.
Para penggugat kini terpaksa memulai kembali pencarian yang memakan waktu, yang menimbulkan kekhawatiran atas kemampuan OpenAI untuk mengelola kumpulan datanya sendiri. Meskipun penghapusan tersebut tidak diduga disengaja, para pengacara berpendapat bahwa OpenAI paling siap untuk melakukan pencarian dan memverifikasi penggunaan materi berhak cipta. OpenAI menyatakan bahwa pelatihan AI pada data yang tersedia untuk umum termasuk dalam penggunaan wajar, tetapi perusahaan tersebut juga telah membuat kesepakatan lisensi dengan penerbit besar seperti Associated Press dan News Corp. Perusahaan tersebut tidak mengonfirmasi atau membantah penggunaan karya berhak cipta tertentu untuk pelatihan AI-nya.