DeepSeek R1 Guncang Dunia AI, Diduga Pakai Data Gemini dan ChatGPT

ilustrasi-logo-deepseek-ap-photoandy-wong_169

Foto: Ilustrasi logo deepseek. (AP Photo/Andy Wong)

JAKARTA (marwahkepri.com) – Kehadiran model AI R1 dari DeepSeek, perusahaan teknologi asal China, membuat geger dunia kecerdasan buatan dan mengguncang dominasi raksasa teknologi Amerika Serikat. Berbeda dari paradigma yang selama ini diyakini bahwa pengembangan AI canggih membutuhkan sumber daya besar dan akses teknologi mahal, DeepSeek justru menghadirkan model berperforma tinggi dengan biaya yang jauh lebih rendah.

Peluncuran model AI DeepSeek ini terjadi di tengah ketegangan geopolitik antara China dan AS, khususnya setelah AS memberlakukan larangan ekspor chip dan perangkat desain chip mutakhir ke China. Di tengah tekanan itu, DeepSeek justru muncul sebagai simbol bahwa China bisa mandiri dalam mengembangkan AI canggih, bahkan tanpa dukungan dari perangkat keras dan perangkat lunak asal AS. Tak heran, saham sejumlah perusahaan teknologi AS sempat anjlok pasca pengumuman peluncuran DeepSeek.

Pekan lalu, DeepSeek memperkenalkan pembaruan dari model R1 dengan kemampuan mumpuni dalam pemrosesan matematika dan pengkodean. Namun, alih-alih menjadi kebanggaan mutlak, model ini menuai kecurigaan. Para peneliti AI berspekulasi bahwa R1 dilatih menggunakan data yang berasal dari model milik kompetitor, seperti Gemini dari Google.

Salah satu pengembang AI asal Melbourne, Sam Paech, mengklaim telah menemukan kesamaan mencolok antara model terbaru DeepSeek yang diberi nama R1-0528 dengan Gemini 2.5 Pro milik Google. Ia menunjukkan bahwa penggunaan frasa dan gaya bahasa R1 sangat mirip dengan Gemini. Walau tidak dianggap sebagai bukti definitif, laporan ini diperkuat oleh pengamatan lain dari sistem evaluasi AI bernama SpeechMap yang menyatakan bahwa “jejak berpikir” R1 mengarah ke struktur milik Gemini.

Kecurigaan terhadap DeepSeek bukan hal baru. Pada Desember tahun lalu, para pengembang menemukan bahwa model DeepSeek V3 kadang-kadang menyebut dirinya sebagai ChatGPT. Hal ini memunculkan dugaan bahwa DeepSeek pernah melatih modelnya menggunakan log percakapan dari ChatGPT, produk OpenAI.

Bahkan, awal tahun ini OpenAI mengatakan kepada Financial Times bahwa mereka mendapati indikasi DeepSeek telah menggunakan teknik distilasi — metode pelatihan model AI dengan menyalin keluaran dari model yang lebih besar — dengan mengakses data lewat akun pengembang OpenAI. Microsoft, yang merupakan investor utama OpenAI, turut menemukan adanya aktivitas mencurigakan berupa ekstraksi data berskala besar yang diyakini dilakukan oleh akun terafiliasi DeepSeek.

Meskipun distilasi bukan teknik yang dilarang secara global, praktik itu melanggar ketentuan layanan OpenAI yang melarang pemanfaatan hasil model mereka untuk membangun sistem saingan.

Menurut Nathan Lambert dari lembaga AI nirlaba AI2, dugaan penggunaan data Gemini oleh DeepSeek bukanlah hal yang mustahil. Ia menilai, DeepSeek memiliki sumber daya finansial cukup besar dan dapat memanfaatkan data dari model-model terbaik di dunia untuk menghasilkan AI berkinerja tinggi, sekalipun dengan keterbatasan GPU.

Dengan atau tanpa pelanggaran etika, kehadiran DeepSeek menandai pergeseran kekuatan dalam dunia AI. Model R1-nya telah membuktikan bahwa inovasi bisa datang dari luar dominasi Silicon Valley, bahkan ketika dijalankan di tengah pembatasan ketat dan pengawasan global. MK-cnbc

Redaktur : Munawir Sani