Penelitian University of Reading, Inggris, menunjukkan mayoritas jawaban ujian yang dihasilkan chatbot artificial intelligence (AI) atau kecerdasan buatan ChatGPT mendekati kebenaran, akurat dan sangat sulit terdeteksi oleh penguji. Dalam studi tersebut, sekitar 94 persen tugas ujian universitas yang dibuat menggunakan ChatGPT tidak dikenali sebagai hasil karya AI oleh penilai. Bahkan, respons AI mendapatkan nilai lebih tinggi dibandingkan respons siswa asli.

Peter Scarfe (Associate Professor di University of Reading) mengatakan timnya menggunakan ChatGPT untuk menjawab 63 pertanyaan ujian dalam lima modul program studi sarjana psikologi. Ujian tersebut mencakup soal dengan jawaban singkat dan esai panjang, di mana mahasiswa diperbolehkan melihat catatan dan referensi, meskipun penggunaan AI tidak diizinkan.

Kemudian naskah AI disisipkan di antara tugas yang dikirimkan mahasiswa tanpa pengetahuan penilai. Hasil penelitian menunjukkan bahwa hanya 6 persen pekerjaan AI yang ditandai sebagai kemungkinan bukan karya asli mahasiswa. Beberapa modul bahkan tidak menandai satu pun karya sebagai mencurigakan.

Scarfe mencatat bahwa AI saat ini masih kesulitan dengan aspek penalaran abstrak dan integrasi informasi, tetapi dari 63 jawaban AI, 83,4 persen di antaranya mengungguli karya siswa. Studi ini dianggap sebagai yang terbesar dan terkuat yang pernah dilakukan dalam konteks ini. Meskipun hanya memeriksa program studi psikologi, Scarfe yakin hasilnya relevan untuk seluruh sektor akademis. Ia menyarankan agar dunia pendidikan mempertimbangkan cara penilaian yang melibatkan AI.

Thomas Lancaster dari Imperial College London juga memperkirakan hasil penelitian ini. Ia menyatakan bahwa AI dapat menghasilkan respons yang tampak masuk akal untuk pertanyaan tekstual sederhana dan terbatas, menunjukkan bahwa penilaian tanpa pengawasan rentan terhadap kecurangan.

"Beban kerja akademikus yang berat juga mengurangi kemampuan mereka untuk mendeteksi kecurangan AI, dan fenomena ini kemungkinan dialami oleh banyak institusi lainnya," katanya.

Thomas Lancaster dari Imperial College London juga memperkirakan hasil penelitian ini. Ia menyatakan bahwa AI dapat menghasilkan respons yang tampak masuk akal untuk pertanyaan tekstual sederhana dan terbatas, menunjukkan bahwa penilaian tanpa pengawasan rentan terhadap kecurangan.

"Beban kerja akademikus yang berat juga mengurangi kemampuan mereka untuk mendeteksi kecurangan AI, dan fenomena ini kemungkinan dialami oleh banyak institusi lainnya," katanya.

Baca Lebih Lanjut
Tidak Main-main! Teknologi AI Dapat Diandalkan Untuk Riset Antariksa
Detik
Jatim Media Summit 2024: AI menjadi Bagian Integral dalam Produksi Konten Jurnalisme
Timesindonesia
Mengenal Teknologi NIR, Mampu Analisis Cepat dan Akurat di Berbagai Industri
Sindonews
Jatim Media Summit 2024: Media Harus Manfaatkan AI
Timesindonesia
Vertiv AI Hub Hadirkan Portofolio Desain Referensi Infrastruktur AI
Liana Threestayanti
Terungkap! Kelemahan Model AI Multimodal GPT-4o dan Gemini 1.5 Pro
Adam Rizal
Mengenal Apa Itu USG Fetomaternal, Pemeriksaan Janin dengan AI
Sindonews
Jawaban Modul 3.6 Kesimpulan dan Rekomendasi/Saran Pelatihan Terampil Membuat Makalah MOOC Pintar
Siti Umnah
REOC hasil inovasi digital PLN IP diminati perusahaan Thailand
Antaranews
Kunci Jawaban Bahasa Indonesia Kelas 7 Kurikulum Merdeka, Perbandingan Berita Cetak dan Digital
Vega Dhini