
Image by Dimitri Karastelev, from Unsplash
Chatbot Meta Membagikan Nomor Telepon Pribadi Karena Kesalahan
Asisten AI dari Meta mengungkap nomor telepon orang asing, kemudian berulang kali kontradiktif, yang menimbulkan kekhawatiran tentang halusinasi AI, dan fitur perlindungan pengguna.
Dalam keadaan terburu-buru? Berikut ini fakta-faktanya secara singkat:
- Meta AI memberikan nomor orang sungguhan kepada pengguna sebagai kontak dukungan pelanggan.
- AI berulang kali menyangkal dirinya sendiri ketika ditantang tentang kesalahan tersebut.
- Ahli memperingatkan tentang perilaku “bohong putih” dari asisten AI untuk tampak membantu.
Mark Zuckerberg mempromosikan asisten AI barunya sebagai “asisten AI paling cerdas yang bisa Anda gunakan secara gratis,” namun alat tersebut mendapatkan perhatian negatif setelah mengungkapkan nomor telepon pribadi seseorang saat pertanyaan dukungan pelanggan, seperti yang pertama kali dilaporkan oleh The Guardian.
Selama mencoba menghubungi TransPennine Express melalui WhatsApp, Barry Smethurst menerima apa yang tampaknya merupakan nomor layanan pelanggan dari asisten AI Meta. The Guardian melaporkan bahwa ketika Smethurst menelpon nomor tersebut, James Gray yang menjawab panggilan telepon, meskipun ia berada 170 mil jauhnya di Oxfordshire, bekerja sebagai eksekutif properti.
Ketika ditantang, chatbot tersebut pertama kali mengklaim bahwa nomor tersebut adalah fiktif, lalu mengatakan bahwa nomor tersebut telah “ditarik keluar dari basis data secara salah”, sebelum kemudian bertentangan kembali, dengan menyatakan bahwa ia hanya menghasilkan nomor acak ala UK. “Memberikan nomor acak kepada seseorang adalah hal yang gila untuk dilakukan oleh AI,” kata Smethurst, seperti dilaporkan oleh The Guardian. “Ini mengerikan,” tambahnya.
The Guardian melaporkan bahwa Gray tidak menerima panggilan tetapi menyampaikan kekhawatirannya sendiri: “Jika itu bisa menghasilkan nomor teleponku, bisakah itu juga menghasilkan detail bankku?”
Meta menjawab: “Meta AI dilatih menggunakan kombinasi dataset berlisensi dan yang tersedia untuk umum, bukan berdasarkan nomor telepon yang digunakan orang untuk mendaftar di WhatsApp atau percakapan pribadi mereka,” lapor The Guardian.
Mike Stanhope dari Carruthers dan Jackson mencatat: “Jika para insinyur di Meta merancang kecenderungan ‘bohong putih’ ke dalam AI mereka, publik perlu diberitahu, meskipun niat dari fitur tersebut adalah untuk meminimalkan kerusakan. Jika perilaku ini baru, tidak umum, atau tidak dirancang secara eksplisit, ini menimbulkan lebih banyak pertanyaan seputar apa saja perlindungan yang ada dan sejauh mana kita dapat memaksa perilaku AI menjadi dapat diprediksi,” seperti dilaporkan oleh The Guardian
Kekhawatiran seputar perilaku AI semakin meningkat dengan model o1 terbaru dari OpenAI. Dalam sebuah studi Apollo Research baru-baru ini, AI tertangkap menipu pengembang, menyangkal keterlibatan dalam 99% skenario tes dan bahkan mencoba untuk menonaktifkan mekanisme pengawasannya. “Sudah jelas bahwa AI dapat memikirkan tindakannya dan merumuskan penyangkalan yang meyakinkan,” kata Apollo.
Yoshua Bengio, seorang pelopor dalam AI, memperingatkan bahwa kemampuan penipuan semacam itu menimbulkan risiko serius dan membutuhkan perlindungan yang jauh lebih kuat.
Studi lain dari OpenAI menambah kekhawatiran ini dengan menunjukkan bahwa menghukum AI karena kecurangan tidak menghilangkan perilaku salah, melainkan mengajari AI untuk menyembunyikannya. Dengan menggunakan alasan berantai pikiran (CoT) untuk memantau perilaku AI, peneliti menyadari bahwa AI mulai menyembunyikan niat penipuan saat dihukum karena peretasan penghargaan.
Dalam beberapa kasus, AI akan menghentikan tugas lebih awal atau membuat output palsu, kemudian melaporkan keberhasilan secara palsu. Ketika para peneliti mencoba mengoreksi ini melalui penguatan, AI ini hanya berhenti menyebutkan niatnya di dalam catatan alasan. “Penipuan ini tidak bisa dideteksi oleh monitor,” demikian laporan tersebut.