Dalam film fiksi ilmiah Arrival tahun 2016, seorang ahli bahasa dihadapkan pada tugas berat untuk mengartikan bahasa asing yang terdiri dari frasa palindromik, yang dibaca ke belakang dan ke depan, ditulis dengan simbol melingkar. Ketika ia menemukan berbagai petunjuk, negara-negara di seluruh dunia menafsirkan pesan-pesan tersebut secara berbeda – dan beberapa berasumsi bahwa pesan-pesan tersebut menyampaikan ancaman.
Jika umat manusia berada dalam situasi seperti ini saat ini, cara terbaik yang bisa kita lakukan adalah beralih ke penelitian yang mengungkap bagaimana kecerdasan buatan (AI) mengembangkan bahasa.
Tapi apa sebenarnya definisi suatu bahasa? Sebagian besar dari kita menggunakan setidaknya satu untuk berkomunikasi dengan orang-orang di sekitar kita, tapi bagaimana hal itu bisa terjadi? Para ahli bahasa telah memikirkan pertanyaan ini selama beberapa dekade, namun tidak ada cara mudah untuk mengetahui bagaimana bahasa berevolusi.
Bahasa bersifat sementara, tidak meninggalkan jejak yang dapat diperiksa dalam catatan fosil. Berbeda dengan tulang, kita tidak dapat menggali bahasa kuno untuk mempelajari bagaimana bahasa tersebut berkembang seiring berjalannya waktu.
Meskipun kita mungkin tidak dapat mempelajari evolusi sebenarnya dari bahasa manusia, mungkin simulasi dapat memberikan beberapa wawasan. Di sinilah AI berperan – bidang penelitian menarik yang disebut komunikasi darurat, yang telah saya pelajari selama tiga tahun terakhir.
Untuk mensimulasikan bagaimana bahasa dapat berkembang, kami memberikan tugas sederhana kepada agen (AI) yang memerlukan komunikasi, seperti permainan di mana satu robot harus memandu robot lain ke lokasi tertentu di grid tanpa menunjukkan peta kepada mereka. Kami (hampir) tidak memberikan batasan mengenai apa yang dapat mereka katakan atau bagaimana – kami hanya memberi mereka tugas dan membiarkan mereka menyelesaikannya sesuai keinginan mereka.
Karena menyelesaikan tugas-tugas ini memerlukan agen untuk berkomunikasi satu sama lain, kita dapat mempelajari bagaimana komunikasi mereka berkembang seiring waktu untuk mendapatkan gambaran tentang bagaimana bahasa dapat berkembang.
Eksperimen serupa telah dilakukan pada manusia. Bayangkan Anda, seorang penutur bahasa Inggris, dipasangkan dengan penutur non-Inggris. Tugas Anda adalah menginstruksikan pasangan Anda untuk mengambil kubus hijau dari berbagai macam benda di atas meja.
Anda dapat mencoba memberi isyarat pada bentuk kubus dengan tangan Anda dan menunjuk ke rumput di luar jendela untuk menunjukkan warna hijau. Seiring waktu, Anda akan mengembangkan semacam bahasa proto bersama-sama. Mungkin Anda akan membuat isyarat atau simbol khusus untuk “kubus” dan “hijau”. Melalui interaksi yang berulang-ulang, sinyal improvisasi ini akan menjadi lebih halus dan konsisten, sehingga membentuk sistem komunikasi dasar.
Ini bekerja serupa untuk AI. Melalui trial and error, mereka belajar berkomunikasi tentang objek yang mereka lihat, dan lawan bicaranya belajar memahaminya.
Tapi bagaimana kita tahu apa yang mereka bicarakan? Jika mereka hanya mengembangkan bahasa ini dengan lawan bicara buatan mereka dan bukan dengan kita, bagaimana kita tahu arti setiap kata? Lagi pula, kata tertentu bisa berarti “hijau”, “kubus”, atau lebih buruk lagi – keduanya. Tantangan interpretasi ini adalah bagian penting dari penelitian saya.
Memecahkan kode
Tugas memahami bahasa AI mungkin tampak mustahil pada awalnya. Jika saya mencoba berbicara bahasa Polandia (bahasa ibu saya) kepada kolaborator yang hanya berbicara bahasa Inggris, kami tidak dapat memahami satu sama lain atau bahkan mengetahui di mana setiap kata dimulai dan diakhiri.
Tantangan yang dihadapi bahasa AI bahkan lebih besar lagi, karena mereka mungkin mengatur informasi dengan cara yang sama sekali asing dengan pola linguistik manusia.
Untungnya, para ahli bahasa telah mengembangkan alat canggih dengan menggunakan teori informasi untuk menafsirkan bahasa yang tidak diketahui.
Sama seperti para arkeolog yang mengumpulkan bahasa-bahasa kuno dari fragmen-fragmennya, kami menggunakan pola dalam percakapan AI untuk memahami struktur linguistiknya. Terkadang, kita menemukan kesamaan yang mengejutkan dengan bahasa manusia, dan di lain waktu kita menemukan cara komunikasi yang benar-benar baru.
Alat-alat ini membantu kita mengintip ke dalam “kotak hitam” komunikasi AI, mengungkap bagaimana agen buatan mengembangkan cara unik mereka sendiri dalam berbagi informasi.
Pekerjaan saya baru-baru ini berfokus pada penggunaan apa yang dilihat dan dikatakan agen untuk menafsirkan bahasa mereka. Bayangkan memiliki transkrip percakapan dalam bahasa yang tidak Anda kenal, beserta apa yang dilihat oleh setiap pembicara. Kita dapat mencocokkan pola dalam transkrip dengan objek di bidang penglihatan peserta, membangun hubungan statistik antara kata dan objek.
Misalnya, mungkin frasa “yayo” bertepatan dengan seekor burung yang terbang melewatinya – kita dapat menebak bahwa “yayo” adalah kata yang diucapkan pembicara untuk “burung”. Melalui analisis yang cermat terhadap pola-pola ini, kita dapat mulai menguraikan makna di balik komunikasi tersebut.
Dalam makalah terbaru yang saya dan rekan-rekan saya tampilkan dalam prosiding konferensi Neural Information Processing Systems (NeurIPS), kami menunjukkan bahwa metode tersebut dapat digunakan untuk merekayasa balik setidaknya sebagian dari bahasa dan sintaksis AI, sehingga memberi kami wawasan tentang bagaimana mereka dapat menyusun komunikasi.
Alien dan sistem otonom
Bagaimana hubungannya dengan alien? Metode yang kami kembangkan untuk memahami bahasa AI dapat membantu kami menguraikan komunikasi alien di masa depan.
Jika kita dapat memperoleh beberapa teks asing tertulis bersama dengan beberapa konteks (seperti informasi visual yang berkaitan dengan teks tersebut), kita dapat menerapkan alat statistik yang sama untuk menganalisisnya. Pendekatan yang kami kembangkan saat ini dapat menjadi alat yang berguna dalam studi bahasa asing di masa depan, yang dikenal sebagai xenolinguistik.
Namun kita tidak perlu mencari makhluk luar angkasa untuk mendapatkan manfaat dari penelitian ini. Ada banyak aplikasi, mulai dari menyempurnakan model bahasa seperti ChatGPT atau Claude hingga meningkatkan komunikasi antara kendaraan otonom atau drone.
Dengan memecahkan kode bahasa-bahasa yang muncul, kita dapat membuat teknologi masa depan lebih mudah dipahami. Baik itu mengetahui bagaimana mobil self-driving mengoordinasikan pergerakannya atau bagaimana sistem AI mengambil keputusan, kami tidak hanya menciptakan sistem cerdas – kami juga belajar untuk memahaminya.