Key Takeaways
- Kumpulan pengembang baru sedang membangun model AI sumber terbuka.
- Grup ini menggunakan model pelatihan bahasa besar-besaran yang akan dirilis di bawah lisensi terbuka.
- AI open-source dapat membantu membuat kekuatan teknologi baru yang berpotensi mengubah permainan menjadi tidak rentan terhadap bias dan kesalahan.
Ada banyak penelitian tentang kecerdasan buatan oleh perusahaan besar (AI), tetapi satu grup online ingin mendemokratisasi prosesnya.
EleutherAI adalah kumpulan peneliti, insinyur, dan pengembang sukarela yang baru-baru ini dibentuk yang berfokus pada penelitian AI sumber terbuka. Organisasi ini menggunakan basis kode GPT-Neo dan GPT-NeoX untuk melatih model bahasa masif yang rencananya akan dirilis di bawah lisensi terbuka.
"Data sumber terbuka bermanfaat bagi para peneliti karena para ilmuwan memiliki lebih banyak sumber daya gratis yang dapat digunakan untuk melatih model dan menyelesaikan penelitian," Edward Cui, CEO perusahaan AI Graviti, mengatakan kepada Lifewire dalam sebuah wawancara email. Perusahaannya tidak terlibat dalam EueutherAI. "Kami tahu bahwa sejumlah proyek AI tertahan oleh kurangnya data berkualitas tinggi dari kasus penggunaan nyata, jadi sangat penting untuk menetapkan panduan yang memastikan kualitas data, dengan bantuan komunitas yang berpartisipasi."
Inilah Jalannya
Awal EleutherAI sangat sederhana. Tahun lalu, seorang peneliti AI independen bernama Connor Leahy memposting pesan berikut di server Discord: "Hai teman-teman, mari [SIC] berikan OpenAI untuk mendapatkan uang mereka seperti dulu."
Jadi, grup itu dibentuk. Sekarang memiliki ratusan kontributor yang memposting kode mereka di repositori perangkat lunak online GitHub.
Upaya AI sumber terbuka bukanlah hal baru. Faktanya, platform manajemen alur kerja Airflow Airbnb dan mesin penemuan data Lyft adalah hasil dari penggunaan alat sumber terbuka untuk memungkinkan tim data melakukan pekerjaan yang lebih baik dengan data, kata Ali Rehman, manajer proyek untuk perusahaan perangkat lunak CloudiTwins dalam wawancara email dengan Lifewire.
"Sama seperti revolusi open-source telah menyebabkan transformasi pengembangan perangkat lunak, demikian juga telah mendorong pengembangan dan demokratisasi ilmu data dan kecerdasan buatan," kata Rehman. "Sumber terbuka telah menjadi pendukung penting solusi ilmu data perusahaan, dengan mayoritas ilmuwan data menggunakan alat sumber terbuka."
Membuka Pintu
Mengembangkan AI open-source dapat membantu membuat kekuatan teknologi baru yang berpotensi mengubah permainan menjadi tidak rentan terhadap bias dan kesalahan, menurut beberapa pengamat.
Penelitian AI sekarang terutama dilakukan di tempat terbuka, dengan hampir semua perusahaan, laboratorium penelitian, dan universitas mempresentasikan hasil mereka segera dalam publikasi ilmiah, Kush Varshney, seorang peneliti AI di IBM, mengatakan kepada Lifewire dalam sebuah wawancara email.
"Komunitas terbuka ini penting, karena menyediakan tingkat pemeriksaan dan keseimbangan yang ditingkatkan untuk memastikan AI diteliti, dibuat, disebarkan, dan diterapkan secara bertanggung jawab," tambah Varshney. "Ini sangat penting dalam situasi di mana sistem ini dapat memengaruhi kehidupan anggota masyarakat kita yang paling rentan. Keterbukaan ini tidak hanya berlaku untuk pembelajaran mesin umum dan algoritme pembelajaran mendalam, tetapi juga untuk elemen AI yang dapat dipercaya."
Rehman mengatakan bahwa salah satu perbedaan penting antara perangkat lunak berpemilik dan sumber terbuka adalah fleksibilitas dan penyesuaian. Penelitian AI eksklusif akan memiliki masalah dengan keamanan, pembaruan, dan pengoptimalan.
"Ini karena pendekatan berbasis komunitas open-source mendapat masukan berharga dari ribuan pakar industri yang mengidentifikasi potensi kerentanan keamanan yang kemudian diremediasi lebih cepat," tambah Rehman."Konsensus masyarakat berarti kualitas terjamin dan peluang baru lebih mudah diidentifikasi."
Masalah lainnya adalah bahwa penelitian AI eksklusif tidak akan dapat dioperasikan, artinya penelitian tersebut tidak dapat bekerja dengan berbagai format data dan kemungkinan akan memiliki penguncian vendor, yang mencegah perusahaan menguji dan mencoba perangkat lunak sebelum berkomitmen pada solusi, kata Rehman.
Tetapi tidak setiap aspek penelitian AI harus open-source, Chris Kent, CEO perusahaan AI medis Reveal Surgical, mengatakan kepada Lifewire dalam sebuah wawancara email. "Penting untuk melindungi insentif ekonomi yang mendorong pengembangan komersial aplikasi utama AI," katanya.
Namun, penelitian tentang AI membutuhkan komponen sumber terbuka yang kuat, kata Kent. Dia menambahkan bahwa open source berfungsi untuk membangun kepercayaan dan menggunakan kumpulan data yang tidak atau tidak boleh dikendalikan oleh satu institusi atau perusahaan.
"Pendekatan sumber terbuka adalah cara terbaik untuk mengidentifikasi dan mengimbangi bias mendasar yang mungkin ada dalam rangkaian pelatihan dan akan mengarah pada aplikasi AI yang lebih holistik, kreatif, dan andal," kata Kent.