Key Takeaways
- DALL·E adalah jaringan saraf baru yang dapat menggambar gambar berdasarkan teks.
- Jaringan adalah salah satu dari semakin banyak proyek AI yang dapat meniru hasil kreatif manusia.
- Para ahli mengatakan bahwa gambar yang digambar oleh AI bukanlah kreasi asli.
Pindah, Picasso. Jaringan saraf baru dapat menggambar gambar berdasarkan teks.
DALL·E, gabungan nama artis Salvador Dalí dan WALL·E Pixar, dapat mengambil teks apa pun dan membuat gambar darinya. Sistem ini menggunakan jaringan saraf yang telah dilatih pada miliaran gambar dan contoh teks. Ini adalah salah satu dari semakin banyak proyek AI yang dapat meniru, tetapi tidak meniru, hasil kreatif manusia.
"Karena bahasa alami terus berkembang, dan sangat bergantung pada nuansa kontekstual, mengajar mesin untuk memahami bahasa dengan cukup baik untuk menggambar adalah pencapaian yang sangat signifikan," Tamara Schwartz, profesor keamanan siber di York College of Pennsylvania, kata dalam sebuah wawancara email. "Bayangkan seorang seniman sketsa polisi, itu bakat langka, memiliki kemampuan untuk membuat gambar berdasarkan deskripsi saksi."
Menggunakan Big Data untuk Menghasilkan Gambar
DALL-E dibuat oleh perusahaan riset AI OpenAI dan bekerja dengan mengumpulkan sejumlah besar data dari internet. Data tersebut kemudian diproses oleh model bahasa alami dan dilatih untuk menghasilkan gambar dari teks. DALL-E bekerja mirip dengan GPT-3 yang baru saja dirilis, model bahasa yang dibuat oleh OpenAI yang dapat diminta untuk menghasilkan bagian teks asli. GPT-3 dilatih menggunakan setengah triliun kata teks internet dan dapat menghasilkan teks yang sangat nyata.
Mengajar mesin untuk memahami bahasa dengan cukup baik untuk menggambar adalah pencapaian yang sangat signifikan.
Michael Yurushkin, pendiri dan CTO BroutonLab, sebuah perusahaan ilmu data, mengatakan dalam sebuah wawancara email bahwa DALL-E adalah "salah satu dari sedikit keberhasilan umat manusia dalam meniru kreativitas dan imajinasi kita." Dia menambahkan, "Lebih mudah untuk menyadari bagaimana AI memprediksi sesuatu dengan melalui data yang relevan, tetapi memahami bagaimana AI dapat menghasilkan gambar dari hal-hal yang belum pernah 'didengar' sebelumnya lebih sulit."
Schwartz berhati-hati untuk mencatat bahwa AI tidak membuat informasi, melainkan mengambil data bahasa dan mengubahnya menjadi gambar.
"Kreativitas awal berasal dari manusia yang membangun tugas tersebut," kata Schwartz. "Ada beberapa 'kreativitas' dari AI, karena ia bereksperimen dengan berbagai kombinasi data dan kemudian memilih dari sejumlah output potensial. Namun, seorang manusia sedang memeriksa output dan mengajari AI cara memilih dari banyak kombinasi."
Pekerjaan Detektif Robot?
Sebuah mesin dapat bereksperimen dengan data dan kombinasi objek ini jauh lebih cepat daripada seniman manusia. Schwartz mencatat bahwa suatu hari DALL-E dapat bermitra dengan seorang detektif yang mencoba merekonstruksi TKP melalui sketsa, berdasarkan kesaksian saksi mata.
"Saat saksi memberikan pernyataan mereka, komputer dapat mengambil informasi bahasa yang diucapkan dan alami dan membuat gambar pemandangan, atau banyak gambar pemandangan," katanya. "Visualisasi ini kemudian dapat diintegrasikan untuk membuat gambar yang lebih tepat dari barang bukti yang hilang. Visualisasi ini dapat diperkaya dengan mengintegrasikan citra lokasi sebelumnya sebelum kejahatan."
Beberapa program berbasis AI lainnya dapat menghasilkan karya seni. Misalnya, Ai-Da menggunakan sistem lengan robot dan teknologi pengenalan wajah yang dipasangkan dengan kecerdasan buatan untuk menciptakan karya seni. Sistem dapat menganalisis gambar yang diletakkan di depan mesin, yang dimasukkan ke dalam algoritma untuk menghasilkan gerakan lengan robot.
Namun, seniman manusia tidak perlu khawatir bahwa penguasa robot akan menggantikan mereka, kata Ahmed Elgammal, direktur Lab Seni dan Kecerdasan Buatan di Universitas Rutgers, di The New York Times tahun lalu.
"Sementara definisi seni terus berkembang, pada intinya seni adalah bentuk komunikasi antar manusia," tulisnya. "Tanpa seniman manusia di belakang mesin, AI tidak dapat melakukan lebih dari sekadar bermain dengan bentuk, apakah itu berarti memanipulasi piksel pada layar atau catatan pada buku besar musik. Aktivitas ini dapat menarik dan menarik secara persepsi, tetapi tidak memiliki makna tanpa interaksi antara artis dan penonton."
Setelah melihat karya DALL-E, saya mengerti maksud Elgammal bahwa gambar buatan AI bukanlah seni. Di sisi lain, mereka lebih baik daripada seni apa pun yang bisa saya buat. Jadi, sungguh, apa bedanya?