AlphaEvolve DeepMind: AI Gemini Baru Jago Matematika dan Sains

May 14, 2025

2 menit teks

DeepMind, laboratorium R&D AI milik Google, bilang mereka udah mengembangkan sistem AI baru buat menyelesaikan masalah yang solusinya bisa “dinilai otomatis oleh mesin.”

Dalam percobaannya, sistem yang namanya AlphaEvolve ini bisa bantu mengoptimalkan sebagian infrastruktur yang Google pakai buat melatih model AI-nya, kata DeepMind. Perusahaan ini bilang mereka lagi bikin antarmuka buat berinteraksi sama AlphaEvolve, dan berencana meluncurkan program akses awal buat akademisi terpilih sebelum kemungkinan dirilis lebih luas.

Kebanyakan model AI itu suka halusinasi. Karena arsitektur probabilitasnya, mereka kadang suka ngarang dengan pede. Malah, model AI yang lebih baru kayak o3 dari OpenAI lebih banyak halusinasi daripada yang sebelumnya, ini nunjukkin betapa susahnya masalah ini.

AlphaEvolve ngenalin mekanisme cerdas buat ngurangin halusinasi: sistem evaluasi otomatis. Sistem ini pake model buat menghasilkan, ngritik, dan nyari kumpulan jawaban yang mungkin buat sebuah pertanyaan, terus secara otomatis mengevaluasi dan ngasih skor ke jawaban-jawaban itu buat akurasinya.

Sistem AlphaEvolve DeepMind didesain buat dipakai oleh para ahli di bidangnya, kata lab itu.Sumber Gambar:DeepMind

AlphaEvolve bukan sistem pertama yang pake cara ini. Para peneliti, termasuk tim di DeepMind beberapa tahun lalu, udah menerapkan teknik serupa di berbagai bidang matematika. Tapi DeepMind klaim, penggunaan model “tercanggih” — khususnya model Gemini — bikin AlphaEvolve jauh lebih mumpuni dibanding AI sebelumnya.

Buat pakai AlphaEvolve, pengguna harus kasih prompt ke sistem dengan masalah, bisa juga nambahin detail kayak instruksi, persamaan, cuplikan kode, dan literatur yang relevan. Mereka juga harus nyediain mekanisme buat menilai jawaban sistem secara otomatis dalam bentuk formula.

Karena AlphaEvolve cuma bisa nyelesaiin masalah yang bisa dia evaluasi sendiri, sistem ini cuma bisa kerja sama jenis masalah tertentu — khususnya di bidang kayak ilmu komputer dan optimasi sistem. Keterbatasan besar lainnya, AlphaEvolve cuma bisa ngejelasin solusi dalam bentuk algoritma, jadi kurang cocok buat masalah yang nggak numerik.

Buat nge-benchmark AlphaEvolve, DeepMind nyuruh sistem ini nyoba sekitar 50 soal matematika pilihan yang nyakup cabang dari geometri sampe kombinatorika. AlphaEvolve berhasil “nemuin kembali” jawaban terbaik yang udah diketahui buat soal-soal itu sebanyak 75% dan nemuin solusi yang lebih baik di 20% kasus, klaim DeepMind.

DeepMind juga ngevaluasi AlphaEvolve buat masalah praktis, kayak ningkatin efisiensi pusat data Google, dan mempercepat proses pelatihan model. Menurut lab itu, AlphaEvolve menghasilkan algoritma yang secara berkelanjutan memulihkan rata-rata 0,7% sumber daya komputasi Google di seluruh dunia. Sistem ini juga nyaranin optimasi yang ngurangin total waktu yang dibutuhin Google buat melatih model Gemini-nya sebesar 1%.

Biar jelas, AlphaEvolve ini bukan bikin penemuan terobosan. Dalam satu percobaan, sistem ini bisa nemuin peningkatan buat desain chip akselerator AI TPU Google yang sebelumnya udah ditandai sama alat lain.

Namun, DeepMind ngasih argumen yang sama kayak kebanyakan lab AI buat sistem mereka: AlphaEvolve bisa ngirit waktu sambil bikin para ahli bisa fokus ke pekerjaan lain yang lebih penting.

(KoranPost)

Sumber: techcrunch.com

DeepMind claims its newest AI tool is a whiz at math and science problems

Share this post

May 14, 2025

Copy Title and Content
Content has been copied.

Teruskan membaca

Berikutnya

KoranPost

Administrator WhatsApp

Salam 👋 Apakah ada yang bisa kami bantu?