Model AI DeepSeek V-3 Versi Baru Dirilis, Makin Canggih dan Ungguli OpenAI
![]() |
Sumber: Venture Beat |
DeepSeek diam-diam merilis model AI terbaru, DeepSeek-V3-0324, di platform Hugging Face tanpa pengumuman resmi. Model ini merupakan penyempurnaan dari DeepSeek-V3 yang sudah ada sebelumnya.
DeepSeek-V3-0324 menawarkan performa tinggi dan dapat diadopsi langsung ke perangkat konsumen, meskipun ukuran model ini mencapai 641 gigabyte. Biasanya, model AI memerlukan GPU khusus yang ditujukan untuk data center agar dapat berjalan dengan optimal.
Namun, peneliti Apple, Awni Hannun, mengungkapkan bahwa DeepSeek-V3-0324 dapat dijalankan di Apple Mac Studio dengan chip M3 Ultra. Dalam uji coba, model ini mampu memproses lebih dari 20 token per detik dalam konfigurasi 4-bit di Mac Studio M3 Ultra dengan RAM 512 GB menggunakan mlx-lm.
The new Deep Seek V3 0324 in 4-bit runs at > 20 toks/sec on a 512GB M3 Ultra with mlx-lm! pic.twitter.com/wFVrFCxGS6
— Awni Hannun (@awnihannun) March 24, 2025
Meskipun Mac Studio M3 Ultra dibanderol sekitar 9.499 dolar AS atau sekitar Rp 157 juta, perangkat ini masih tergolong sebagai produk konsumen karena tidak menggunakan GPU khusus atau chip AI seperti yang ada di data center.
Model ini menggunakan teknik kuantisasi empat bit, yang mengurangi akurasi output tetapi meningkatkan efisiensi memori dan mengurangi latensi. Selain itu, pengujian yang dilakukan oleh peneliti AI, Xeophon, menunjukkan bahwa DeepSeek-V3-0324 lebih unggul dalam tugas pemrograman dibandingkan dengan versi sebelumnya. Model ini mencetak skor sekitar 60 persen dalam pengujian menulis kode Python dan Bash, mengungguli Claude Sonet 3.5 dari Anthropic dan GPT-4o dari OpenAI.
Tested the new DeepSeek V3 on my internal bench and it has a huge jump in all metrics on all tests.
— Xeophon (@TheXeophon) March 24, 2025
It is now the best non-reasoning model, dethroning Sonnet 3.5.
Congrats @deepseek_ai! pic.twitter.com/efEu2FQSBe
Namun, dalam hal penalaran (reasoning), model ini masih kalah dari DeepSeek-R1. Meski begitu, jika dibandingkan dengan model AI non-reasoning lainnya, DeepSeek-V3-0324 dapat dikatakan sebagai yang terbaik.
Keunggulan model ini berasal dari arsitektur mixture-of-experts (MoE), yang memungkinkan efisiensi komputasi lebih tinggi. Model AI konvensional mengaktifkan seluruh parameter dalam setiap tugas, sedangkan DeepSeek-V3-0324 hanya mengaktifkan sekitar 37 miliar dari total 685 miliar parameter yang dimilikinya. Dengan cara ini, model dapat bekerja lebih cepat dan hemat sumber daya tanpa mengorbankan performa.
DeepSeek-V3-0324 juga didukung oleh dua teknologi canggih lainnya, yaitu Multi-Head Latent Attention (MLA) dan Multi-Token Prediction (MTP). MLA meningkatkan pemahaman konteks dalam teks panjang, sementara MTP memungkinkan model menghasilkan beberapa token sekaligus dalam satu tahap, bukan satu per satu seperti model AI tradisional.
Model ini dirilis dengan lisensi MIT, berbeda dari versi sebelumnya yang menggunakan lisensi custom open-source. Dengan lisensi ini, pengembang dapat menggunakan DeepSeek-V3-0324 untuk proyek komersial maupun melakukan modifikasi tanpa batasan.
Gabung dalam percakapan