DeepSeek buka 2026 dengan arsitektur AI baru mHC untuk pelatihan model skala besar lebih efisien, menurunkan biaya komputasi sambil menjaga performa.
DeepSeek buka 2026 dengan arsitektur AI baru mHC untuk pelatihan model skala besar lebih efisien, menurunkan biaya komputasi sambil menjaga performa.

DeepSeek Awali 2026 dengan Arsitektur AI Baru untuk Pelatihan Model Lebih Efisien

Lufthi Anggraeni • 02 Januari 2026 11:45
Jakarta: Startup kecerdasan buatan asal Tiongkok, DeepSeek, membuka tahun 2026 dengan langkah strategis yang berpotensi mengubah proses pelatihan model AI besar secara global. DeepSeek baru-baru ini menerbitkan laporan teknis memperkenalkan arsitektur baru.
 
Mengutip Gizmochina, arsitektur bernama Manifold-Constrained Hyper-Connections (mHC), inovasi yang dirancang untuk meningkatkan stabilitas dan efisiensi pelatihan model AI skala besar. Inovasi tersebut dilatarbelakangi oleh tantangan umum dalam machine learning modern.
 
Tantangan itu terkait meningkatnya ukuran model AI yang kerap diikuti oleh risiko kegagalan pelatihan, pemborosan energi, dan tingginya biaya komputasi. DeepSeek berupaya mengatasi hal ini dengan pendekatan yang mempertahankan perilaku model lebih dapat diprediksi saat skala parameter semakin besar.

Dengan demikian, sehingga waktu dan sumber daya yang dihabiskan selama proses pelatihan bisa ditekan tanpa mengurangi kualitas model secara signifikan. Arsitektur mHC bekerja dengan menciptakan hubungan yang dibatasi pada manifold atau ruang fitur internal model.
 
Sehingga dapat meningkatkan performa pelatihan sekaligus menjaga stabilitas terhadap perubahan skala parameter. Menurut laporan, metode ini telah diuji pada model dengan parameter 3 miliar, 9 miliar, hingga 27 miliar.
 
Metode ini menunjukkan kemampuan mempertahankan performa stabil tanpa memerlukan peningkatan besar dalam komputasi maupun biaya. Pendekatan ini penting karena banyak model AI besar di industri saat ini memerlukan infrastructure cost sangat tinggi, termasuk ribuan unit GPU dan biaya operasi yang bisa mencapai ratusan juta hingga miliaran dolar.
 
DeepSeek sebelumnya terkenal mampu melatih model AI besar dengan sumber daya yang jauh lebih ringan; misalnya model DeepSeek-R1 yang dilatih menggunakan sekitar 2.048 GPU Nvidia H800 dengan biaya sekitar USD5,6 juta (Rp93,7 miliar), jauh lebih rendah dibanding pesaing besar di pasar Barat.
 
Inovasi arsitektur ini menempatkan DeepSeek sebagai pemain penting di panggung persaingan AI global yang kian ketat. DeepSeek sebelumnya sudah dikenal dengan kemampuannya menghasilkan model open-weight berkinerja tinggi, seperti DeepSeek-V3 dan R1.
 
Kedua model ini mampu bersaing dengan model lain di pasar global dan menarik perhatian komunitas teknologi serta investor. Munculnya mHC juga berpotensi memperluas penggunaan model AI besar di lebih banyak bidang aplikasi, terutama di organisasi dan industri dengan batasan sumber daya komputasi.
 
Pendekatan lebih efisien dapat memungkinkan pengembangan solusi AI canggih lebih hemat biaya tanpa mengorbankan kapabilitas model. Sebagai informasi, DeepSeek merupakan perusahaan AI yang berkembang pesat sejak 2023 dan berbasis di Hangzhou, Tiongkok.
 
Dipimpin oleh CEO Liang Wenfeng, perusahaan ini telah merilis sejumlah model AI besar dan menjadi salah satu startup AI paling diperbincangkan di dunia. Sebelumnya, model DeepSeek-R1 pernah menjadi aplikasi paling banyak diunduh di App Store AS, bahkan sempat berdampak pada harga saham beberapa perusahaan teknologi besar di Wall Street.
 
Beragam inovasi sebelumnya, termasuk model eksperimen DeepSeek-V3.2-Exp dengan mekanisme Sparse Attention, menunjukkan upaya startup ini dalam merancang model generasi berikutnya yang lebih efisien dan canggih.
 
Arsitektur baru mHC kini menandai awal tahun 2026 sebagai tahun inovasi pelatihan AI lebih hemat sumber daya dan lebih stabil. Ke depan, DeepSeek diperkirakan akan terus menjadi penggerak penting di bidang AI efisien, terutama ketika kebutuhan pelatihan model besar semakin meningkat di berbagai sektor, dari pemrosesan bahasa alami hingga solusi AI berbasis konteks rumit.
 
Cek Berita dan Artikel yang lain di
Google News
(MMI)




TERKAIT

BERITA LAINNYA

social
FOLLOW US

Ikuti media sosial medcom.id dan dapatkan berbagai keuntungan