"Satu hal yang diketahui siapa pun yang menjalankan aplikasi AI di produksi. AI tidak murah. Ini sangat sangat mahal," kata DeSantis dalam keynote di re:Invent 2025, Las Vegas, Kamis, 4 Desember 2025.
AWS meluncurkan berbagai senjata untuk melawan masalah biaya dengan solusi mereka sendiri, chip kustom. Vice President AWS Compute & ML Services, Dave Brown, secara resmi meluncurkan Graviton5, prosesor ARM generasi kelima yang didesain khusus untuk beban kerja cloud.
"Kami bertanya, bagaimana jika server prosesor ini didesain khusus untuk beban kerja cloud, bukan diadaptasi, bukan dialihfungsikan, tapi dibangun untuk cloud dari awal," ujar Brown.
Hasilnya, chip dengan 192 core dalam satu paket dan peningkatan cache L3 yang masif. Brown mengeklaim Graviton5 menyediakan lebih dari lima kali lipat cache L3 dibanding generasi sebelumnya.
Peningkatan cache ini langsung diterjemahkan ke angka riil. Instance EC2 baru M9g yang ditenagai Graviton5 diklaim menawarkan kinerja 25% lebih baik. Brown menyebut harga dan kinjerja chip ini memiliki price-performance terbaik di EC2.
Klaim ini disokong data awal dari pelanggan besar AWS. SAP melaporkan peningkatan kinerja 60% untuk query OLTP di SAP Hana Cloud. Atlassian melihat penurunan latensi 20%, sementara Airbnb mencatat peningkatan performa hingga 25%.
Keynote ini mendapat penguatan signifikan dari testimoni Vice President Cloud Systems and Platforms Apple, Payam Mirrashidi. yang turut memaparkan data di atas panggung. Ia mengungkap Apple telah melakukan migrasi besar-besaran layanan seperti App Store dan Apple Music ke bahasa pemrograman Swift yang berjalan di atas Graviton.
"Kami telah melihat peningkatan kinerja 40% dan pengurangan biaya 30% dengan menulis ulang layanan inti dalam Swift dan memindahkan beban kerja ke Graviton," tegas Mirrashidi.
Ia mencontohkan fitur deteksi spam di iOS 26 yang menggunakan Swift on Graviton, memanfaatkan enkripsi homomorfik untuk menjaga privasi ratusan juta pengguna.
Jika Graviton menjawab efisiensi komputasi umum, Trainium3 adalah senjata AWS untuk perang biaya di ranah AI. DeSantis mengeklaim chip AI custom generasi ketiga ini dapat menekan biaya pelatihan dan inferensi model AI yang paling berat.
"Trainium3 akan memberikan biaya hingga 40% lebih rendah daripada beban kerja AI yang paling menuntut (kerja keras) sekalipun," klaim DeSantis. Untuk menunjukkan kekuatan Trainium3, AWS memamerkan kinerja UltraServer generasi baru. Rak server yang digambarkan sebagai superkomputer AI ini memuat 144 chip Trainium3.
Selain chip, AWS juga mengumumkan inovasi pada layanan fundamentalnya. Lambda Managed Instances adalah jawaban atas permintaan pengguna yang ingin kontrol lebih atas hardware tanpa kehilangan kesederhanaan serverless.
Developer bisa memilih instance EC2 tertentu. Sementara itu, AWS masih menangani manajemen dan scaling-nya. Di sisi penyimpanan, S3 Vectors membawa kemampuan pencarian vektor ke dalam Amazon S3 sebagai jantung aplikasi AI modern.
"Kami melihat waktu kueri di bawah 100 milidetik dengan basis data vektor 2 miliar vektor dalam produksi. Itulah skala dan kinerja S3 Vectors," klaim DeSantis.
Cek Berita dan Artikel yang lain di
Google News