Ilustrasi - Meta AI
Meta Tancap Gas Bangun Infrastruktur AI: Target Jutaan GPU Blackwell & Rubin - Apa Artinya bagi Tren AI 2026?
Namun tren 2026 tidak hanya soal training. Pertarungan besar justru bergeser ke inference: biaya per token, latensi, dan keandalan layanan saat AI dipakai jutaan hingga miliaran kali per hari.
Di titik ini, “Rubin” menjadi kata kunci. NVIDIA mengklaim platform Rubin dapat memangkas biaya inference per token hingga 10x dan mengurangi kebutuhan GPU untuk training model mixture-of-experts (MoE) dibanding platform Blackwell—meski angka ini tentu bergantung konfigurasi dan beban kerja.
Jika kurva biaya inference benar-benar turun tajam, dampaknya ke inovasi model bisa langsung terasa: fitur AI yang dulu mahal (real-time multimodal, agen yang “berpikir” lebih lama, personalisasi granular) menjadi lebih mungkin diproduksi massal.
Efek dominonya: perusahaan dengan akses compute raksasa bisa mendorong standar baru (kualitas, latency, kapasitas), sehingga “baseline” ekspektasi pengguna naik—yang pada gilirannya memaksa pemain lain beradaptasi lewat efisiensi model, distilasi, atau fokus vertikal.
Kata Aktualizer
- Belum ada komentar.