Arsitektur Nvidia Ampere akan menjadi inti pada RTX 3080 dan lini GPU lainnya yang akan menjadi upgrade besar berikutnya dari tim hijau setelah seri RTX 20. Kita akan tahu lebih banyak mengenai arsitektur ini pada 31 Agustus 2020, sepertinya, karena Nvidia telah mengeluarkan hitungan mundur ke ulang tahun ke-21 dari GPU pertamanya, GeForce 256 yang akan bertepatan pada tanggal 31 Agustus. GPU Ampere harus menempati peringkat tinggi pada ranking GPU setelah mereka dirilis, dan kami juga mengharapkan hal yang sama dari pesaing Nvidia, AMD Big Navi.
Rumor yang ada saat ini menunjukkan bahwa Ampere akan menjadi inti dari GeForce RTX 3090, RTX 3080, RTX 3070 dan RTX 3060 yang akan datang. Modelnya akan terdiri dari Ti, Super, atau bahkan Ultimate. Namun, nama-nama model itu tidak ditetapkan secara resmi, mungkin akan ada perbedaan dari seri RTX 20. Penting untuk dicatat bahwa semua rumor yang ada belum dikonfirmasi, dan setiap perkiraan harga adalah rekayasa / tebakan belaka. Di luar GA100, Nvidia A100, DGX A100 dan suku cadang terkait, Nvidia belum merilis informasi konkret tentang Ampere.

Terlebih lagi, tidak ada perusahaan GPU yang memberikan detail harga berbulan-bulan sebelum peluncuran produk mereka. Nvidia sangat bungkam tentang apa yang sedang dikerjakannya, dan transisi dari arsitektur Turing ke Ampere akan menjadi hal yang sangat besar bagi perusahaan ini. Tunggu saja satu bulan lagi (paling tidak pada tanggal 31 Agustus 2020) dan kami berharap bisa memberikan hasilnya kepada kalian.
Ampere adalah kesempatan Nvidia untuk membuktikan bahwa fitur Ray Tracing sebenarnya lebih dari sekadar fitur kelas atas. Ini adalah GPU RTX Generasi ke-2, Nvidia harus membuktikan bahwa Ampere tidak hanya menjanjikan kinerja yang lebih baik dalam game menggunakan teknik rendering tradisional, tetapi peningkatan dramatis dalam kinerja Ray Tracing juga harus menjadi fokus utama mereka. Rumor terbaru terkait kinerja RTX 3080 mengatakan bahwa GPU ini mungkin akan menjadi 30% lebih cepat daripada RTX 2080 Ti.
Mengenal Nvidia Ampere RTX Series Secara Teknis

Dengan pengumuman awal GA100 dan Nvidia A100, beberapa hal telah diketahui. Pertama, Nvidia akan terus memiliki dua baris GPU terpisah, satu fokus pada data center and deep learning, dan yang lainnya pada pengolahan grafis dan game. Arsitektur Nvidia Ampere jauh lebih kompleks dari sekedar penurunan die Turing dari 12nm ke 7nm. Blok penyusun dasar GPU Nvidia disebut Streaming Multiprocessor (SM). Bahasa AMD-nya adalah Compute Unit (CU), dan pada level tinggi, relatif aman dan mudah untuk membandingkan GPU dua perusahaan berdasarkan SM vs CU. Arsitektur Turing membawa banyak perubahan pada konfigurasi SM, dan sudah pasti Ampere akan membawa perubahan tambahan.
Turing menambahkan RT cores dan Tensor cores, masing-masing untuk penghitungan pregantian antara Ray Tracing – Ray Triangle dan deep learning FP16. Di luar RT dan Tensor cores, CUDA core adalah perangkat keras GPU utama di kartu grafis Nvidia. Untuk Turing, Nvidia beralih dari memiliki 128 CUDA core per SM menjadi 64 CUDA core. Turing juga menambahkan pipeline integer (INT) khusus ke setiap CUDA core, yang memungkinkan penghitungan INT dan FP (floating-point) secara bersamaan. Sebelumnya, shader core harus beralih dari melakukan FP ke melakukan INT, yang mengurangi efisiensi dan throughput secara keseluruhan. CUDA core milik Turing juga menambahkan dukungan untuk penghitungan matematika yang dikemas cepat (FP16), yang pada dasarnya menggandakan daya komputasi FP32 tetapi dengan presisi yang berkurang, karena FP16 berguna untuk jenis penghitungan tertentu.

Kami sudah menyimpulkan semua yang berubah dengan Turing di sini, tetapi selain yang di atas, ada perubahan pada L1 / L2 cache, dukungan untuk Variable Rate Shading (VRS), mesh shader, Texture Space Shading (TTS), Multi-VIew Rendering (MVR), dan peningkatan ke Simultaneous Multi-Projection (SMP). Sebagian besar sekarang menjadi bagian dari DirectX 12 Ultimate API resmi, dan juga memiliki dukungan di VulkanRT. NVENC juga mendapat peningkatan besar.
GA100 mengupgrade arsitektur Volta GV100 yang rilis akhir 2017. Tidak ada RT cores, tetapi setidaknya ada perubahan besar pada Tensor cores. Juga, ada banyak SM: GA100 memiliki hingga 128 SM (hanya 108 SM yang diaktifkan di Nvidia A100), dengan 8192 FP32 CUDA cores, 8192 INT32 CUDA cores, dan 4096 FP64 CUDA cores. Yang terpenting, GA100 memiliki 54 miliar transistor, 2,56 kali lipat dari GV100, dengan ukuran die 826mm persegi yang hanya 1,3% lebih besar dari GV100.

Sebagian besar transistor tambahan harus digunakan untuk fitur baru. GA100 ‘hanya’ memiliki 52% lebih banyak SM dan GPU cores yang tersedia. Cache L2nya lebih besar dan Tensor cores generasi ke-3 (Volta adalah generasi pertama, Turing adalah generasi ke-2) menambahkan dukungan untuk operasi TF32 dan FP64, bersama dengan dukungan untuk operasi ‘sparcity’. Ini akan terbukti penting untuk data center, sementara FP64 biasanya tidak digunakan pada GPU konsumen (setidaknya tidak untuk tujuan bermain game). Secara keseluruhan, Nvidia mengatakan Tensor cores di GA100 dua kali lebih cepat dari yang ada di GV100.
GA100 juga memiliki dua channel HBM2 tambahan yang tersedia dibandingkan dengan GV100. Fitur tambahan termasuk multi-instance GPU support, memungkinkan GA100 berfungsi hingga tujuh GPU terpisah yang lebih kecil, support dari sparsity acceleration (fitur data center lainnya) dan kecepatan NVLink sekarang yang mencapai 600 GBps, menjadikannya tiga kali lebih cepat dari GV100.