Ana Sayfa

Nvidia GB10'un Bellek Alt Sistemi: CPU Tarafından Bir Bakış

1 dk okuma

Nvidia ve Mediatek iş birliğiyle geliştirilen GB10, Nvidia'nın Blackwell mimarisini entegre bir GPU'ya taşıyor. Bu güçlü çip, 48 Blackwell SM'ye sahip GPU'sunun yanı sıra, 10 adet Cortex X925 ve 10 adet Cortex A725 çekirdeği içeren oldukça yetenekli bir CPU tarafına sahip. Makale, bu yüksek işlem gücünü beslemek için tasarlanan GB10'un bellek alt sistemini CPU perspektifinden inceliyor ve Nvidia ile Mediatek'in tasarım kararlarına odaklanıyor. Çip üzerindeki CPU çekirdekleri iki kümeye ayrılmış durumda; her küme beş A725 ve beş X925 çekirdeği barındırıyor. A725 çekirdekleri 2.8 GHz'de çalışırken, X925 çekirdekleri 3.9 GHz'den 4 GHz'e kadar hızlara çıkabiliyor.

Önbellek mimarisine bakıldığında, hem A725 hem de X925 çekirdekleri 64 KB L1 komut ve veri önbelleklerine sahip. A725 çekirdekleri 512 KB L2 önbellek kullanırken, X925 çekirdekleri 2 MB L2 önbellek ile geliyor. A725'in L2 önbelleği düşük gecikme süresi sunsa da, L3 önbellek gecikmesi 21 nanosaniyeyi aşarak nispeten yüksek kalıyor. İlk CPU kümesi 8 MB L3, ikinci küme ise 16 MB L3 önbelleğe sahip. A725 çekirdekleri için düşük L2 kapasitesi, daha fazla çekirdek entegrasyonuna olanak tanımak ve tek iş parçacıklı performansı X925'e bırakmak amacıyla yapılmış bir tercih olarak değerlendiriliyor.

X925 çekirdekleri, 2 MB'lık daha büyük L2 önbellekleri ve A725'e kıyasla çok daha iyi olan yaklaşık 14 nanosaniyelik L3 gecikme süreleriyle dikkat çekiyor. Bu, X925 çekirdeklerinin yüksek performans sunması için daha dengeli bir önbellek kurulumuna sahip olduğunu gösteriyor. L3 önbelleğin ardından 16 MB'lık bir sistem seviyesi önbellek (SLC) yer alıyor. SLC'nin gecikme süresi, erişim sağlayan çekirdeğe bağlı olarak 42 ila 47 nanosaniye arasında değişiyor. Bu detaylı inceleme, GB10'un karmaşık bellek hiyerarşisinin, farklı CPU çekirdeklerinin performans ihtiyaçlarını nasıl karşıladığını ortaya koyuyor.

İçgörü

Nvidia GB10'un bellek alt sistemi tasarımı, entegre GPU ve güçlü CPU çekirdeklerinin performans gereksinimlerini dengelemek için yapılan önemli mühendislik tercihlerini gözler önüne seriyor.

Kaynak