Arm Mali-G77 GPU - tamamlanmış giriş ve çıkışlar

Yazar: Randy Alexander
Yaratılış Tarihi: 3 Nisan 2021
Güncelleme Tarihi: 1 Temmuz 2024
Anonim
Arm Mali-G77 GPU - tamamlanmış giriş ve çıkışlar - Teknolojiler
Arm Mali-G77 GPU - tamamlanmış giriş ve çıkışlar - Teknolojiler

İçerik


Yeni Cortex-A77 işlemci çekirdeğinin yanı sıra, Arm, yeni nesil akıllı telefon SoC'ları için yeni nesil GPU'yu tanıttı. Yeni Mali-D77 ekran işlemcisiyle karıştırılmaması gereken Mali-G77, Arm’ın Bifrost mimarisinin ayrılışını ve Valhall'e taşınmasını işaret ediyor.

Birazdan yeni mimarinin detaylarına gireceğiz. Öncelikle, kullanıcıların performans kazanımları açısından ne beklemeleri gerektiği konusunda hemen ilerleyeceğiz.

Mali-G77 performansına genel bakış

Arm, bugünün Mali-G76 modellerine kıyasla yeni nesil Mali-G77 cihazlarıyla yüzde 40'a varan grafik performansı artırıyor. Bu sayı, mimari gelişmelerin yanı sıra süreci de dikkate almaktadır. Mali-G77, 7 ila 16 gölgelendirici çekirdek arasında yapılandırılabilir ve her bir çekirdek, G76 çekirdeği ile neredeyse aynı boyuttadır. Bu, yüksek kaliteli akıllı telefonların muhtemelen düşük GP'li bir yerde olduğu gibi bugünlerde olduğu gibi benzer GPU çekirdek sayısıyla gönderileceği anlamına geliyor. Ayrıca, bu, mevcut yonga setlerine karşı bazı spekülatif performans değerlendirmeleri yapmamıza izin veriyor.


Popüler Manhattan GFXBench benchmarkına baktığımızda, yüzde 40'lık bir performans artışı mevcut nesil donanıma karşı oldukça büyük bir liderlik yaratıyor. Qualcomm’un yeni nesil Adreno çipi, oyun alanı seviyesini korumak için kendi önemli performans yükseltmesine ihtiyaç duyacak. Masalar Kol’un lehine dönüyor gibi görünüyor.

Mimari bilge, oyun performansı% 20 ila 40 artarken, makine öğrenimi% 60 oranında bir artış kazanıyor

Bu oldukça kaba oyun parkına dayanarak, 10 çekirdekli bir Mali-G77 (Huawei'den sıkça gördüğümüz bir konfigürasyon), bu neslin çizgi mobil grafik donanımının en üst seviyesine çıkmaya çalışıyor. Genellikle Samsung’un Exynos’unda görülen 12 çekirdekli bir yapılandırma, Arm’ın en yeni GPU’su için büyük bir ipucu sunuyor. Elbette, gerçek kıyaslamalar, işlem düğümü, GPU önbellek belleği, LPDDR bellek yapılandırması ve test ettiğiniz uygulamanın türü gibi diğer faktörlere bağlı olacaktır. Öyleyse yukarıdaki grafiği ağır bir dozda alın.


Yalnızca yeni mimari açısından, Arm Mali-G77'nin enerji verimliliği ve performans yoğunluğunda ortalama yüzde 30 artış sağladığını belirtti. Ayrıca INT8 nokta ürün desteği sayesinde makine öğrenimi uygulamaları için yüzde 60'lık büyük bir artış var. Oyun performansı beklentileri, sunulan başlığa ve grafik iş yükü türüne bağlı olarak yüzde 20 ila 40 arasında bir artış olarak belirlendi.

Arm'ın bu performans artışını tam olarak nasıl gerçekleştirdiğini anlamak için, mimariye daha derin bir dalış yapalım.

Bifrost’un halefi Valhall ile tanışın

Vahall, Arm’ın ikinci nesil skaler GPU mimarisidir. Bu 16 genişliğinde bir çözgü yürütme motorudur, bu GPU'nun işlem başına birim başına, işlem başına paralel olarak 16 talimatı yürütmesi anlamına gelir. Bu Bifrost'ta 4 ila 8 genişlikte.

Diğer yeni mimari özellikler, tamamen donanımda yönetilen dinamik komut çizelgeleme ve Bifrost ile işlemsel denkliği koruyan tamamen yeni bir komut setini içerir. Diğerleri arasında Arm’ın AFBC1.3 sıkıştırma formatı, FP16 render hedefleri, katmanlı render ve köşe gölgelendirici çıktıları için destek var.

Mali-G77, G76'dan paralel olarak% 33 daha fazla matematik yapıyor.

Başlıca mimari değişimleri anlamanın anahtarı, çekirdek içindeki yürütme birimini inceleyerek bulunur. GPU’nun bu bölümü numara çekmekten sorumludur.

Yürütme motorunun içinde

Bifrost'ta, her GPU çekirdeği, bazı alt uç Mali-G52 tasarımlarında üç veya iki yürütme motoru içeriyordu. Her motor bir i-önbellek, kayıt dosyası ve çözgü kontrol ünitesi içerir. Mali-G72’de her motor her çevrim için 4 talimatı yerine getiriyor ve geçen yılki Mali-G76’da 8’e yükseldi. Bu üç çekirdeğe yayılmış, her bir döngü için 12 ve 24 adet 32-bit kayan nokta (FP32) ile kaynaşmış çoklu-biriktirme (FMA) talimatı verir.

Valhall ve Mali-G77 ile, her bir GPU çekirdeğinde yalnızca tek bir yürütme motoru var. Daha önce olduğu gibi, bu motor şimdi iki işlem birimi arasında paylaşılan çözgü kontrol ünitesini, kaydını ve icache'yi barındırıyor. Her bir işlem birimi, çekirdek başına toplam 32 FP32 FMA komutunun verimi için, döngü başına 16 çözgü talimatını kullanır. Bu, Mali-G76’ya yönelik üretim hacmini yüzde 33 artırdı.

Arm GPU çekirdeği başına üçten sadece bir yürütme ünitesine geçti, ancak şimdi bir G77 çekirdeğinde iki işlem birimi var.

Ek olarak, bu işlem birimlerinin her biri iki yeni matematiksel fonksiyon bloğu içerir. Yeni dönüştürme birimi (CVT), temel tamsayı, mantık, dal ve dönüştürme talimatlarını kullanır. Özel fonksiyon ünitesi (SFU) tamsayı çarpımını, bölümleri, karekökü, logaritmaları ve diğer karmaşık tamsayı fonksiyonlarını hızlandırır.

Standart FMA ünitesi, döngü başına 16 FP32 talimatı, 32 FP16 veya 64 INT8 nokta ürün talimatını destekleyen birkaç ayar gördü. Bu optimizasyonlar, makine öğrenim uygulamalarında yüzde 60'lık bir performans artışı sağlıyor.

Dört Doku Eşleştiricisi

Mali-G77'deki diğer önemli değişiklik, önceki nesildeki çift doku eşleştiricisinden dörtlü doku eşleyicisinin tanıtılmasıdır. Doku eşleyici, bir sahnedeki 3B çokgenleri ekranda gördüğünüz 2B gösterimi ile eşlemekten sorumludur. Sert ve düşük kaliteli kenarlardan kaçınmak için açılı ve hareketli içeriği düzgünleştirmek için örnekleme, enterpolasyon ve filtreleme işlemlerinden sorumludur.

Düşük maliyetli kenar yumuşatma, görüntü kalitesine yardımcı olmak için yerinde kalır, ancak doku performansını iki katına çıkarmak buradaki en büyük faydadır. Doku ünitesi şimdi saat başına 4 bilinear dokuyu daha önce 2, saat başına 2 triliner dokuyu işliyor ve daha hızlı FP16 ve FP32 filtrelemeyi idare ediyor.

Dört doku eşleyici, önbellekteki içeriğe çarpan iplikler için daha kısa bir boru hattı sağlayarak iki yola ayrılır. Format dönüşümünü ve doku dekompresyonunu yapan miss yolu, L2 önbelleğine daha geniş bir arayüz sunar. Bu, sık sık bellekten yeni veri alması gerekebilecek makine öğrenmesi iş yükleri için de faydalıdır.

Mali-G77'de her şeyi bir araya getirmek

Arm, Valhall mimarisindeki büyük değişikliklerle örtüşmek için Mali-G77'ye bir dizi başka adım attı. Kontrol bloğu, tekli uygulama birimi tasarımı sayesinde basitleştirilirken, iç dinamik programlayıcı gerçekte her bir çekirdeğin içinde daha esnek bir öğretime izin verir. Her bir çekirdekte daha yüksek bir verim ile, veri yolu da daha önce 8'den 4 döngüye kadar gecikmeli olarak daha kısa ve düşüktür.

Yeni tasarım ayrıca Vulkan API ile daha uyumludur ve sürücü tanımlayıcılarını daha yüksek “metale” performansı için sürücü ek yükünü düşürmek üzere basitleştirir.

Özet olarak, Mali-G72 ve Valhall, Bifrost'tan oyun ve makine öğrenimi uygulamaları için önemli performans artışı vaat eden önemli değişiklikler yaptı. Daha da önemlisi, tasarım Bifrost ile aynı güç ve alan bütçelerine uyar ve mobil cihazların ısı, güç ve silikon maliyetleri hakkında endişelenmeden daha yüksek performans sunmalarını sağlar. Performans projeksiyonlarına dayanarak, Mali-G77, Qualcomm’un yeni nesil Adreno’ya parası için iyi bir şans verebilmelidir.

Amazon Fire Phone, bir 3D ekrana neden olan çevrimiçi atıcının en pahalı hataı olabilir ve Fire O Android'de de çıkar. Amazon’un el cihazının lanmanını takiben çeyrekte firmaya...

Google Keep, not defterinde daha iyi not alan uygulamalardan biridir, ancak en büyük ihmallerden biri karanlık modun olmamaıdır. Neye ki, Google'ın dinliyor gibi görünüyor...

Yeni Iletiler