Arm GPU Mali-G77 - i dettagli completi

Autore: Randy Alexander
Data Della Creazione: 3 Aprile 2021
Data Di Aggiornamento: 1 Luglio 2024
Anonim
The Complete HUAWEI Kirin 980 Tech Briefing
Video: The Complete HUAWEI Kirin 980 Tech Briefing

Contenuto


Accanto al nuovo core della CPU Cortex-A77, Arm ha svelato una GPU di prossima generazione destinata ai SoC per smartphone di prossima generazione. Il Mali-G77, da non confondere con il nuovo processore del display Mali-D77, segna la partenza dell'architettura Arm's Bifrost e il passaggio a Valhall.

In un attimo entreremo nei dettagli della nuova architettura. Innanzitutto, passeremo direttamente a ciò che gli utenti dovrebbero aspettarsi in termini di miglioramenti delle prestazioni.

Panoramica delle prestazioni del Mali-G77

Arm vanta un aumento delle prestazioni grafiche fino al 40% con i dispositivi Mali-G77 di nuova generazione rispetto ai modelli Mali-G76 di oggi. Questo numero tiene conto del processo e dei miglioramenti dell'architettura. Mali-G77 è configurabile da 7 a 16 core shader e ogni core ha quasi le stesse dimensioni del core G76. Ciò significa che gli smartphone di fascia alta verranno probabilmente spediti con un numero di core GPU simile a quello che fanno oggi, da qualche parte nei ragazzi bassi. In pratica, questo ci consente di effettuare alcune valutazioni speculative delle prestazioni rispetto ai chipset esistenti.


Osservando il famoso benchmark Manhattan GFXBench, un aumento delle prestazioni del 40 percento apre un vantaggio considerevole rispetto all'hardware di generazione attuale. Il chip Adreno di prossima generazione di Qualcomm avrà bisogno di un proprio significativo aggiornamento delle prestazioni per mantenere il campo di gioco. Le tabelle sembrano girare a favore di Arm.

Per quanto riguarda l'architettura, le prestazioni di gioco aumentano dal 20 al 40%, mentre l'apprendimento automatico guadagna un aumento del 60%

Basato su questo ballparking piuttosto grezzo, un Mali-G77 a 10 core (una configurazione che spesso vediamo da Huawei) sembra quasi delimitare l'hardware grafico mobile di punta di questa generazione. Una configurazione a 12 core, in genere vista nell'Exynos di Samsung, fornisce un grande vantaggio per l'ultima GPU di Arm. Naturalmente, i benchmark reali dipenderanno da altri fattori, tra cui il nodo del processo, la memoria cache della GPU, la configurazione della memoria LPDDR e il tipo di applicazione che stai testando. Quindi prendi il grafico sopra con una forte dose di sale.


In termini di sola nuova architettura, Arm afferma che il Mali-G77 offre un miglioramento medio del 30 percento in termini di efficienza energetica e densità delle prestazioni. C'è anche un enorme incremento del 60% per le applicazioni di apprendimento automatico, grazie al supporto del prodotto INT8 dot. Le aspettative in termini di prestazioni di gioco sono fissate tra il 20 e il 40 percento, a seconda del titolo e del tipo di carichi di lavoro grafici offerti.

Per capire esattamente come Arm ha ottenuto questo miglioramento delle prestazioni, facciamo un tuffo più profondo nell'architettura.

Incontra Valhall, il successore di Bifrost

Vahall è l'architettura GPU scalare di seconda generazione di Arm. Si tratta di un motore di esecuzione a 16 larghi orditi, il che significa essenzialmente che la GPU esegue 16 istruzioni in parallelo per ciclo, per unità di elaborazione, per core. Questo è aumentato da 4 a 8 in Bifrost.

Altre nuove caratteristiche architettoniche includono la programmazione dinamica delle istruzioni gestita interamente in hardware e un nuovissimo set di istruzioni che mantiene l'equivalenza operativa di Bifrost. Altri includono il supporto per il formato di compressione AFBC1.3 di Arm, obiettivi di rendering FP16, rendering a livelli e output dello shader di vertici.

Il Mali-G77 fa il 33% in più di matematica in parallelo rispetto al G76.

Le chiavi per comprendere le principali modifiche architettoniche si trovano esaminando l'unità di esecuzione all'interno del nucleo. Questa parte della GPU è responsabile del crunching dei numeri.

All'interno del motore di esecuzione

In Bifrost, ogni core GPU conteneva tre motori di esecuzione o due nel caso di alcuni progetti Mali-G52 di fascia bassa. Ogni motore contiene un'unità i-cache, file di registro e unità di controllo warp. Nel Mali-G72, ciascun motore gestisce 4 istruzioni per ciclo, che sono aumentate a 8 nel Mali-G76 dell'anno scorso. La diffusione su questi tre core consente di eseguire istruzioni di moltiplicazione (FMA) fuse (FP32) in virgola mobile a 32 e 24 bit per ciclo.

Con Valhall e Mali-G77, esiste un solo motore di esecuzione all'interno di ogni core GPU. Come in precedenza, questo motore ospita l'unità di controllo del warp, il registro e icache, che ora è condiviso tra due unità di elaborazione. Ogni unità di elaborazione gestisce 16 istruzioni di ordito per ciclo, per un throughput totale di 32 istruzioni FMA FP32 per core. Questo è un aumento del 33 percento del rendimento delle istruzioni sul Mali-G76.

Arm è passato da tre a una sola unità di esecuzione per core GPU, ma ora ci sono due unità di elaborazione all'interno di un core G77.

Inoltre, ciascuna di queste unità di elaborazione contiene due nuovi blocchi funzionali matematici. La nuova unità di conversione (CVT) gestisce le istruzioni di base per numeri interi, logica, derivazione e conversione. La speciale unità di funzione (SFU) accelera la moltiplicazione di numeri interi, divisioni, radice quadrata, logaritmi e altre funzioni di numeri interi complessi.

L'unità FMA standard ha visto alcune modifiche, supportando 16 istruzioni FP32 per ciclo, 32 FP16 o 64 istruzioni del prodotto INT8 dot. Queste ottimizzazioni producono un aumento delle prestazioni del 60 percento nelle applicazioni di apprendimento automatico.

Quad Texture Mapper

L'altro cambiamento chiave nel Mali-G77 è l'introduzione di un mappatore di texture quadruplo, rispetto a un mappatore di doppia trama della generazione precedente. Il mappatore di texture è responsabile della mappatura dei poligoni 3D in una scena nella rappresentazione 2D che si vede su uno schermo. È responsabile del campionamento, dell'interpolazione e del filtraggio per appianare i contenuti angolati e in movimento per evitare bordi difficili e di bassa qualità.

L'antialiasing a basso costo rimane in atto per aiutare con la qualità dell'immagine, ma il raddoppio delle prestazioni della trama è il principale vantaggio qui. L'unità texture ora elabora 4 texel bilineari per clock rispetto a 2 in precedenza, 2 tex trilineari per clock e gestisce i filtri FP16 e FP32 più veloci.

Il mappatore di texture quadruplo è diviso in due percorsi, fornendo una pipeline più corta per i thread che colpiscono il contenuto nella cache. Il percorso mancante, che gestisce la conversione del formato e la decompressione delle trame, presenta un'interfaccia più ampia alla cache L2. Ciò è utile anche per i carichi di lavoro di apprendimento automatico che potrebbero richiedere frequentemente di estrarre nuovi dati dalla memoria.

Riunire tutto nel Mali-G77

Arm ha apportato una serie di altre modifiche al Mali-G77 in coincidenza con i principali cambiamenti nell'architettura di Valhall. Il blocco di controllo è semplificato grazie al design della singola unità di esecuzione, mentre lo scheduler dinamico interno consente in realtà di impartire istruzioni più flessibili all'interno di ciascun core. Con un throughput più elevato in ciascun core, il datapath è anche più breve e con una latenza inferiore, fino a soli 4 cicli da 8 in precedenza.

Il nuovo design è inoltre allineato meglio con l'API Vulkan, semplificando i descrittori dei driver per ridurre le spese generali del driver per migliorare le prestazioni "al metal".

In sintesi, il Mali-G72 e Valhall apportano importanti modifiche da Bifrost che promettono aumenti significativi delle prestazioni per le applicazioni di gioco e di apprendimento automatico. È importante sottolineare che il design si adatta agli stessi budget di potenza e area di Bifrost, garantendo che i dispositivi mobili saranno in grado di offrire maggiori prestazioni di picco senza preoccuparsi dei costi di calore, energia e silicio. Sulla base delle proiezioni prestazionali, il Mali-G77 dovrebbe essere in grado di dare alla Adreno di prossima generazione Qualcomm una buona corsa per i suoi soldi.

Uno dei più antichi ui per martphone è tato uare il microfono per accordare la chitarra. Certo, non è tato poi coì bello, ma ha funzionato in un pizzico. Al giorno d'oggi, le ...

Ottobre è un periodo dell'anno molto peciale. Ci ono zucche dappertutto. La gente guarda film horror, The impon Halloween pecial e film di Bruce Campbell a ritmi energetici. Il Monter Mah uo...

Consigliato A Voi