Arm Mali-G77 GPU - kumpleto ang ins at out

May -Akda: Randy Alexander
Petsa Ng Paglikha: 3 Abril 2021
I -Update Ang Petsa: 1 Hulyo 2024
Anonim
Arm Mali-G77 GPU - kumpleto ang ins at out - Teknolohiya
Arm Mali-G77 GPU - kumpleto ang ins at out - Teknolohiya

Nilalaman


Sa tabi ng bagong Cortex-A77 CPU core, ang Arm ay nagbukas ng isang susunod na henerasyon na GPU na nakalaan para sa susunod na henerasyong smartphone SoCs. Ang Mali-G77, na hindi malito sa bagong processor ng Mali-D77, ay minarkahan ang pag-alis ng arkitektura ng Armour ng Arm at ang paglipat sa Valhall.

Pumasok kami sa mga magagandang detalye ng bagong arkitektura sa isang iglap. Una, lilipas kami mismo sa kung ano ang dapat asahan ng mga gumagamit sa mga tuntunin ng mga nakuha sa pagganap.

Maliit na pangkalahatang-ideya ng pagganap ng Mali-G77

Ipinagmamalaki ng arm ang isang 40 porsyento na pagganap ng pagganap ng graphics sa mga susunod na gen na aparato ng Mali-G77 kumpara sa mga modelo ng Mali-G76 ngayon. Ang numero na ito ay isinasaalang-alang sa proseso ng account pati na rin ang mga pagpapabuti ng arkitektura. Ang Mali-G77 ay mai-configure mula 7 hanggang 16 na mga shader cores, at ang bawat core ay halos eksakto sa parehong sukat ng core ng G76. Nangangahulugan ito na ang mga high-end na smartphone ay malamang na maipadala ang mga katulad na bilang ng GPU core tulad ng ginagawa nila ngayon - sa isang lugar sa mababang mga kabataan. Madali, nagbibigay-daan sa amin na gumawa ng ilang mga pagtatasa ng pagganap ng haka-haka laban sa umiiral na mga chipset.


Sa pagtingin sa tanyag na benchmark ng Manhattan GFXBench, isang 40 porsyento na pagpapalakas ng pagganap ay magbubukas ng isang malaking sukat laban sa kasalukuyang hardware ng henerasyon. Ang susunod na henerasyon na chip ng Adreno ay mangangailangan ng sariling makabuluhang pag-upgrade sa pagganap upang mapanatili ang antas ng paglalaro. Ang mga talahanayan ay lumilitaw na nagiging pabor sa Arm.

Marunong ng arkitektura, ang pagganap ng paglalaro ay nagdaragdag ng 20 hanggang 40%, habang ang pag-aaral ng makina ay nakakakuha ng 60% na pagtaas

Batay sa ito sa halip na krudo na ballparking, isang 10 pangunahing Mali-G77 (isang pagsasaayos na madalas nating nakikita mula sa Huawei) ay tumitingin sa halos lahat ng tuktok ng henerasyon na ito ng linya ng mobile graphics graphics. Ang isang 12 pangunahing pagsasaayos, na karaniwang nakikita sa Exynos ng Samsung, ay nagbibigay ng isang malaking lead para sa pinakabagong GPU ng Arm. Siyempre, ang totoong mga benchmark ay depende sa iba pang mga kadahilanan, kasama ang proseso ng node, GPU cache memory, pagsasaayos ng memorya ng LPDDR, at ang uri ng application na iyong sinubukan. Kaya kunin ang graph sa itaas na may mabigat na dosis ng asin.


Sa mga tuntunin ng bagong arkitektura lamang, sinabi ng Arm na ang Mali-G77 ay nag-aalok ng isang average na 30 porsiyento na pagpapabuti sa kahusayan ng enerhiya at density ng pagganap. Malaki din ang 60 porsyento na pagtaas para sa mga aplikasyon ng pag-aaral ng machine, salamat sa suporta sa produkto ng INT8 dot. Ang mga inaasahan sa pagganap ng gaming ay nakatakda sa isang lugar sa pagitan ng isang 20 at 40 porsyento na mapalakas, depende sa pamagat at uri ng mga graphics workload na inaalok.

Upang maunawaan nang eksakto kung paano nakamit ng Arm ang pagtaas ng pagganap na ito, kumuha ng mas malalim na pagsisid sa arkitektura.

Kilalanin si Valhall, ang kahalili ni Bifrost

Ang Vahall ay pangalawang henerasyon ng scalar GPU na arkitektura ng Arm. Ito ay isang 16-wide-warp na pagpapatupad ng makina, na mahalagang nangangahulugang ang GPU ay nagsasagawa ng 16 na tagubilin na kahanay sa bawat siklo, bawat pagproseso ng yunit, bawat core. Na mula sa 4 at 8 ang lapad sa Bifrost.

Ang iba pang mga bagong tampok na arkitektura ay kasama ang mga dinamikong pag-iskedyul ng pagtuturo na pinamamahalaan nang buo sa hardware at isang all-new set ng pagtuturo na nagpapanatili ng pagkakapareho sa pagpapatakbo sa Bifrost. Kasama sa iba ang suporta para sa format ng compression ng Arm's AFBC1.3, FP16 target ng render, layered rendering, at vertex shader output.

Ang Mali-G77 ay gumagawa ng 33% na higit pang matematika na kahanay kaysa sa G76.

Ang mga susi sa pag-unawa sa mga pangunahing pagbabago sa arkitektura ay matatagpuan sa pamamagitan ng paglabas ng unit ng pagpatay sa loob ng core. Ang bahaging ito ng GPU ay may pananagutan para sa number crunching.

Sa loob ng pinaandar na makina

Sa Bifrost, ang bawat GPU core ay naglalaman ng tatlong pagpapatupad ng mga makina o dalawa sa kaso ng ilang mga disenyo ng Mali-G52. Ang bawat engine ay naglalaman ng isang i-cache, magrehistro ng file, at unit ng control ng warp. Sa Mali-G72, ang bawat engine ay humahawak ng 4 na tagubilin sa bawat siklo, na tumaas sa 8 sa Mali-G76 ng nakaraang taon. Ang pagkalat sa mga tatlong cores na ito ay nagbibigay-daan para sa 12 at 24 32-bit na lumulutang na tuldok (FP32) na nag-fuse ng multip-accumulate (FMA) na mga tagubilin bawat siklo.

Sa Valhall at sa Mali-G77, iisa lamang ang makina ng pagpapatupad sa loob ng bawat GPU core. Tulad ng dati, ang makina na ito ay pinapaloob ang yunit ng control ng warp, magrehistro, at icache, na naibahagi ngayon sa dalawang yunit ng pagproseso. Ang bawat yunit ng pagproseso ay humahawak ng 16 mga tagubilin ng warp sa bawat siklo, para sa isang kabuuang pagdaan ng 32 na FP32 FMA na mga tagubilin sa bawat core. Iyon ay isang 33 porsyento na pagtaas sa pag-uugnay sa pagtuturo sa Mali-G76.

Lumipat ang arm mula sa tatlo hanggang sa isang yunit ng pagpapatupad lamang sa bawat GPU core, ngunit mayroon na ngayong dalawang yunit ng pagproseso sa loob ng isang G77 core.

Bilang karagdagan, ang bawat isa sa mga yunit ng pagproseso ay naglalaman ng dalawang bagong bloke ng pag-andar sa matematika. Ang bagong convert unit (CVT) ay humahawak ng mga pangunahing tagubilin sa integer, lohika, sanga, at conversion. Ang espesyal na yunit ng pag-andar (SFU) ay nagpapabilis sa pagdami ng integer, mga dibisyon, square root, logarithms, at iba pang mga kumplikadong pag-andar ng integer.

Ang karaniwang yunit ng FMA ay nakakita ng ilang mga pag-tweak, na sumusuporta sa 16 na tagubilin FP32 bawat cycle, 32 FP16, o 64 INT8 dot na mga tagubilin sa produkto. Ang mga pag-optimize na ito ay gumagawa ng 60 porsyento na pagtaas ng pagganap sa mga aplikasyon ng pag-aaral ng machine.

Ang Quad Texture Mapper

Ang iba pang mga pangunahing pagbabago sa Mali-G77 ay ang pagpapakilala ng isang quad texture mapper, mula sa isang dalawahang texture mapper sa nakaraang henerasyon. Ang texture mapper ay may pananagutan para sa pagma-map sa mga 3D polygons sa isang eksena sa representasyon ng 2D na nakikita mo sa isang screen. Ito ay may pananagutan para sa pag-sampling, paghihiwalay, at pag-filter upang makinis ang mga anggulo at paglipat ng nilalaman upang maiwasan ang malupit, mababang kalidad.

Ang mga mababang gastos na anti-aliasing ay nananatili sa lugar upang makatulong sa kalidad ng imahe, ngunit ang pagdodoble ng pagganap ng texture ang pangunahing pakinabang dito. Ang yunit ng texture ay nagpoproseso ngayon ng 4 na bilinear texels bawat orasan mula 2 dati, 2 trilinear texels bawat orasan, at hawakan ang mas mabilis na pagsasala ng FP16 at FP32.

Ang quad texture mapper ay nahahati sa dalawang landas, na nagbibigay ng isang mas maikling pipa para sa mga thread na tumama sa nilalaman sa cache. Ang miss path, na humahawak sa pag-convert ng format at decompression ng texture, ay nagtatampok ng isang mas malawak na interface sa L2 cache. Nakatutulong din ito para sa mga pag-aaral ng mga pag-aaral ng machine na maaaring madalas na kailangan upang makakuha ng bagong data mula sa memorya.

Pinagsasama-sama ang lahat sa Mali-G77

Ang Arm ay gumawa ng maraming iba pang mga pag-tweak sa Mali-G77 upang magkatugma sa mga pangunahing pagbabago sa arkitektura ng Valhall. Ang control block ay pinasimple salamat sa nag-iisang disenyo ng yunit ng pagpapatupad, habang ang panloob na dynamic na scheduler ay talagang nagbibigay-daan para sa isang mas nababaluktot na pagtuturo na naglalabas sa loob ng bawat core. Sa pamamagitan ng isang mas mataas na throughput sa bawat pangunahing, ang datapath ay mas maikli at mas mababa sa latency, hanggang sa 4-cycle mula sa 8 dati.

Ang bagong disenyo ay mas mahusay na nakahanay sa Vulkan API, pinasimple ang mga deskriptor ng driver na mas mababa ang driver ng overhead para sa pinabuting pagganap sa "sa metal".

Sa buod, ang Mali-G72 at Valhall ay gumawa ng mga mahalagang pagbabago mula sa Bifrost na nangangako ng mga makabuluhang pagpapalakas sa pagganap para sa mga aplikasyon ng paglalaro at machine. Mahalaga, ang disenyo ay umaangkop sa loob ng parehong mga badyet ng lakas at lugar bilang Bifrost, tinitiyak na ang mga aparatong mobile ay maaaring mag-alok ng mas maraming pagganap ng rurok nang hindi nababahala tungkol sa init, kapangyarihan, at mga gastos sa silikon. Batay sa mga pagpapakita ng pagganap, ang Mali-G77 ay dapat magbigay ng Qualcomm's susunod na gen Adreno para sa pera.

Ang Anker ay ia a mga ma kilalang tagagawa ng acceory doon, na nag-aalok ng iba't ibang mga peripheral para a iyong mobile device. a kabutihang palad, ang iba't ibang mga acceorie ng ingilin n...

Ang Amazon ay lumulunad ang mga deal ng maraming a run-up a Amazon Prime Day na naganap noong Hulyo 15 at 16. Ngayon, mayroon itong ilang mga cut-preyo na TV na nag-aalok na maaaring guto mong umilip ...

Mga Kagiliw-Giliw Na Artikulo