ROCm a.k.a. Radeon Open Compute stack este vechi de câtiva ani, dar a evoluat foarte mult in ultima vreme cu noi functii si capabilitati pentru a concura cu NVIDIA CUDA si Intel oneAPI.
AMD ROCm este prima platforma de dezvoltare a software-ului open-source pentru calcul GPU din clasa HPC / Hyperscale. AMD ROCm aduce filosofia UNIX, minimalism si dezvoltare software modulara pentru calcul GPU.
AMD ROCm este construit pentru scalare si accepta calcularea multi-GPU in si in afara comunicarii server-nod prin RDMA. AMD ROCm simplifica, de asemenea, stiva atunci când soferul incorporeaza direct suport RDMA peer-sync.
Deocamdata, principalul obiectiv se bazeaza pe Vega, dat fiind viitorul accelerator Arcturus si in principal instrumentarea ROCm pentru statiilor de lucru/SC.
ROCm 3.5.1 este livrat cu AMDKFD Driver Kernel Fusion actualizat pentru a remedia o eroare de acces la memorie din ROCm 3.3 pentru setari multi-GPU.
ROCm 3.5.1 ofera, de asemenea, adaugari de API pentru interogarea prioritatii unui flux cu HIP, suport pentru NCCL 2.7, cu operatiuni de trimitere/primire si actualizari RCCL pentru a oferi profil proxy de retea si suport pentru colectare / imprastiere / toate toate operatiunile colective.