Исследуется реальная производительность процессорного элемента в зависимости от различных способов расположения данных в кэш памяти на примере умножения двух матриц (рассматривается алгоритми Фокса, Кеннона и wbgemm).
In the given work real productivity of a processor element depending on various ways of an arrangement of data in a cache of memory on an example of multiplication of two matrixes is researching (Fox, Cannon and wbgemm algorithms is considered)