Най-новата версия на Vulkan спецификацията пристига със значима промяна под формата на разширение, насочено към ускоряване на работата с кооперативни матрици и оптимизации за машинно обучение върху NVIDIA хардуер.
Vulkan 1.4.352 е рутинна актуализация, но се откроява с включването на новото разширение VK_NV_cooperative_matrix_decode_vector, което надгражда предишната функционалност от VK_NV_cooperative_matrix2. Основната идея е да се разшири декодиращият callback така, че да може да обработва няколко елемента от матрица в рамките на едно извикване. Това е особено важно при работа с квантовани тегла, които обикновено се разопаковат групово. Вместо да се декодира елемент по елемент, драйвърът вече може да обработва цели групи, което намалява overhead‑а и позволява по-агресивни оптимизации.
Подобрението е насочено към ML натоварванията, които Vulkan постепенно започва да обслужва по-ефективно. NVIDIA продължава да разширява набора си от инструменти за кооперативни матрици, а това разширение е логична стъпка към по-висока производителност при inference задачи.
Днешната версия на спецификацията поставя именно VK_NV_cooperative_matrix_decode_vector като основен акцент. Паралелно с това NVIDIA вече публикува и нови Vulkan beta драйвъри за Windows и Linux, които внедряват поддръжката му: версия 596.54 за Windows и 595.44.08 за Linux. Това позволява на разработчиците да започнат да експериментират с новата функционалност веднага, без да чакат стабилни издания на драйвъра.










