Indodraakje 发表于 2024-5-20 08:27:16

ARM64体系结构与编程 第29课 可扩展矢量计算SVE/SVE2指令 预览片 part2

https://www.bilibili.com/video/BV1Bo4y1S7aw?aid=377072215

第三季奔跑吧旗舰篇视频课程:ARM64体系结构与编程全球原创的ARM64实验2020年10月1号上线观看完整视频请上淘宝搜索店铺:奔跑吧linux内核淘宝店:shop115683645.taobao.com淘宝搜索店铺:奔跑吧linux内核总店第三季旗舰篇视频课程笨叔带队以练带学几十个实验等您来撸微信公众号:runninglinuxkernel

FlyingTony 发表于 2024-5-20 08:38:08

酷安有人说ta测试armx1 ofast,armx2 sve2 ofast,sve2的汇编简短很多。所以sve2对普通app也有好处吧,只要去用。

cyj114036 发表于 2024-5-20 08:52:20

没测过SVE运算,测过用SVE寄存器进行memcpy 对比arm-simd(neon)优化的memcpy没有任何性能提升
页: [1]
查看完整版本: ARM64体系结构与编程 第29课 可扩展矢量计算SVE/SVE2指令 预览片 part2