SiFive Intelligence
XM 系列
SiFive 全新 XM 系列提供了极具扩展性和高效能的 AI 计算引擎。通过集成标量、矢量和矩阵引擎,客户可以充分利用非常高效的内存带宽。 XM 系列还延续了 SiFive 在计算密集型应用中极高的每瓦性能指标。并且为了加快开发进程,SiFive 还将 SiFive Kernel Library 开源。
SiFive Intelligence 系列
- 具有可扩展矢量计算功能的高性能 AI 数据流处理器
- AI 工作负载、数据流管理、目标检测、语音和推荐处理
SiFive Intelligence
XM 系列
- SiFive 矩阵引擎
- 宽张量积设计
- 与 4 个 X-Core 紧密集成
- 与矢量单元深度融合 - 每个集群 4 个 X-Core
- 每个 X-core 都具有双矢量单元
- 执行所有其他层,例如激活函数
- 新的指数加速指令 - 新的矩阵指令
- 由标量单元取指
- 源数据来自矢量寄存器
- 目的地为各个矩阵累加器 - 1 个集群 = 16 TOPS (INT8)/GHz、8 TFLOPS (BF16)/GHz
- 每个 XM 系列集群持续带宽为 1TB/s
- XM 集群通过 2 种方式连接到内存:
- 使用 CHI 端口用于一致内存访问
- 使用高带宽端口连接到 SRAM 用于模型数据 - 主 CPU 可以是 RISC-V、x86 或 Arm(也可以没有)
- 系统可使用 CHI 跨多个芯片进行扩展
XM Enables High Scalability