英特尔® Stratix® 10 FPGA 特性与优势
最高两倍的核心性能
突破性的英特尔® Hyperflex™ FPGA 架构将内核性能提升高达 2 倍1。借助英特尔® Stratix® 10 产品家族,您可以将性能提升到更高水平,实现高达 8.6 TFLOPS 的单精度浮点 DSP 性能以及多达 20 个 100 GbE 接口。
与上一代 FPGA 相比,收发器带宽提升高达 7 倍
通过在单台设备中集成最多 144 个收发器,打破带宽障碍,数据速率高达 57.8 Gbps PAM-4 和 28.9 Gbps NRZ。DDR4 内存带宽高达 287.5 Gbps。HBM2 内存带宽高达 512 Gbps。支持 PCI Express 硬核和软核 IP(高达 4.0 x16,每通道 16 GT/s)。英特尔® 超级通道互连(英特尔® UPI)硬核 IP 包含 20 个传输速度为 11.2 GT/秒的通道,支持以直接高速缓存一致性的方式连接未来特定的英特尔® 至强® 可扩展处理器。
高达 16 GB 封装内 HBM2 内存
借助配备 280 万个逻辑元件的最大单片 FPGA 设备以及包括收发器和其他高级组件(如 HBM2)在内的异构 3D SiP 解决方案,实现更高的系统集成水平。其他系统支持包括标准外部内存和英特尔® 傲腾™ 内存产品。英特尔® Stratix® 10 SoC FPGA 配备高达 1.35 GHz 的 64 位四核 ARM* Cortex-A53、硬化外设和能够以 30 Gbps 的速度直接连接 FPGA 结构的高带宽接口。
面向高吞吐量人工智能应用程序最高可达 143 INT8 TOPS 或 286 INT4 TOPS
英特尔® Stratix® 10 NX FPGA 嵌入了一个新型的针对人工智能优化的模块,名为 AI Tensor Block。人工智能 Tensor Block 针对人工智能计算中使用的通用矩阵-矩阵乘法或矢量-矩阵乘法进行了调整,其功能旨在实现小型以及大型矩阵的高效工作。单个 AI Tensor Block 可以实现 143 INT8 TOPS 或 286 INT4 TOPS.
英特尔® Hyperflex™ FPGA 架构
为解决新一代系统所面临的挑战,英特尔® Stratix® 10 FPGA 和 SoC FPGA 采用全新英特尔® Hyperflex™ FPGA 架构,与上一代高端 FPGA 相比,时钟频率高达 2 倍,功耗降低高达 70%
异构 3D 集成
英特尔® Stratix® 10 FPGA 和 SoC FPGA 采用异构 3D 系统级封装 (SiP) 技术,在一个封装中集成了单片 FPGA 内核结构和 3D SiP 收发器块以及其他先进组件。
收发器
英特尔® Stratix® 10 FPGA 和 SoC FPGA 引入创新异构 3D 系统级封装 (SiP) 收发器,开启了收发器技术的新时代。
外部内存接口
英特尔® Stratix® 10 设备提供内存接口支持,包括串行、并行接口和特定英特尔® 傲腾™ 数据中心级持久内存。
人工智能 Tensor 模块
英特尔® Stratix® 10 NX FPGA 嵌入了一个新型的针对人工智能优化的模块,名为 AI Tensor Block。人工智能 Tensor Block 针对人工智能计算中使用的通用矩阵-矩阵乘法或矢量-矩阵乘法进行了调整,其功能旨在实现小型以及大型矩阵的高效工作。与标准的英特尔® Stratix® 10 FPGA DSP 模块相比,单独一个 AI Tensor 模块就可以达到 15 倍及以上的 INT82 吞吐量。
DSP
借助英特尔® Stratix® 10 设备,数字信号处理 (DSP) 设计可以在 IEEE-754 单精度浮点运算中实现每秒 8.6 万亿次浮点运算 (TFLOPS)。
与 CPU、ASIC 和 ASSP 互连
英特尔® Stratix® 10 DX 设备通过支持 UPI 和 PCIe 4.0 接口的硬核和软核知识产权模块,加速数据中心、网络、云计算和测试与测量市场中使用的应用。
硬核处理器系统
得益于英特尔在 SoC 领域的领先地位,英特尔® Stratix® 10 SoC FPGA 的新一代硬核处理器系统 (HPS) 能够提供业界性能和能效最高的 SoC。
英特尔® Stratix® 10 SX SoC FPGA 的优势
实现较高的系统集成水平
英特尔® Stratix® 10 SoC FPGA 支持 ARM* 生态系统中的 USR。ARM 的新一代 64 位架构 (ARMv8) 支持硬件虚拟化、系统管理和监控功能以及加速预处理。ARM* Cortex-A53* 处理器支持 32 位执行模式和主板支持包,面向 Linux*、Wind River VxWorks*、Micrium uC/OS-II* 和 uC/OS-III* 等主流操作系统。
经过优化的 FPGA 和 SoC FPGA 设计软件可帮助设计人员实现卓越的工作效率
针对有数百万个逻辑元件 (LE) 的 FPGA 设计优化的全新引擎可显著降低设计迭代次数。英特尔® Stratix® 10 SoC FPGA 虚拟平台支持早期软件开发和验证,并支持使用面向 OpenCL™ 的英特尔® FPGA SDK 进行基于 C 语言的设计输入,提供易于在 SoC FPGA 上实现的设计环境。借助采用 ARM* Development Studio 5* (DS-5*) 英特尔 SoC FPGA 版工具套件的英特尔 SoC FPGA Embedded Development Suite (EDS),开展异构调试、分析和整体芯片可视化。
应用
ASIC 原型设计
使用单片 FPGA 结构降低设计分区复杂性,提高工作效率。
网络安全
超过 900 MHz 的 fMAX 允许以线速率监控所有支持协议。
数据中心加速
与未来选定的英特尔® 至强® 可扩展处理器建立直接一致性连接的 UPI、 可配置 DSP 引擎、以及人工自能 Tensor 模块,以实现计算吞吐量的突破。
有线
使用支持 400G 以太网的英特尔® Hyperflex™ FPGA 架构,达到超过 700 MHz 的 fMAX。
雷达
高达 8.6 TFLOPS、符合 IEEE 754 标准的单精度浮点性能,支持以极低功耗提供 GPU 级性能。
OTN/数据中心互连
异构 3D 系统级封装 (SiP) 收发器块集成提供 30G 背板支持,并可过渡到 57.8 Gbps 和 28.9 Gbps。