“英特尔Math Kernel Library”(英特尔MKL)提供经过高度优化且能确保线程安全的数学例程,这些例程专为性能要求很高的科学、工程以及金融等领域的应用而设计。
“英特尔 MKL”也有“集群版”提供,其中不仅包含“英特尔 MKL”基本软件包中的所有功能,还“加上”了对 ScaLAPACK(可伸缩 LAPACK)与分布式内存快速傅立叶变换的支持。
功能
在英特尔处理器上具有出众的性能
使用针对基于英特尔安腾2、英特尔至强以及英特尔奔腾4 处理器的系统进行过高度优化的数学函数库,实现出众的性能。还针对新的四内核英特尔至强处理器 5300 系列进行了多线程性能的优化。与非英特尔处理器上的其它数学软件包相比,“英特尔 MKL”的性能具有明显的竞争优势。
支持多核处理器
在多处理器系统上具有极佳的伸缩性
利用“英特尔 MKL”内置的并行技术,在多处理器系统(包括最新的双内核与四内核系统)上自动获得极佳的伸缩性。“英特尔 MKL”的“级别 3 BLAS”、快速傅立叶变换及“矢量数学库”均使用 OpenMP* 进行过高度线程化处理。
线程安全性
所有的“英特尔 MKL”函数都能确保线程安全。此外还提供一个非线程版的“英特尔 MKL”。
运行时处理器自动检测
通过执行运行时检查,确保无论应用程序在什么系统上运行,都会执行针对特定处理器进行过优化的代码,从而获得最佳性能。
对 C 与 Fortran 接口的支持
其它一些替代性的数学库要求购买多个产品才能获取 C 与 Fortran 接口,与此不同,“英特尔 MKL”同时提供这两种接口。
在单个软件包中支持多种英特尔处理器
其它替代性的数学库要求购买多套产品,才能支持安腾 2、英特尔至强以及奔腾 4 处理器。“英特尔 MKL”在一个经济实惠的软件包中包含了对“所有”这些处理器的支持。
免版税发行权
运行时函数库可以随软件无限量再发行。
用户论坛
在由英特尔工程师主持的英特尔 MKL 论坛上同其他人分享经验。
英特尔首要支持
购买每套“英特尔 MKL”,即获赠为期一年的世界一流的技术支持。在此期间,包括主要发行版在内的产品升级均可免费下载。
功能
线性代数 - BLAS 与 LAPACK
部署针对英特尔处理器进行过高度优化的 BLAS 与 LAPACK 例程,它们提供的性能改善非常显著,远远超出其它替代性版本。“英特尔 MKL 9.1”与新的 LAPACK 3.1 版保持兼容。
线性代数 - ScaLAPACK
仅在“集群版”中提供。“英特尔 MKL”所实现的 ScaLAPACK 可以提供的性能改善非常显著,远远超出标准的 NETLIB 实现。
线性代数 - 稀疏矩阵解算器
使用“PARDISO 直接稀疏矩阵解算器”解算大型线性方程组;此解算器是由巴塞尔大学 (University of Basel) 授权的软件库,具有使用方便、线程安全、性能优异、内存效率极高等优点。“英特尔 MKL”还包含一个“共轭梯度”与 FGMRES 迭代稀疏矩阵解算器。
快速傅立叶变换 (FFT)
采用多维 FFT 例程(1 维到最多 7 维,支持混合基数),并提供一个易于使用的先进的 C/Fortran 接口。“英特尔 MKL”还提供一套模拟 FFTW 2.x 与 3.0 接口的 C 例程(“封装器”),便于目前的 FFTW 用户与“英特尔 MKL”比较性能。
分布式内存多处理器(集群)的快速傅立叶变换
仅在“集群版”中提供。通过将工作分配给大量的处理器来进一步改善 FFT 性能。
矢量数学库
使用矢量版的计算密集型核心数学函数(乘方、三角、指数、双曲以及对数等),可以提高应用程序的速度。
矢量随机数生成器
我们的矢量随机数生成器带来的性能改善远远超过其它替代性的标量随机数生成器,使用它们可以提高模拟速度。