网络安全检测|网络安全服务|网络安全扫描-香港墨客投资移动版

主页 > 业界资讯 > 网络安全预防措施

第三次AI浪潮革命,百万倍算力挑战大起底(2)

  OpenStack AI云平台可帮助行业AI用户快速便捷的构建CPU+GPU的弹性异构云环境,并实现对异构计算资源池的动态调度与分配,支撑数据管理、模型训练、模型部署等各类AI应用场景。

  通过对GPU虚拟机的支持,浪潮OpenStack AI云平台能够以多租户的形式,按需分配异构计算资源,从而实现AI敏捷开发。

  同时,多租户任务排队策略、资源分组优化策略、租户资源配额集均衡策略以及GPU共享策略等精细化调度策略,也进一步提高了GPU资源的利用率。

  有了管理套件后,接下来就应该深入到更细节的框架优化中了。

  进一步提升算力方法:框架优化

  要满足算力的不断提升,旧有的计算框架已经无法满足新的性能需求,需要不断的进行优化。

  目前使用比较广的框架包括TensorFlow、PyTorch和Caffe。

  TensorFlow是一款强大而成熟的深度学习框架,有强大的可视化性能,以及用于高水平模型开发的多个选项。它具备生产就绪的部署选项,支持移动平台。

  Caffe用来做计算机视觉,HPC和数值优化的研究,加上产品线里的高效部署。

  PyTorch用来做非常dynamic的研究加上对速度要求不高的产品。

  对于企业来说,由于TF和Caffe的高效部署选项,基于TF和Caffe的框架优化就显得更有意义。

  浪潮针对TF和Caffe推出了Caffe-MPI, TensorFlow-Opt, FPGA计算加速引擎TF2等优化方案。

  Caffe-MPI

  Caffe-MPI是全球首个集群并行版的Caffe深度学习计算开源框架,针对高性能计算系统设计使之具备良好的并行扩展性。

  新版本在4节点16块GPU卡集群系统上训练性能较单卡提升13倍,其每秒处理图片数量是同配置集群运行的TensorFlow 1.0的近2倍。

  Caffe-MPI设计了两层通信模式,非常适合现在的高密度GPU服务器。同时Caffe-MPI还设计实现了计算和通信的重叠,提供了更好的cuDNN兼容性,用户可以无缝调用最新的cuDNN版本实现更大的性能提升。

  TensorFlow-Opt

  TensorFlow-Opt已完成了ResNet-50、ResNet-101和VGG16(batch size=128 & 256)等多个网络模型的测试。

  其中,在ResNet-50网络模型下(单卡batchsize=256),512块GPU每秒可训练128336张图片,即训练完成一个完整的ImageNet数据集(128万张图片)只需要约10秒时间,打破了AI训练性能世界纪录。

  FPGA计算加速引擎TF2

  FPGA计算加速引擎TF2支持TensorFlow,可帮助AI客户快速实现基于主流AI训练软件和深度神经网络模型DNN的FPGA线上推理,并通过全球首创的FPGA上DNN的移位运算技术获得AI应用的高性能和低延迟。

  TF2计算加速引擎提高了FPGA上AI计算性能,降低了FPGA的AI软件实现门槛,将支持FPGA广泛应用于AI生态推动更多AI应用落地。

  经过AI服务器提供算力的硬件基础,管理套件提供软件平台基础,优化框架保证紧跟算力不断增长的需求,最后就是为应用提供加速。

  实现算力需求的落地应用:案例解析

  目前,浪潮在智能视频分析、医疗影像、电力设备巡检、金融汇率预测、语音识别、AI云等应用中,已经有了很多成功案例。

  成功案例一:智能安防

  视频科技领域AI应用的场景化非常分散,需要提炼应用场景,根据应用规模,在解决方案中按需灵活组合各种产品。

  浪潮人工智能专家团队与大华合作建立了超强计算力为核心的计算平台和计算集群单元。

  在硬件上,使用AGX-2集群来处理视频相关业务计算。在管理套件上,针对智能安防的应用场景,定制开发了AIstation管理平台。

  优化后的AIStation平台,可以秒级构建AI环境,实现GPU资源智能调度,整体效率大幅提升,降低运维成本。

  目前大华股份(002236)与浪潮已经在智慧城市、雪亮工程、平安城市等多个领域共同打造信息化联合解决方案,共同促进智能物联网行业智能化、信息化转型升级和跨域发展。

  成功案例二:首钢园落地项目

  北京首钢自动化信息技术有限公司,采用了浪潮和百度联合推出的ABC一体机3.0的钢包质检解决方案后,10000张钢材照片的整体缺陷识别分类准确率达到99%以上,比人工专业检测的准确率更高。

  成功案例三:语音识别一体机

(责任编辑:admin)