云知声发布首款面向IoT AI 芯片:中国芯的春天

  imtoken     |      2024-04-24 11:17

    新浪数码讯 5月16日消息,人工智能服务企业云知声今日在北京举行“匠芯 致物”发布会,推出首款面向IoT的AI芯片 UniOne 及其解决方案——雨燕(Swift)。



  在“匠芯·致物”发布会上,云知声创始人/CEO黄伟,中关村管委会副主任翁啟文,厦门火炬高新区管委会主任黄晓舟,中电健康基金CEO宋雨,前海梧桐基金合伙人王彦,中科院自动化所原副所长、研究员黄泰翼,平安好医生CTO王齐共同发布了第一代UniOne物联网AI芯片及其解决方案——雨燕(Swift)。该芯片由云知声自主设计研发,采用云知声自主AI指令集,拥有具备自主知识产权的DeepNet、uDSP(数字信号处理器),支持DNN/LSTM/CNN等多种深度神经网络模型,性能较通用方案提升超50倍。


  云知声创始人/CEO黄伟指出,“在AIoT市场加速爆发的今天,云端方案在网络、带宽、能耗、隐私以及边缘计算等方面的限制,使得面向物联网的AI芯片成为必然抉择。在推出芯片产品之前,云知声已在家居、智能音箱、儿童机器人等市场方面,基于通用芯片方案(IVM)百万级出货量的产品形态,验证了芯片市场、产品和用户场景的合理性。第一代UniOne物联网AI芯片雨燕量产后,将能快速切入市场客户并满足更多产品种类和形态上对成本、稳定性、集成度等方面的需求。”


  随着物联网的深入推进,终端设备被赋予越来越多的AI能力,要求其在保证低功耗、低成本的同时完成AI运算。然而,IoT设备与手机不同,不仅形态千变万化且需求碎片化严重,对于AI算力需求也不尽相同,因此,原有通用架构的芯片很难满足新形势下的需求。


    加速爆发的物联网对AI芯片提出全新需求加速爆发的物联网对AI芯片提出全新需求


  另一方面,AI算法的接入,对设备端芯片的并行计算能力和存储器带宽也提出了更高的要求,而尽管基于GPU的传统芯片能够在终端实现推理算法,但其并非针对深度学习设计,能效比远低于AI专用芯片。


  黄伟指出,无论是CPU还是GPU、FPGA,现有的芯片架构并非为 AI 专门设计,并不能满足物联网AI算力需求,且考虑了太多的向后兼容性,因此在性能上远非最优。“基于业务方面对芯片产品、场景的反复验证,以及对AIoT终局的判断,云知声在2014年就明确必须自主研发面向物联网的AI芯片。”


  较之于传统芯片,定制化的AI芯片由于应用场景和AI算法相对确定,因此在硬件设计上更加专门化,在面向此类任务时其相对于通用芯片在计算密度及功耗上有绝对优势。因此,相较通用芯片而言,AI芯片可以在更低的主频、更小的芯片面积,完成机器学习中同等任务量的计算,做到成本、功耗、算力等多维需求之间的完美平衡。


  第一代物联网 AI 芯片及解决方案——雨燕


  云知声第一代UniOne物联网 AI 芯片及解决方案——雨燕采用CPU+uDSP+DeepNet架构,支持8/16bit 向量、矩阵运算,基于深度学习网络架构,可将面向语音 AI 的并行运算性能发挥到极致,在更低成本和功耗下提供更高的算力。


  在架构灵活性方面,雨燕通过Scratch-Pad将主控CPU与AI加速器内部RAM相连,可提供高效的CPU与AI加速器之间的数据通道,便于CPU对AI加速器运算结果进行二次处理。另外,连接各个运算单元的可编程互联矩阵架构,提供了扩展运算指令的功能,从而进一步提升硬件架构的灵活性及可扩展性。同时,芯片采用多级多模式唤醒,从能量检测,到人类声音检测,再到唤醒词检测,针对语音设备及使用场景的定制化Power Domain等技术,可将芯片功耗降低至最低。具体而言,雨燕包括以下几大显著特征:


    高性能深度学习加速:面向深度学习和语音信号处理的 AI 定制指令以及体系架构,将面向语音 AI 的并行运算性能发挥到极致,系统运算能力提升50倍以上;高性能内部互联网络:结合片内 Memory 及内部互联网络,提高片内总线带宽的利用效率提升20倍;低功耗架构:异构 AMP架构可保证高性能与低功耗的有机结合,从而获得最佳的能效比,更适合IoT场景;端云结合:混合应用架构设计,获得本地与云端能力的最佳平衡;


  云知声联合创始人/芯片负责人李霄寒表示,云知声不仅提供雨燕芯片和终端引擎,还将应用部分向客户开源,同时提供相应定制化工具以及云端AI能力服务。通过云端芯结合,云知声基于雨燕提供的是面向一个个具体场景如智能家居、智能音箱、智能车载等的Turn-key解决方案。基于雨燕方案,可让客户站在更高的设计起点,以更低的成本在更短的时间内打造出更稳定可靠的产品。同时,开源的方案也可确保客户基于已提供的 AI 能力自行设计其它各种长尾产品形态,构建更为丰富的AIoT生态。