人工智能早已影響了人們工作生活的各個方面,人工智能需要數據的支持,而大數據處理早已進入需要云端支持的時代。因此面向云端數據中心的人工智能加速卡為數據處理提供了強大的算力。
繼去年12月發布了首款面向數據中心的人工智能訓練加速卡“云燧T10”后,今天燧原科技發布首款人工智能推理產品“云燧i10”,這正是一款面向云端數據中心的高性能推理卡,用以滿足由于AI應用和落地場景迅速擴大,市場和客戶對更高性價比以及國產化和差異化云端推理產品的需求。
燧原科技CEO趙立東表示,“當前全球科技產業特別是集成電路產業正在發生深刻變革,燧原科技會繼續加速技術創新和產品迭代。”
與此同時,與上下游伙伴合作,加速業務落地,擴大市場規模。針對互聯網數據中心、垂直行業(金融、保險、教育、醫療及運營商等)、新基建三大業務方向的應用場景,完善訓練和推理軟件棧、工具鏈和解決方案。通過產學研協作,共建國產化產業生態,助力中國人工智能和集成電路產業的發展。”
人工智能對于算力的要求非常高。云燧i10是單槽位標準卡,大大加快了人工智能的深度學習過程中的運算環節。支持PCIe 4.0,FP32算力達到17.6TFLOPS,BF16/FP16算力70.4TFLOPS。
據介紹,“云燧i10”擁有卓越的算力、出色的通用性以及優異的價值特性:高算力、多精度:FP32算力17.6TFLOPS,BF16/FP16算力70.4TFLOPS;采用自主指令集,支持從FP32到INT8等多種精度,而最大功耗僅為150W;高能效、高可靠性:采用動態調頻調壓(DVFS)技術,根據負載加速應用性能,支持RAS、ECC;設備虛擬化:實現多用戶支持,最大可支持4個設備實例,具備計算與存儲資源的獨享性,多用戶間安全隔離;單顆芯片上可同時部署不同的業務與負載,實現多任務并行,有效提高利用率;支持KVM、Xen等系統虛擬化平臺;易編程、生態開放:開放C++和Python編程接口,支持CNN及NLP典型模型,支持主流機器學習框架,并通過SDK提供深度定制。
燧原科技COO張亞林介紹道:“云燧i10在多項基準測試中,性能領先,并已完成與浪潮、新華三及Supermicro等服務器廠商推理服務器的適配。可適用于視頻圖像、語音、自然語言處理、知識圖譜等多種應用場景,并針對內容理解、推薦、識別等高精度場景做了優化。與此同時,面向多元的開發需求,我們提供不同層次的開發模式,針對客戶定制化算法模型聯合開發,從而實現與客戶的雙贏。”
除了硬件,燧原科技同時推出針對推理產品的高性能神經網絡模型推理引擎“鑒算TopsInference”。通過計算圖優化、算子融合、模型壓縮、量化等優化技術,可以為深度學習應用提供低延遲、高吞吐率的推理性能。
通過TopsInference的推理加速,配合i10 的高算力及虛擬化技術,數據中心可以高性價比地部署計算密集型深度學習工作負載。此外TopsInference除TensorFlow、PyTorch模型格式外,還支持ONNX通用模型格式,借助燧原GCU-CARA架構的可編程性,可以應對未來深度神經網絡日益多樣化、復雜的增長趨勢。云燧i10與云燧T10以及“馭算TopsRider”軟件平臺搭配,可實現算法模型在數據中心訓推一體化的快速生產部署。
推薦閱讀
關于我們 廣告服務 手機版 投訴文章:39 60 2 914 2@qq.com
Copyright (C) 1999-2020 m.yihuigz.com 愛好者日報網 版權所有 聯系網站:39 60 2 914 2@qq.com