職位描述
職位描述1. 負責 SoC AI 推理引擎軟件的需求分析、架構(gòu)設計、功能開發(fā)等工作。2. 負責 SoC 上 AI 模型的適配,推理工作流原型開發(fā)及性能優(yōu)化等工作。3. 負責 Soc 上LLM模型的端到端部署,包括但不限于推理引擎的開發(fā)、模型優(yōu)化和壓縮、模型部署的端到端流程設計等。職位要求1.熟悉C/C++,熟悉算法與數(shù)據(jù)結(jié)構(gòu),熟悉Python;2.具有深度學習推理加速和優(yōu)化的經(jīng)驗,熟悉常見的加速技術,如剪枝、量化、分布式推理等,并能夠根據(jù)不同場景和硬件平臺進行針對性的優(yōu)化。3. 熟悉常見的模型量化技術,并能夠進行模型的量化優(yōu)化。4. 熟悉mindspore/tensorflow/pytorch訓練框架,有mindspore-lite/TensorRT/OnnxRuntime/TFServing等深度學習推理框架的實際使用經(jīng)驗;5. 熟悉LLM相關的算法技術以及推理加速方法。6. 熟悉NPU/GPU/CPU異構(gòu)加速方法7. 具備較強的團隊合作和溝通能力,能夠與團隊成員、業(yè)務部門緊密協(xié)作,完成項目交付和技術創(chuàng)新。
企業(yè)介紹
上海華為技術有限公司于2001年1月16日在自貿(mào)區(qū)市場監(jiān)督管理局登記成立。法定代表人孫亞芳,公司經(jīng)營范圍包括程控交換機、傳輸設備、數(shù)據(jù)通信設備、寬帶多媒體設備等。