職位描述
崗位職責:1、負責開發(fā)和優(yōu)化大模型的AI推理效率,通過算子切片、內存優(yōu)化、GPU并行計算特性、分布式集群推理等高性能優(yōu)化技術打造高性能大模型AI推理引擎;2、負責將多模態(tài)大模型在Nvidia平臺/國產(chǎn)GPU平臺優(yōu)化與部署,支撐公司AI方向核心業(yè)務的發(fā)展;3、設計并實現(xiàn)包括算子融合、模型量化、模型壓縮、蒸餾等在內的推理引擎優(yōu)化技術;4、負責大規(guī)模深度學習推理框架的研發(fā)與優(yōu)化;5、參與針對大模型的訓練與推理加速、模型服務化、GPU資源調度等功能的研發(fā);6、協(xié)同上下游團隊,分析并解決模型中遇到的大模型訓練、推理的精度和性能問題,提出性能優(yōu)化策略達成性能目標。任職資格:1、計算機相關專業(yè)本科以上學歷,5年以上Linux C++開發(fā)經(jīng)驗,熟悉C++/Python編程,具備扎實的算法和數(shù)據(jù)結構功底2、了解CPU/GPU架構與工作原理,熟悉LLM算法算子計算原理,熟悉CUDA編程并有相關開發(fā)經(jīng)驗;3、了解AI加速技術,包括但不限于TensorRT/TVM等,熟悉模型壓縮、模型量化等技術;4、具有推理加速相關,精度、速度,調優(yōu)分析工具鏈的開發(fā)經(jīng)驗;5.、熟悉GPT/transformer結構的深度優(yōu)化方法和深度學習量化優(yōu)化實現(xiàn);6、良好的團隊溝通能力、技術攻關能力,責任心強,具備一定抗壓能力。
企業(yè)介紹
暗物智能科技(以下簡稱“暗物智能”)創(chuàng)辦于2017年,公司匯聚國內外人工智能專家與多元化人才管理團隊,致力于打造新一代強認知人工智能技術平臺,服務國家戰(zhàn)略,提升人類福祉。依托于顛覆性的"小數(shù)據(jù)、大任務"創(chuàng)新研究范式,公司以強認知人工智能核心技術為主攻方向,致力于構筑以場景認知理解、多模態(tài)人機交互、認知智能決策等為核心技術優(yōu)勢的強認知人工智能技術平臺,深度賦能智慧城市、智慧商業(yè)、素質教育等國計民生領域。公司自成立以來屢獲殊榮,先后斬獲德勤中國明日之星、廣州“未來獨角獸”創(chuàng)新企業(yè)、國家高新技術企業(yè)、中國產(chǎn)學研合作創(chuàng)新示范企業(yè)等行業(yè)殊榮。暗物智能作為強認知人工智能科技的重要實踐載體,堅持原創(chuàng)科技與市場需求雙輪驅動,未來將持續(xù)依托與各省市政府、專業(yè)學術機構、知名科研院所、產(chǎn)業(yè)龍頭企業(yè)等機構的合作勢能,構建融通學、研、產(chǎn)、用的新型創(chuàng)新鏈,深度賦能產(chǎn)業(yè)轉型升級與智能社會治理。