W3Cschool
恭喜您成為首批注冊用戶
獲得88經(jīng)驗值獎勵
1、負責具身智能相關模型云側和端側模型的性能優(yōu)化和部署;
2、運用性能分析工具,對模型推理過程進行性能剖析,定位性能瓶頸,提出有效的優(yōu)化方案,并通過實驗驗證優(yōu)化效果;
3、通過量化、剪枝、蒸餾、算子融合、Cuda算子編寫等性能優(yōu)化的手段,結合業(yè)務需求,將GPU性能發(fā)揮到極致;
4、與算法部門深度合作,進行算法與系統(tǒng)的聯(lián)合優(yōu)化。
1、本科及以上學歷,計算機/電子/自動化/軟件等相關專業(yè),有AI工程優(yōu)化經(jīng)驗的優(yōu)先;
2、精通C/C++,精通算法與數(shù)據(jù)結構,熟悉Python;
3、了解深度學習算法基本原理,熟悉神經(jīng)網(wǎng)絡基本架構和各算子計算方式,了解至少一種深度學習訓練框架;
4、熟練使用GPU或NPU高性能編程技術為模型訓練或推理加速,例如:CUDA、CUDNN、CUTLASS、Triton等;
5、具備以下一個或多個能力者優(yōu)先:
1)具備自動駕駛或機器人業(yè)務背景,有NVIDIA Jetson開發(fā)經(jīng)驗;
2)熟悉大模型量化或蒸餾技術,例如:SmoothQuant、GPTQ、LCM、LCM-LoRA等;
3)熟練使用開源推理加速工具為模型加速,例如:TensorRT-LLM、vLLM、TVM、Torch.Compile等,并理解其優(yōu)化原理。
Copyright©2021 w3cschool編程獅|閩ICP備15016281號-3|閩公網(wǎng)安備35020302033924號
違法和不良信息舉報電話:173-0602-2364|舉報郵箱:jubao@eeedong.com
掃描二維碼
下載編程獅App
編程獅公眾號
聯(lián)系方式:
更多建議: