字節(jié)跳動 具身智能推理性能優(yōu)化工程師-Seed

2025-06-13 10:26 更新

  • 北京
  • 正式
  • 研發(fā) - 后端
  • 職位 ID:A15783


職位描述

1、負責具身智能相關模型云側和端側模型的性能優(yōu)化和部署; 

2、運用性能分析工具,對模型推理過程進行性能剖析,定位性能瓶頸,提出有效的優(yōu)化方案,并通過實驗驗證優(yōu)化效果; 

3、通過量化、剪枝、蒸餾、算子融合、Cuda算子編寫等性能優(yōu)化的手段,結合業(yè)務需求,將GPU性能發(fā)揮到極致; 

4、與算法部門深度合作,進行算法與系統(tǒng)的聯(lián)合優(yōu)化。

職位要求

1、本科及以上學歷,計算機/電子/自動化/軟件等相關專業(yè),有AI工程優(yōu)化經(jīng)驗的優(yōu)先; 

2、精通C/C++,精通算法與數(shù)據(jù)結構,熟悉Python; 

3、了解深度學習算法基本原理,熟悉神經(jīng)網(wǎng)絡基本架構和各算子計算方式,了解至少一種深度學習訓練框架; 

4、熟練使用GPU或NPU高性能編程技術為模型訓練或推理加速,例如:CUDA、CUDNN、CUTLASS、Triton等; 

5、具備以下一個或多個能力者優(yōu)先: 

    1)具備自動駕駛或機器人業(yè)務背景,有NVIDIA Jetson開發(fā)經(jīng)驗; 

    2)熟悉大模型量化或蒸餾技術,例如:SmoothQuant、GPTQ、LCM、LCM-LoRA等; 

    3)熟練使用開源推理加速工具為模型加速,例如:TensorRT-LLM、vLLM、TVM、Torch.Compile等,并理解其優(yōu)化原理。




以上內容是否對您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號
微信公眾號

編程獅公眾號