字节跳动 具身智能推理性能优化工程师-Seed

2025-06-13 10:26 更新

  • 北京
  • 正式
  • 研发 - 后端
  • 职位 ID:A15783


职位描述

1、负责具身智能相关模型云侧和端侧模型的性能优化和部署; 

2、运用性能分析工具,对模型推理过程进行性能剖析,定位性能瓶颈,提出有效的优化方案,并通过实验验证优化效果; 

3、通过量化、剪枝、蒸馏、算子融合、Cuda算子编写等性能优化的手段,结合业务需求,将GPU性能发挥到极致; 

4、与算法部门深度合作,进行算法与系统的联合优化。

职位要求

1、本科及以上学历,计算机/电子/自动化/软件等相关专业,有AI工程优化经验的优先; 

2、精通C/C++,精通算法与数据结构,熟悉Python; 

3、了解深度学习算法基本原理,熟悉神经网络基本架构和各算子计算方式,了解至少一种深度学习训练框架; 

4、熟练使用GPU或NPU高性能编程技术为模型训练或推理加速,例如:CUDA、CUDNN、CUTLASS、Triton等; 

5、具备以下一个或多个能力者优先: 

    1)具备自动驾驶或机器人业务背景,有NVIDIA Jetson开发经验; 

    2)熟悉大模型量化或蒸馏技术,例如:SmoothQuant、GPTQ、LCM、LCM-LoRA等; 

    3)熟练使用开源推理加速工具为模型加速,例如:TensorRT-LLM、vLLM、TVM、Torch.Compile等,并理解其优化原理。




以上内容是否对您有帮助:
在线笔记
App下载
App下载

扫描二维码

下载编程狮App

公众号
微信公众号

编程狮公众号