未登录,需先登录后投递
支持把岗位加入我的收藏。请先登录后投递,登录后可继续体验立即投递动作。支持直接发起面试申请。
岗位详情 · 优岗库

GPGPU算子开发

深圳云天励飞技术股份有限公司 · 深圳 · 深圳市南山区

面议推荐匹配度待计算
人工智能半导体行业、人工智能(AI)算力芯片领域

快捷操作

  • 支持直接投递该岗位
  • 支持申请面试
  • 投递完成后可在"我的投递"查看状态

任职要求

候选人背景要求

专业要求:1.在 GPGPU 平台上,基于 CUDA/HIP/OpenCL/Triton 等编程框架设计并实现高性能算子(包括前向、反向、量化、内核融合、张量核 Tensor Core 优化等)。 2.对已有算子(或新算子)在 GPU 上的执行路径进行剖析,定位瓶颈(如内存带宽、共享内存争用、线程/块 warp 调度、指令混合等),并进行优化。 3.与编译器/运行时团队协作,将算子工程化为库、模块或 SDK,使上层算法/模型可复用高性能算子。 4.对算子在训练与推理场景中的性能、兼容性、稳定性进行验证(包括 FP32/FP16/INT8/FP8 等精度、混合精度、量化支持)。 5.配合 硬件/平台团队完成 GPU 的 bring-up、调优、资源调度、异构融合(如 GPU+CPU、GPU+TPU、GPU+FPGA)场景。 6.建立并维护算子性能分析、监控、调试工具与流程(如 Nsight 、Perfetto、内存/指令/SM 性能追踪)。 7.撰写相关技术规范/文档、参与代码评审、与算法/产品团队沟通需求,确保算子交付质量并推动上线部署。 8.跟踪 GPGPU 及深度学习硬件/软件最新技术发展,持续提出改进空间与创新方向。 工作经验:不限

智能推荐

继续看看这些岗位

基于当前岗位的推荐分和理由摘要,继续补充相似岗位,方便你对比机会。
暂无推荐岗位

当前没有更多相似推荐岗位,你可以返回优岗库继续筛选。

投递动作

收藏岗位或立即投递,开始你的求职之旅。

返回优岗库查看我的投递
支持复制链接或拉起系统分享。https://xmasdong.cn/jobs/147147
未登录,需先登录后投递
支持把岗位加入我的收藏。请先登录后投递,登录后可继续体验立即投递动作。支持直接发起面试申请。