专业背景:电子信息工程 · 岗位方向:HPC / CUDA 内核优化 · Infra Team
* 数值为 4096×4096 矩阵乘典型估算,实际因 tile size 选择、GPU 型号有所浮动
全部勾选后方可进入第二阶段(Triton + FlashAttention)