📄️ API参数报错修改工作
1.lossAPI
📄️ Flex Checkpoint工作记录
1. Flex Checkpoint关键组件
📄️ Grad_Clip精度对齐
1.动手调用ClipGradByGlobalNorm分析
📄️ Paddle踩坑记录
1.new_group的bug
📄️ Paddle部署
1. 拉取paddle文件
📄️ Save_load问题追踪记录
1.当前保存的文件状态
📄️ VPP优化工作
1.优化vpp编排
📄️ Vpp去尾工作
1.检查当前是否支持模型层数为(vppdegree*ppdegree-1)
📄️ fused_rotary_position_embedding反向修复
fusedrotaryposition_embedding反向修复
📄️ vpp非均匀切分任务
1.寻找nummicrobatches具体是外部什么参数
📄️ 动半,动手,加local_map的动手日志分析
1.对比localmap下的动半和非localmap的动半(左是非localmap动半(纯动半),右是localmap动半)
📄️ 动态流水并行开发知识记录
PipelineStage开发记录
📄️ 动手下的流水并行代码记录
python两种解包操作:
📄️ 旧动半实现dp+pp实例记录
代码示例:
📄️ 进阶——基于VPP编排的灵活模型层分配策略研发
1.研究当前是否支持灵活模型层分配