写点什么

困扰一周的奇葩 bug:重复相似代码多,导致单片机程序跑飞

发布于: 2021 年 03 月 25 日
困扰一周的奇葩bug:重复相似代码多,导致单片机程序跑飞

今天是个好日子,困扰一周的 bug 终于解决了,迫不及待将这个奇葩问题分享给各位朋友~


硬件环境:


国产 MCU:华大 HC32L130


问题描述:


最近做一款基于 Modbus 协议的三通道温度采集模块,程序设计是移植之前验证过的两通道温度、压力采集模块的程序,完成后,三通道温度采集程序可正常运行。


最后需要对三通道温度采集模块添加二次校准算法功能,新功能写好后,也可正常采集和通信,但是使用 IAP 功能时,flash 扇区擦除失败,无法跳转到升级程序,且程序跑飞。


问题分析和解决:


尝试 1:修改新增加的二次校准算法功能程序。


将二次校准算法功能屏蔽,升级程序可正常使用,估计是这里的问题,进行修改:变量定义、指针地址、内存管理等一系列操作下来,问题没有解决。


此时我的排查侧重点是数据内存或者地址溢出方面。


尝试 2:查看 flash 配置是否存在问题。


既然是 flash 扇区擦除失败,会不是是配置存在问题?通过查看寄存器,修改时隙间隔等方面,还是无法解决问题,主要是之前运行一直没问题,排除这点。


那么会不会新添加的二次校准算法功能和已经存在的功能冲突呢?或者是使用的全局结构体变量有问题?


尝试 3:整体研读项目代码,重点排查二次校准算法功能中全局变量、全局结构体变量的使用。


并没有变量使用不合理或者逻辑错误的地方。


尝试 4:按照功能模块屏蔽代码,是否是程序中某部分功能与二次校准算法功能程序冲突。


通过一点点屏蔽程序,发现在二次校准算法功能程序正常运行前提下,屏蔽主循环的 Modbus 显示功能、Modbus 配置 UART 功能、传感器 GPIO 配置等多个部分均可正常使用 IAP 功能。


通过仔细分析,这些功能模块中变量定义和使用均不存在问题,此时心态很郁闷了,这些模块功能基本没有关联。


尝试 5:通过修改某个功能模块代码,是否可使程序正常运行。


此时项目整体功能是不存在逻辑问题和 bug 的,是否可以通过将以上那些存在未知冲突故障的代码换种写法,让程序正常运行呢?


经过了一系列操作和尝试,将主循环的 Modbus 显示功能代码换种更简洁的写法,程序可以完美运行~


原程序如下所示:


 if(nModbusCalRegs[Modbus_RegCalChan-Modbus_RegCalChan] == TEMP1_CHANNEL_ID) {   ///< 初始化温度传感器:校准量程、零点偏移、灵敏度、零点偏移系数和灵敏度偏移系数   nModbusCalRegs[Modbus_CalChanIndex] = strDeviceParamSave.temp1_range;
memcpy((uint8_t *) &ltemp,(uint8_t *) &strDeviceParamSave.temp1_bias1, 4);
ntemp = (uint16_t) ltemp; nModbusCalRegs[Modbus_CalZeroIndex] = ntemp; ntemp = (uint16_t) (ltemp >> 16); nModbusCalRegs[Modbus_CalZeroIndex+1] = ntemp;
memcpy((uint8_t *) &ltemp,(uint8_t *) &strDeviceParamSave.temp1_kate1, 4);
ntemp = (uint16_t) ltemp; nModbusCalRegs[Modbus_CalKateIndex] = ntemp; ntemp = (uint16_t) (ltemp >> 16); nModbusCalRegs[Modbus_CalKateIndex+1] = ntemp;
memcpy((uint8_t *) &ltemp,(uint8_t *) &strDeviceParamSave.temp1_bias2, 4);
ntemp = (uint16_t) ltemp; nModbusCalRegs[Modbus_CalKZeroIndex] = ntemp; ntemp = (uint16_t) (ltemp >> 16); nModbusCalRegs[Modbus_CalKZeroIndex+1] = ntemp;
memcpy((uint8_t *) &ltemp,(uint8_t *) &strDeviceParamSave.temp1_kate2, 4);
ntemp = (uint16_t) ltemp; nModbusCalRegs[Modbus_CalKSensiIndex] = ntemp; ntemp = (uint16_t) (ltemp >> 16); nModbusCalRegs[Modbus_CalKSensiIndex+1] = ntemp; } else if(nModbusCalRegs[Modbus_RegCalChan-Modbus_RegCalChan] == TEMP2_CHANNEL_ID) { ///< 初始化温度传感器:校准量程、零点偏移、灵敏度、零点偏移系数和灵敏度偏移系数 nModbusCalRegs[Modbus_CalChanIndex] = strDeviceParamSave.temp2_range;
memcpy((uint8_t *) &ltemp,(uint8_t *) &strDeviceParamSave.temp2_bias1, 4);
ntemp = (uint16_t) ltemp; nModbusCalRegs[Modbus_CalZeroIndex] = ntemp; ntemp = (uint16_t) (ltemp >> 16); nModbusCalRegs[Modbus_CalZeroIndex+1] = ntemp;
memcpy((uint8_t *) &ltemp,(uint8_t *) &strDeviceParamSave.temp2_kate1, 4);
ntemp = (uint16_t) ltemp; nModbusCalRegs[Modbus_CalKateIndex] = ntemp; ntemp = (uint16_t) (ltemp >> 16); nModbusCalRegs[Modbus_CalKateIndex+1] = ntemp;
memcpy((uint8_t *) &ltemp,(uint8_t *) &strDeviceParamSave.temp2_bias2, 4);
ntemp = (uint16_t) ltemp; nModbusCalRegs[Modbus_CalKZeroIndex] = ntemp; ntemp = (uint16_t) (ltemp >> 16); nModbusCalRegs[Modbus_CalKZeroIndex+1] = ntemp;
memcpy((uint8_t *) &ltemp,(uint8_t *) &strDeviceParamSave.temp2_kate2, 4);
ntemp = (uint16_t) ltemp; nModbusCalRegs[Modbus_CalKSensiIndex] = ntemp; ntemp = (uint16_t) (ltemp >> 16); nModbusCalRegs[Modbus_CalKSensiIndex+1] = ntemp; } else if(nModbusCalRegs[Modbus_RegCalChan-Modbus_RegCalChan] == TEMP3_CHANNEL_ID) { ///< 初始化温度传感器:校准量程、零点偏移、灵敏度、零点偏移系数和灵敏度偏移系数 nModbusCalRegs[Modbus_CalChanIndex] = strDeviceParamSave.temp3_range;
memcpy((uint8_t *) &ltemp,(uint8_t *) &strDeviceParamSave.temp3_bias1, 4);
ntemp = (uint16_t) ltemp; nModbusCalRegs[Modbus_CalZeroIndex] = ntemp; ntemp = (uint16_t) (ltemp >> 16); nModbusCalRegs[Modbus_CalZeroIndex+1] = ntemp;
memcpy((uint8_t *) &ltemp,(uint8_t *) &strDeviceParamSave.temp3_kate1, 4);
ntemp = (uint16_t) ltemp; nModbusCalRegs[Modbus_CalKateIndex] = ntemp; ntemp = (uint16_t) (ltemp >> 16); nModbusCalRegs[Modbus_CalKateIndex+1] = ntemp;
memcpy((uint8_t *) &ltemp,(uint8_t *) &strDeviceParamSave.temp3_bias2, 4);
ntemp = (uint16_t) ltemp; nModbusCalRegs[Modbus_CalKZeroIndex] = ntemp; ntemp = (uint16_t) (ltemp >> 16); nModbusCalRegs[Modbus_CalKZeroIndex+1] = ntemp;
memcpy((uint8_t *) &ltemp,(uint8_t *) &strDeviceParamSave.temp3_kate2, 4);
ntemp = (uint16_t) ltemp; nModbusCalRegs[Modbus_CalKSensiIndex] = ntemp; ntemp = (uint16_t) (ltemp >> 16); nModbusCalRegs[Modbus_CalKSensiIndex+1] = ntemp; } else { nModbusCalRegs[Modbus_CalChanIndex] = 0; nModbusCalRegs[Modbus_CalZeroIndex] = 0; nModbusCalRegs[Modbus_CalZeroIndex+1] = 0; nModbusCalRegs[Modbus_CalKateIndex] = 0; nModbusCalRegs[Modbus_CalKateIndex+1] = 0; nModbusCalRegs[Modbus_CalKZeroIndex] = 0; nModbusCalRegs[Modbus_CalKZeroIndex+1] = 0; nModbusCalRegs[Modbus_CalKSensiIndex] = 0; nModbusCalRegs[Modbus_CalKSensiIndex+1] = 0; }
复制代码


优化后程序如下所示:


  if(nModbusCalRegs[Modbus_RegCalChan-Modbus_RegCalChan] == TEMP1_CHANNEL_ID)  {    temp_range = strDeviceParamSave.temp1_range;    temp_bias1 = strDeviceParamSave.temp1_bias1;    temp_kate1 = strDeviceParamSave.temp1_kate1;    temp_bias2 = strDeviceParamSave.temp1_bias2;    temp_kate2 = strDeviceParamSave.temp1_kate2;  }  else if(nModbusCalRegs[Modbus_RegCalChan-Modbus_RegCalChan] == TEMP2_CHANNEL_ID)  {    temp_range = strDeviceParamSave.temp2_range;    temp_bias1 = strDeviceParamSave.temp2_bias1;    temp_kate1 = strDeviceParamSave.temp2_kate1;    temp_bias2 = strDeviceParamSave.temp2_bias2;    temp_kate2 = strDeviceParamSave.temp2_kate2;     }  else if(nModbusCalRegs[Modbus_RegCalChan-Modbus_RegCalChan] == TEMP3_CHANNEL_ID)  {    temp_range = strDeviceParamSave.temp3_range;    temp_bias1 = strDeviceParamSave.temp3_bias1;    temp_kate1 = strDeviceParamSave.temp3_kate1;    temp_bias2 = strDeviceParamSave.temp3_bias2;    temp_kate2 = strDeviceParamSave.temp3_kate2;  }
///< 初始化温度传感器:校准量程、零点偏移、灵敏度、零点偏移系数和灵敏度偏移系数 nModbusCalRegs[Modbus_CalChanIndex] = temp_range;
memcpy((uint8_t *) &ltemp,(uint8_t *) &temp_bias1, 4);
ntemp = (uint16_t) ltemp; nModbusCalRegs[Modbus_CalZeroIndex] = ntemp; ntemp = (uint16_t) (ltemp >> 16); nModbusCalRegs[Modbus_CalZeroIndex+1] = ntemp;
memcpy((uint8_t *) &ltemp,(uint8_t *) &temp_kate1, 4);
ntemp = (uint16_t) ltemp; nModbusCalRegs[Modbus_CalKateIndex] = ntemp; ntemp = (uint16_t) (ltemp >> 16); nModbusCalRegs[Modbus_CalKateIndex+1] = ntemp;
memcpy((uint8_t *) &ltemp,(uint8_t *) &temp_bias2, 4);
ntemp = (uint16_t) ltemp; nModbusCalRegs[Modbus_CalKZeroIndex] = ntemp; ntemp = (uint16_t) (ltemp >> 16); nModbusCalRegs[Modbus_CalKZeroIndex+1] = ntemp;
memcpy((uint8_t *) &ltemp,(uint8_t *) &temp_kate2, 4);
ntemp = (uint16_t) ltemp; nModbusCalRegs[Modbus_CalKSensiIndex] = ntemp; ntemp = (uint16_t) (ltemp >> 16); nModbusCalRegs[Modbus_CalKSensiIndex+1] = ntemp;
复制代码


哎,泪奔,回头想想,可能是重复代码过多,导致编译过程存在问题,硬件开发工程师的程序 bug 往往出其不意,切忌先入为主,始终要保持质疑的态度呀~

发布于: 2021 年 03 月 25 日阅读数: 7
用户头像

【研究方向】物联网、嵌入式、AI、Python 2018.02.09 加入

【公众号】美男子玩编程

评论

发布
暂无评论
困扰一周的奇葩bug:重复相似代码多,导致单片机程序跑飞