写点什么

最近线上发生的两个坑爹锅

用户头像
艾小仙
关注
发布于: 2021 年 01 月 13 日

最近由于在技改,发生了不少问题,前文中说的缓存穿透只是其中之一,想了想,虽然都是比较简单的问题,但是应该实际中还是有不少人碰到过,这些问题看似很简单,但是你绝对应该踩过。


==和 equals


关于==和 equals 区别,我相信稍微做过一两年开发的同学都应该很清楚,可是,然而,这个坑在很多开发的时候仍然频繁出现,为什么?因为有时候有的同学认为没什么区别,就用==吧,然而,一些意外总是如期而至。


不久前,由于线上 RPC 框架切换,我们就发生了一点小问题。


本来,线上的接口是这样定义的:



然后,接口查询中使用到了一个枚举类型,根据 id 获取枚举值,只不过这里使用的是==号来判断。



调用方的写法:



本来,这个代码在线上跑了两年了,一点问题没有,怎么就突然不行了呢?


但是,切换框架之后,这个接口报错了,当时我也看了这个地方半天,猜测是这里的问题,但是想了想貌似又不应该啊。


结果最后发现,原来的 RPC 框架传输中使用的是 valueOf,从缓存中取值,加上自动装箱拆箱,判断可以通过。但是,新的框架使用的是 new Byte(),所以这个老代码就永远无法通过了,因为这是一个新的对象。


看看这个测试的结果。



后面,通过安装Alibaba Java Coding Guidelines插件统一扫描所有代码,还又发现了一个坑爹的问题。


这个写法又不太一样,这个枚举只是单纯的把 code 成员变量定义成了byte基础类型,不是包装类型。这样,代码用==判断又都 OK 了。



想象一下,因为是基础数据类型,拆箱后==判断当然是通过的。


还有更奇葩的写法,成员变量是Byte包装类型,getEnumByCode(byte code)这里用的又是基础类型,当然,这种写法也能判断通过。



所以,心累... ...


最后,我想再补充一下关于基础数据类型缓存的知识。能用==判断的原因也都是依赖于缓存的原因。


数据类型包装类型缓存类型缓存值范围 byteByteByteCache-128~127shortShortShortCache-128~127intIntegerIntegerCache-128~127longLongLongCache-128~127charCharacterCharacterCache0~127


最后,奉劝大家一句,千万,千万,在项目中判断包装数据类型都用equals,因为就算这段代码你很确信现在是对的,然而鬼都不知道后面会发生什么!不要抱有侥幸心理。


日志打满


项目技改上线后不久,发现接口成功率直接跌 0(跌 0 的告警监控必须得有,不然死都不知道怎么死的)。排查了很久,看其他都是正常的,最后发现 GC 耗时狂增,登录服务器一看,居然是硬盘被打满了。



然后果断去看日志,因为我们的硬盘实际上很小,先怀疑日志,果不其然,日志炸了。通过ls -lht查看文件大小。



通过rm -rf删除后发现硬盘空间并没有释放。正常情况下是不会出现这个问题的,但是如果文件被锁定或者有另外的进程在向文件写数据的话就会有问题了。


在 Linux 中,一个文件在文件系统中存放包含两个部分:


  1. 指针部分:指针位于文件系统的 meta-data 中,在将数据删除后,这个指针就从 meta-data 中清除了。

  2. 数据部分:而数据部分存储在磁盘中。


像上面的情况,虽然我们删除了service.log,但是由于进程锁定,指针部分没有从 meta-data 中删除,所以也就看到存储空间没有释放的问题。


解决办法有两种:


  1. 使用lsof -n |grep delete查看什么进程在写 service.log,通过命令发现是我们的 java 进程在一直写文件,然后通过后台工具直接重启应用,重启之后发现恢复正常。

  2. 清空日志文件,执行命令echo "">/service.log,这个方法可以立刻释放磁盘空间,进程继续写入日志也不会受到影响。


发布于: 2021 年 01 月 13 日阅读数: 22
用户头像

艾小仙

关注

公众号:艾小仙。阿里P7,编程修仙 2020.09.01 加入

公众号:科技缪缪

评论

发布
暂无评论
最近线上发生的两个坑爹锅