线程范围内共享数据
微信搜索:武哥聊编程。关注我,每天一起进步。
假设现在有个公共的变量 data,有不同的线程都可以去操作它,如果在不同的线程对 data 操作完成后再去取这个 data,那么肯定会出现线程间的数据混乱问题,因为 A 线程在取 data 数据前可能 B 线程又对其进行了修改,下面写个程序来说明一下该问题:
来看一下打印出来的结果:
>Thread-0 has put a data: -1885917900<br>
Thread-1 has put a data: -1743455464<br>
A get data from Thread-0: -1743455464<br>
A get data from Thread-1: -1743455464<br>
B get data from Thread-1: -1743455464<br>
B get data from Thread-0: -1743455464<br>
从结果中可以看出,两次对 data 赋的值确实不一样,但是两个线程最后打印出来的都是最后赋的那个值,说明 Thread-0 拿出的数据已经不对了,这就是线程间共享数据带来的问题。
当然,我们完全可以使用 synchronized 关键字将 run()
方法中的几行代码给套起来,这样每个线程各自执行完,打印出各自的信息,这是没问题的,确实可以解决上面的线程间共享数据问题。但是,这是以其他线程被阻塞为代价的,即 Thread-0 在执行的时候,Thread-1 就被阻塞了,必须等待 Thread-0 执行完了才能执行。
那么如果我想两个线程同时跑,并且互不影响各自取出的值,该怎么办呢?这也是本文所要总结的重点,解决该问题的思想是:虽然现在都在操作公共数据 data,但是不同的线程本身对这个 data 要维护一个副本,这个副本不是线程间所共享的,而是每个线程所独有的,所以不同线程中所维护的 data 是不一样的,最后取的时候,是哪个线程,我就从哪个线程中取该 data。
基于上面这个思路,我再把上面的程序做一修改,如下:
上面程序中维护了一个 Map,键值对分别是线程和它的数据,那么在操作 data 的时候,先把各自的数据保存到这个 Map 中,这样每个线程保存的肯定不同,当再取的时候,根据当前线程对象作为 key 来取出对应的 data 副本,这样不同的线程之间就不会相互影响了。这个 HashMap 也需要包装一下,因为 HashMap 是非线程安全的,上面的程序中,不同的线程有对 HashMap 进行写操作,就有可能产生并发问题,所以也要包装一下。最后来看一下执行结果:
>Thread-0 has put a data: 1817494992<br>
Thread-1 has put a data: -1189758355<br>
A get data from Thread-0: 1817494992<br>
A get data from Thread-1: -1189758355<br>
B get data from Thread-0: 1817494992<br>
B get data from Thread-1: -1189758355<br>
就是线程范围内共享数据,即同一个线程里面这个数据是共享的,线程间是不共享的。
这让我联想到了学习数据库的时候用到的 ThreadLocal,操作数据库需要 connection,如果当前线程中有就拿当前线程中存的 connection,否则就新建一个放到当前线程中,这样就不会出现问题,因为每个线程本身共享了一个 connection,它不是线程间共享的。这也很好理解,这个 connection 肯定不能共享,假设 A 和 B 用户都拿到这个 connection 并开启了事务,现在 A 开始转账了,但是钱还没转好,B 转好了关闭了事务,那么 A 那边就出问题了。
线程范围内共享数据的问题就总结这么多吧~如果有问题,欢迎指正,我们一起进步!
作者介绍:同济大学,硕士。先后在爱奇艺为、华为、拼多多当码农。希望能和读者成为好朋友。
公众号:武哥聊编程。欢迎大家关注!
版权声明: 本文为 InfoQ 作者【武哥聊编程】的原创文章。
原文链接:【http://xie.infoq.cn/article/13edf0fd76a6507d48d23428d】。文章转载请联系作者。
评论