并发编程10个坑:
- SimpleDateFormat线程不安全
- 双重检查锁的漏洞
- volatile的原子性
- 死锁
- 没释放锁
- HashMap导致内存溢出
- 使用默认线程池
- @Async注解的陷阱
- 自旋锁浪费cpu资源
- ThreadLocal用完没清空
1. SimpleDateFormat线程不安全
在Java8之前,我们对于时间的格式化处理,一般都是用SimpleDateFormat
类实现的,例如:
@Service
public class SimpleDateFormatService {
public Date time(String time) throws ParseException {
SimpleDateFormat dateFormat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");
return dateFormat.parse(time);
}
}
这样写实没有任何问题的。
就是怕那天抽风,你觉得dateFormat是一段固定的代码,应该要把它抽取成常量。
于是代码改成下面的这样:
@Service
public class SimpleDateFormatService {
private static SimpleDateFormat dateFormat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");
public Date time(String time) throws ParseException {
return dateFormat.parse(time);
}
}
dateFormat对象被定义成静态常量,及能被所有对象共用。
如果只有一个线程调用方法是不会出现问题。
但Service类的方法,往往是被Controller类调用,而Controller类的接口方法,则会被tomcat
的线程池
调用。换句话说,可能会出现多个线程调用同一个Controller类的同一个方法,也就是会出现多个线程会同时调用time方法的情况。
而time方法会调用SimpleDateFormat
类的parse
方法
@Override
public Date parse(String text, ParsePosition pos) {
...
Date parsedDate;
try {
parsedDate = calb.establish(calendar).getTime();
...
} catch (IllegalArgumentException e) {
pos.errorIndex = start;
pos.index = oldStart;
return null;
}
return parsedDate;
}
该方法会调用establish
方法:
Calendar establish(Calendar cal) {
...
//1.清空数据
cal.clear();
//2.设置时间
cal.set(...);
//3.返回
return cal;
}
其中步骤1、2、3是非原子操作
但如何cal对象是局部变量还好,坏就坏在parse方法调用establish方法是,传入的calendar是SimpleDateFormat
类的父类DateFormat
的成员变量:
public abstract class DateFormat extends Forma {
....
protected Calendar calendar;
...
}
这样就可能会出现多个线程,同时修改同一个对象即:dateFormat,他的同一个成员变量即:Calendar值得情况。
这样可能会出现,某个线程设置好了时间,又被其他的线程修改了,从而出现时间错误的情况。
解决方案:
- SimpleDateFormat类的对象不要定义成静态的,可以改为方法的局部变量。
- 使用ThreadLocal保存SimpleDateFormat类的数据。
- 使用Java8的DateTimeFormatter类
2. 双重检查锁的漏洞
单例模式
无论在实际工作,还是面试中,都出现的比较多。我们都知道,单例模式有:饿汉模式
和懒汉模式
两种。
饿汉模式如下:
public class SimpleSingleton {
//持有自己类的引用
private static final SimpleSingleton INSTANCE = new SimpleSingleton();
//私有的构造方法
private SimpleSingleton() {
}
//对外提供获取实例的静态方法
public static SimpleSingleton getInstance() {
return INSTANCE;
}
}
使用饿汉模式的好处是:没有线程安全的问题,但带来的坏处也是很明显。一开始就实例化一个对象,如何实例化过程非常耗时,并且最后这个对象没有被使用,不是白白造成资源浪费吗?还真的是的。
懒汉模式如下:
public class SimpleSingleton2 {
private static SimpleSingleton2 INSTANCE;
private SimpleSingleton2() {
}
public static SimpleSingleton2 getInstance() {
if (INSTANCE == null) {
INSTANCE = new SimpleSingleton2();
}
return INSTANCE;
}
}
示例中的instance对象一开始是空的,在调用getlnstance方法才会真正实例化。
但是还是有问题。
假如有多个线程中有调用了getInstance方法,那么都走到if(instance == null)判断时,可能同时成立,因为instance初始化是默认值是null。这样会导致多个线程中同时创建instance对象,即instance对象就会被多次创建,违背了只创建一个instance对象的初衷。
为了解决饿汉模式
和懒汉模式
各自的问题,于是出现了:双重检查锁
。
代码如下:
public class SimpleSingleton4 {
private static SimpleSingleton4 INSTANCE;
private SimpleSingleton4() {
}
public static SimpleSingleton4 getInstance() {
if (INSTANCE == null) {
synchronized (SimpleSingleton4.class) {
if (INSTANCE == null) {
INSTANCE = new SimpleSingleton4();
}
}
}
return INSTANCE;
}
}
但是上面的代码还是有漏洞。
getInstance方法的这段代码,我是按1、2、3、4、5这种顺序写的,希望也按这个顺序执行。
public static SimpleSingleton4 getInstance() {
if (INSTANCE == null) {//1
synchronized (SimpleSingleton4.class) {//2
if (INSTANCE == null) {//3
INSTANCE = new SimpleSingleton4();//4
}
}
}
return INSTANCE;//5
}
但是java虚拟机实际上会做一些优化,对一些代码指令进行重排。重排之后的顺序可能就变成了:1、3、2、4、5,这样在多线程的情况下同样会创建多次实例。重排之后的代码可能如下:
public static SimpleSingleton4 getInstance() {
if (INSTANCE == null) {//1
if (INSTANCE == null) {//3
synchronized (SimpleSingleton4.class) {//2
INSTANCE = new SimpleSingleton4();//4
}
}
}
return INSTANCE;//5
}
问题的解决方案:可以在定义instance时加上volatile
关键字。代码如下:
public class SimpleSingleton7 {
private volatile static SimpleSingleton7 INSTANCE;
private SimpleSingleton7() {
}
public static SimpleSingleton7 getInstance() {
if (INSTANCE == null) {
synchronized (SimpleSingleton7.class) {
if (INSTANCE == null) {
INSTANCE = new SimpleSingleton7();
}
}
}
return INSTANCE;
}
}
volatile
关键字可以保证多线程的可见性,但是不能保证原子性。同时它也能禁止指令重排。
双重检查锁的机制既保证了线程安全,又比直接上锁提高了执行效率,还节省了内存空间
3.volatile的原子性
我们都知道volatile
,是一个非常不错的关键字,它能保证变量在多个线程中的可见性
,它也能禁止指令重排
,但是不能保证原子性
可见性
主要体现在:一个线程对某个变量修改了,另一个线程每次都能获取到该变量的最新值。
先一起看看反例:
public class VolatileTest extends Thread {
private boolean stopFlag = false;
public boolean isStopFlag() {
return stopFlag;
}
@Override
public void run() {
try {
Thread.sleep(300);
} catch (InterruptedException e) {
e.printStackTrace();
}
stopFlag = true;
System.out.println(Thread.currentThread().getName() + " stopFlag = " + stopFlag);
}
public static void main(String[] args) {
VolatileTest vt = new VolatileTest();
vt.start();
while (true) {
if (vt.isStopFlag()) {
System.out.println("stop");
break;
}
}
}
}
上面的代码中,VolatileTest是一个Thread
类的子类,它的成员变量stopFlag默认是false,在它的run方法中修改成true。
然后在main方法的主线程中,用vt.isStopFlag()方法判断,如果它值为true时,则大隐stop关键字。
那么,如何才能让stopFlag的值修改了,在主线程中通过vt.isStopFlag()方法,能够获取最新的值呢?
正例如下:
public class VolatileTest extends Thread {
private volatile boolean stopFlag = false;
public boolean isStopFlag() {
return stopFlag;
}
@Override
public void run() {
try {
Thread.sleep(300);
} catch (InterruptedException e) {
e.printStackTrace();
}
stopFlag = true;
System.out.println(Thread.currentThread().getName() + " stopFlag = " + stopFlag);
}
public static void main(String[] args) {
VolatileTest vt = new VolatileTest();
vt.start();
while (true) {
if (vt.isStopFlag()) {
System.out.println("stop");
break;
}
}
}
}
用volatile
关键字修饰stopFlag即可。
下面说说volatile的原子性问题。
使用多线程给count加1,代码如下:
public class VolatileTest {
public volatile int count = 0;
public void add() {
count++;
}
public static void main(String[] args) {
final VolatileTest test = new VolatileTest();
for (int i = 0; i < 20; i++) {
new Thread() {
@Override
public void run() {
for (int j = 0; j < 1000; j++) {
test.add();
}
}
;
}.start();
}
while (Thread.activeCount() > 2) {
//保证前面的线程都执行完
Thread.yield();
}
System.out.println(test.count);
}
}
执行结果每次都是不一样,但可以肯定的事count值每次都小于20000
这个例子中count是成员变量,虽说被定义成了volatile的,但是由于add方法中的count++非原子操作。在多线程中,会出现数据问题。
解决方案:使用synchronized
关键字
改造代码如下:
public class VolatileTest {
public int count = 0;
public synchronized void add() {
count++;
}
public static void main(String[] args) {
final VolatileTest test = new VolatileTest();
for (int i = 0; i < 20; i++) {
new Thread() {
@Override
public void run() {
for (int j = 0; j < 1000; j++) {
test.add();
}
}
;
}.start();
}
while (Thread.activeCount() > 2) {
//保证前面的线程都执行完
Thread.yield();
}
System.out.println(test.count);
}
}
死锁
一旦程序出现了死锁,如果没有外力的作用,程序将会一直处于资源竞争的假死状态中。
死锁代码如下:
public class DeadLockTest {
public static String OBJECT_1 = "OBJECT_1";
public static String OBJECT_2 = "OBJECT_2";
public static void main(String[] args) {
LockA lockA = new LockA();
new Thread(lockA).start();
LockB lockB = new LockB();
new Thread(lockB).start();
}
}
class LockA implements Runnable {
@Override
public void run() {
synchronized (DeadLockTest.OBJECT_1) {
try {
Thread.sleep(500);
synchronized (DeadLockTest.OBJECT_2) {
System.out.println("LockA");
}
} catch (InterruptedException e) {
e.printStackTrace();
}
}
}
}
class LockB implements Runnable {
@Override
public void run() {
synchronized (DeadLockTest.OBJECT_2) {
try {
Thread.sleep(500);
synchronized (DeadLockTest.OBJECT_1) {
System.out.println("LockB");
}
} catch (InterruptedException e) {
e.printStackTrace();
}
}
}
}
一个线程在获取OBJECT_1锁时,没有释放锁,又去申请OBJECT_2锁。而刚好此时,另一个线程获得了OBJECT_2锁,也没有释放锁,去申请OBJECT_1锁。由于OBJECT_1和OBJECT_2锁都诶没有释放,两个线程将一起请求下去,陷入死循环,即出现死锁的状况。
如何避免死锁问题呢?
4.1 缩小锁的范围
出现死锁的情况,有可能是想上面那样,锁范围太大了导致的。
那么解决办法就是缩小锁的范围
class LockA implements Runnable {
@Override
public void run() {
synchronized (DeadLockTest.OBJECT_1) {
try {
Thread.sleep(500);
} catch (InterruptedException e) {
e.printStackTrace();
}
}
synchronized (DeadLockTest.OBJECT_2) {
System.out.println("LockA");
}
}
}
class LockB implements Runnable {
@Override
public void run() {
synchronized (DeadLockTest.OBJECT_2) {
try {
Thread.sleep(500);
} catch (InterruptedException e) {
e.printStackTrace();
}
}
synchronized (DeadLockTest.OBJECT_1) {
System.out.println("LockB");
}
}
}
在获取OBJECT_1锁的代码块中,不包含获取OBJECT_2锁的代码,反之也是一样。
4.2 保证锁的顺序
出现死锁的情况说白了是,一个线程获取锁的顺序是:OBJECT_1和OBJECT_2。而另一个线程获取锁的顺序刚好相反为:OBJECT_2和OBJECT_1。
那么,如果我们能保证每次获取锁的顺序都相同,就不会出现死锁问题。
代码如下:
class LockA implements Runnable {
@Override
public void run() {
synchronized (DeadLockTest.OBJECT_1) {
try {
Thread.sleep(500);
synchronized (DeadLockTest.OBJECT_2) {
System.out.println("LockA");
}
} catch (InterruptedException e) {
e.printStackTrace();
}
}
}
}
class LockB implements Runnable {
@Override
public void run() {
synchronized (DeadLockTest.OBJECT_1) {
try {
Thread.sleep(500);
synchronized (DeadLockTest.OBJECT_2) {
System.out.println("LockB");
}
} catch (InterruptedException e) {
e.printStackTrace();
}
}
}
}
两个线程,每个线程都是先获取OBJECT_1锁,再获取OBJECT_2锁。
没释放锁
在Java中除了使用synchronized
关键字,给我们所需要的代码块加锁之外,还能通过Lock关键字加锁。
使用synchronized
关键字加锁后,如果程序执行完毕,或者程序出现异常时,会自动释放锁。
但如果使用Lock
关键字加锁后,需要开发人员在代码中手动释放锁。
例如:
public class LockTest {
private final ReentrantLock rLock = new ReentrantLock();
public void fun() {
rLock.lock();
try {
System.out.println("fun");
} finally {
rLock.unlock();
}
}
}
代码中先创建一个ReentrantLock
类的实例对象rLock,调用它的lock
方法加锁。然后执行业务代码,最后再finally
代码块中调用unlock
方法。
但如果你没有在finally
代码块中,调用unlock
方法手动释放锁,线程持有的锁将不会得到释放。
6. HashMap导致内存溢出
HashMap在实际的工作场景中,使用频率还是挺高的,如:接收参数,缓存数据,汇总数据等等。
但如果你在多线程的环境中使用HashMap,可能会导致非常严重的后果。
@Service
public class HashMapService {
private Map<Long, Object> hashMap = new HashMap<>();
public void add(User user) {
hashMap.put(user.getId(), user.getName());
}
}
在HashMapService类中定义一个HashMap的成员变量,在add方法中往HashMap中添加数据。在controller层的接口中调用add方法,会使用Tomcat的线程池去处理请求,就相当于在多线程的场景下调用add方法。
在jdk1.7中,HashMap使用的数据结构是:数组+链表。如果在多线程的情况下,不断往HashMap中添加数据,它会调用resize方法进行扩容。该方法在复制元素到新数组事,采用的头插法,在某些情况下,会导致链表会出现死循环。
死循环最终结果会导致:内存溢出
此外,如果HashMap中的数据非常多,会导致链表很长。当查找某个元素时,需要遍历某个链表,查询效率不太高。
为此,jdk1.8之后,将HashMap的数据结构改成了:数组+链表+红黑树。
如果同一个数组元素中的数据小于8,则还是用链表保存数据。如果大于8,则自动转换成共黑树。
为什么要用红黑树?
答:链表的时间复杂度是O(n),而红黑树的时间复杂度是O(longn),红黑树的复杂度是优于链表的。
既然这样?为什么不直接使用红黑树?
答:树节点所占存储空间是链表节点的两倍,节点少的时候,尽管在时间复杂度上,红黑树比链表稍微好一些。但是由于红黑树所占空间比较大,HashMap综合考虑之后,认为节点数量少的时候用占存储空间更多的红黑树不划算。
jdk1.8中HashMap就不会出现死循环?
答:错,它在多线程环境中依然会出现死循环。在扩容的过程中,在链表转换为树的时候,for循环一直无法跳出,从而导致死循环。
那么,如果想多线程环境中使用HashMap该怎么办呢?
答:使用ConcurrentHashMap。
7. 使用默认线程池
jdk1.5之后,提供了ThreadPoolExecutor
类,用它可以自定义线程池
。
线程池的好处有很多,比如:
-
降低资源消耗
:避免频繁的创建线程和销毁线程,可以直接复用已有线程。而我们都知道,创建线程是非常耗时的操作。 -
提供速度
: 任务过来之后,因为线程已存在,可以拿来直接使用。 -
提高线程的可管理性
: 线程是非常宝贵的资源,如果创建过多的线程,不仅会消耗系统资源,甚至会影响系统的稳定。使用线程池,可以非常方便的创建、管理和监控先线程。
当然jdk为了我们使用更便捷,专门提供了: Executors
类,给我们快速创建线程池。
该类中包含了很多静态方法:
-
newCachedThreadPool
:创建一个可缓冲的线程,如果线程池大小超过处理需要,可灵活回收空间线程,若无可回收,则新建线程。 -
newFixedThreadPool
:创建一个固定大小的线程池,如果任务数量超过线程池大小,则将多余的任务放入队列中。 -
newScheduledThreadPool
: 创建一个固定大小,并且能执行定时周期任务的线程池。 -
newSingleThreadExecutor
:创建只有一个线程的线程池,保证所有的任务按顺序执行。
在高并发的场景下,如果大家使用这些静态方法创建线程池,会有一些问题。
-
newFixedThreadPool
: 允许请求的队列长度是Integer.MAX_VALUE,可能会堆积大量的请求,从而导致OOM。 -
newSingleThreadPool
: 允许请求的队列长度是Integer.MAX_VALUE,可能会堆积大量的请求,从而导致OOM。 -
newCachedThreadPool
: 允许请求的队列长度是Integer.MAX_VALUE,可能会堆积大量的请求,从而导致OOM。
优先推荐使用ThreadPoolExecutor
类,我们自定义线程池。
代码如下:
ExecutorService threadPool = new ThreadPoolExecutor(
8, //corePoolSize线程池中核心线程数
10, //maximumPoolSize 线程池中最大线程数
60, //线程池中线程的最大空闲时间,超过这个时间空闲线程将被回收
TimeUnit.SECONDS,//时间单位
new ArrayBlockingQueue(500), //队列
new ThreadPoolExecutor.CallerRunsPolicy()); //拒绝策略
顺便说一下,如果是一些低并发场景,使用Executors类创建线程池也未尝不可,也不能完全一棍子打死。在这些低并发场景下,很难出现OOM问题,所以我们需要根据实际业务场景选择。
8. @Async注解的陷阱
之前的Java并发编程中实现异步功能,一般是需要使用线程
或者线程池
。
线程池底层也是用线程。
而实现一个线程,要么集成Thread
类,要么实现Runnable
接口,然后在run方法中写具体的业务逻辑代码。
开发spring的大神们,为了简化这类异步操作,已经帮我们把异步功能封装好了。spring中提供了@Async注解,我们可以通过它即可开启异步功能,使用起来非常方便。
具体做法如下:
1.在springboot
在启动类上面加上@EnableAsync
注解。
@EnableAsync
@SpringBootApplication
public class Application {
public static void main(String[] args) {
SpringApplication.run(Application.class, args);
}
}
2.在需要执行异步调用的业务方法加上@Async
注解。
@Service
public class CategoryService {
@Async
public void add(Category category) {
//添加分类
}
}
3.在controller方法中调用这个业务方法。
@RestController
@RequestMapping("/category")
public class CategoryController {
@Autowired
private CategoryService categoryService;
@PostMapping("/add")
public void add(@RequestBody category) {
categoryService.add(category);
}
}
但有个坏消息是:用@Async
注解开启的异步功能,会调用AsyncExecutionAspectSupport
类的doSubmit
方法。
默认情况会走else逻辑。
而else的逻辑最终会调用doExecute方法:
protected void doExecute(Runnable task) {
Thread thread = (this.threadFactory != null ? this.threadFactory.newThread(task) : createThread(task));
thread.start();
}
使用@Async注解开启异步功能,默认情况下,每次都会创建一个新线程。
如果在高并发的场景下,可能会产生大量的线程,从而导致OOM问题。
建议大家在@Async注解开启的异步功能时,请别忘了定义一个线程池。
9. 自旋锁浪费CPU资源
在并发编程中,自旋锁
想必大家都已经耳熟能详了。
自旋锁有个非常经典的使用场景就是:CAS
(比较和交换),她是一种无锁化思想(就是用来一个死循环),用来解决高并发场景下,更新数据的问题。
而atomic包下的很多类,比如:AtomicInteger、AtomicLong、AtomicBoolean等,都是用CAS实现的。
我们以AtomicInteger
类为例,它的incrementAndGet
没有每次都给变量加1。
public final int incrementAndGet() {
return unsafe.getAndAddInt(this, valueOffset, 1) + 1;
}
它的底层就是用的自旋锁实现的:
public final int getAndAddInt(Object var1, long var2, int var4) {
int var5;
do {
var5 = this.getIntVolatile(var1, var2);
} while(!this.compareAndSwapInt(var1, var2, var5, var5 + var4));
return var5;
}
在do...while死循环中,不听进行数据的比较和交换,如果一直失败,则一直循环重试。
如果在高并发的情况下,compareAndSwapInt会很大概率失败,因此导致此处CPU不断自旋,会严重浪费CPU资源。
解决方案:
使用LockSupport
类的parkNanos方法。
private boolean compareAndSwapInt2(Object var1, long var2, int var4, int var5) {
if(this.compareAndSwapInt(var1,var2,var4, var5)) {
return true;
} else {
LockSupport.parkNanos(10);
return false;
}
}
当cas失败之后,调用LockSupport类的parkNanos方法休眠一下,相当于调用了Thread.Sleep方法。这样有效减少频繁自旋导致的资源浪费问题
10. ThreadLocal用完没清空
在Java中保证线程安全的技术有很多,可以使用synchroized、Lock等关键字给代码块加锁。加锁会对代码性能有一定损耗。
其实,在jdk中还提供了另外一个思想:用空间换时间。
而使用ThreadLocal类就是对这种思想的一种具体体现。
ThreadLocal为每个使用变量的线程提供了一个独立的变量副本,这样每一个线程都是独立改变自己的副本,而不会影响其它线程所对应的副本。
ThreadLocal的用法大致是这样的:
1.先创建一个CurrentUser类,其中包含了ThreadLocal的逻辑。
public class CurrentUser {
private static final ThreadLocal<UserInfo> THREA_LOCAL = new ThreadLocal();
public static void set(UserInfo userInfo) {
THREA_LOCAL.set(userInfo);
}
public static UserInfo get() {
THREA_LOCAL.get();
}
public static void remove() {
THREA_LOCAL.remove();
}
}
2.在业务代码中调用CurrentUser类。
public void doSamething(UserDto userDto) {
UserInfo userInfo = convert(userDto);
CurrentUser.set(userInfo);
...
//业务代码
UserInfo userInfo = CurrentUser.get();
...
}
在业务代码的第一行,将userInfo对象设置到CurrentUser,这样在业务代码中,就能通过CurrentUser.get()获取到刚刚设置的userInfo对象。特别是对业务代码调用层级比较深的情况,这种用法非常有用,可以减少很多不必要传参。
但在高并发的场景下,这段代码有问题,只往ThreadLocal存数据,数据用完之后并没有及时清理。
ThreadLocal即使使用了WeakReference(弱引用)也可能会存在内存泄露问题,因为 entry对象中只把key(即threadLocal对象)设置成了弱引用,但是value值没有。
解决方案:
需要在finally代码块中,调用remove方法清理没用的数据。
public void doSamething(UserDto userDto) {
UserInfo userInfo = convert(userDto);
try{
CurrentUser.set(userInfo);
...
//业务代码
UserInfo userInfo = CurrentUser.get();
...
} finally {
CurrentUser.remove();
}
}
网友评论