本来是不打算谈并发处理的,原因有二,一是因为大家在日常开发自用应用时,流量很少,并发的需求基本不会出现。二是因为我是不建议大家以一种试试的心态去做并发处理,因为并发不同于同步,很多时候如果你对自己所使用的api真正的用法不清楚的话,贸然使用,大概率会造成隐性bug。而且这种问题往往不能立即验证出来,尤其是在大家还没掌握单元测试,我们也没有性能测试的情况下。我之前也提过,最麻烦的问题不是报错了,而是程序给的结果异常,却没有报错。甚至不是每次都能出现。这样的问题,往往可能和你写的并发处理不周全有关。综上所述,在目前的应用开发中,建议大家不是必须,不要随便尝试写并发处理的代码。
当然,既然还是忍不住谈及并发处理了,我也简单说下我对于并发的认识吧。首先我们知道,并发的对象是线程。在java里,代表线程的类是thread。还有一个runnable接口,也可以启动一个线程。线程是有生命周期的,也就是它可以进行的基本操作。线程也分优先级Priority。还有一个特殊的线程-守护线程Daemon。我们可以把一类线程放到线程组ThreadGroup里。 如果我们想要复用线程呢,就可以使用线程池ThreadPool。这些只是线程本身涉及到知识点。如果想实现线程并发,就不免要处理好临界区,即要保证线程安全。线程安全是并发操作的基本要求。这时就要谈到最重要的同步方法-锁了。我们最开始认识到sychronizd关键字就是一类典型的悲观锁。java后续也提供lock这样的锁。可以支持我们在更多应用场景下更灵活的使用锁。与悲观锁对应就是乐观锁。你也可以称之无锁。它所依赖的CAS(Compare and Swap)原子操作技术,就是一种乐观的不断尝试的操作。作为java程序员,我们平时最有可能接触到的是建立在锁或者原子操作上的java的并发包了。其中,并发容器是非常需要利用起来的工具。如果你对并发的操作很感兴趣,研究下java在java.util.concurrent包的api。研究下它是怎么保证不同的集合并发时线程安全的。保证可以让你受益匪浅。保证线程安全,除了保证多线程对于临界区资源的同步操作外,其实还有一种解决思路。它的代表就是ThreadLocal。即通过给每个线程建立一个资源副本,来满足线程对于资源的消费。因为这样的局部资源只能在当前线程中访问,自然是线程安全的。还有我们要知道volatile并不能保证线程安全,它只能保证资源可见。
到这里,我们基本涵盖了java对于并发操作所作的基础支持了。没错,以上这些只是基础而已。然后就算我们掌握了上面的所有知识,我们也不能上来就拿着锤子去敲我们看到所有的东西。你有可能敲对,但是大部分情况下都只是破坏。做好并发最后也是最重要的是要遵循一些方法论。而这些方法论后来就形成了多个并发模式。比较有名的有future和callable,fork-join等。我对之也是知之甚少的。这里就不多介绍啦。
由此可见,java应用如果想具备高性能的并发能力,要求开发者掌握的东西是比较多的。所以当你还没对并发知识积累到一定程度时,尽量不要在编码中贸然使用相关内容吧。对于开发手册里的关于并发处理的要求,请见如下。
1. 【强制】 获取单例对象需要保证线程安全,其中的方法也要保证线程安全。
说明: 资源驱动类、工具类、单例工厂类都需要注意。
2. 【强制】创建线程或线程池时请指定有意义的线程名称,方便出错时回溯。
正例:
public class TimerTaskThread extends Thread {
public TimerTaskThread() {
super.setName("TimerTaskThread");
...
}
3. 【强制】线程资源必须通过线程池提供,不允许在应用中自行显式创建线程。
说明: 使用线程池的好处是减少在创建和销毁线程上所花的时间以及系统资源的开销,解决资
源不足的问题。如果不使用线程池,有可能造成系统创建大量同类线程而导致消耗完内存或者
“过度切换”的问题。
4. 【强制】线程池不允许使用 Executors 去创建,而是通过 ThreadPoolExecutor 的方式,这样
的处理方式让写的同学更加明确线程池的运行规则,规避资源耗尽的风险。
说明: Executors 返回的线程池对象的弊端如下:
1) FixedThreadPool 和 SingleThreadPool:
允许的请求队列长度为 Integer.MAX_VALUE,可能会堆积大量的请求,从而导致 OOM。
2) CachedThreadPool 和 ScheduledThreadPool:
允许的创建线程数量为 Integer.MAX_VALUE, 可能会创建大量的线程,从而导致 OOM。
5. 【强制】 SimpleDateFormat 是线程不安全的类,一般不要定义为 static 变量,如果定义为
static,必须加锁,或者使用 DateUtils 工具类。
正例: 注意线程安全,使用 DateUtils。亦推荐如下处理:
private static final ThreadLocal<DateFormat> df = new ThreadLocal<DateFormat>() {
@Override
protected DateFormat initialValue() {
return new SimpleDateFormat("yyyy-MM-dd");
}
};
说明: 如果是 JDK8 的应用,可以使用 Instant 代替 Date, LocalDateTime 代替 Calendar,
DateTimeFormatter 代替 SimpleDateFormat,官方给出的解释: simple beautiful strong
immutable thread-safe。
6. 【强制】高并发时,同步调用应该去考量锁的性能损耗。能用无锁数据结构,就不要用锁; 能
锁区块,就不要锁整个方法体; 能用对象锁,就不要用类锁。
说明: 尽可能使加锁的代码块工作量尽可能的小,避免在锁代码块中调用 RPC 方法。
7. 【强制】对多个资源、数据库表、对象同时加锁时,需要保持一致的加锁顺序,否则可能会造
成死锁。
说明: 线程一需要对表 A、 B、 C 依次全部加锁后才可以进行更新操作,那么线程二的加锁顺序
也必须是 A、 B、 C,否则可能出现死锁。
8. 【强制】并发修改同一记录时,避免更新丢失, 需要加锁。 要么在应用层加锁,要么在缓存加
锁,要么在数据库层使用乐观锁,使用 version 作为更新依据。
说明: 如果每次访问冲突概率小于 20%,推荐使用乐观锁,否则使用悲观锁。乐观锁的重试次
数不得小于 3 次。
9. 【强制】多线程并行处理定时任务时, Timer 运行多个 TimeTask 时,只要其中之一没有捕获
抛出的异常,其它任务便会自动终止运行,使用 ScheduledExecutorService 则没有这个问题。
10. 【推荐】使用 CountDownLatch 进行异步转同步操作,每个线程退出前必须调用 countDown
方法,线程执行代码注意 catch 异常,确保 countDown 方法被执行到,避免主线程无法执行
至 await 方法,直到超时才返回结果。
说明: 注意,子线程抛出异常堆栈,不能在主线程 try-catch 到。
11. 【推荐】避免 Random 实例被多线程使用,虽然共享该实例是线程安全的,但会因竞争同一
seed 导致的性能下降。
说明: Random 实例包括 java.util.Random 的实例或者 Math.random()的方式。
正例: 在 JDK7 之后,可以直接使用 API ThreadLocalRandom, 而在 JDK7 之前, 需要编码保
证每个线程持有一个实例。
12. 【推荐】 在并发场景下, 通过双重检查锁(double-checked locking) 实现延迟初始化的优
化问题隐患(可参考 The "Double-Checked Locking is Broken" Declaration), 推荐解
决方案中较为简单一种(适用于 JDK5 及以上版本) ,将目标属性声明为 volatile 型。
反例:
class Singleton {
private Helper helper = null;
public Helper getHelper() {
if (helper == null) synchronized(this) {
if (helper == null)
helper = new Helper();
}
return helper;
}
// other methods and fields...
}
13. 【参考】 volatile 解决多线程内存不可见问题。对于一写多读,是可以解决变量同步问题,
但是如果多写,同样无法解决线程安全问题。如果是 count++操作,使用如下类实现:
AtomicInteger count = new AtomicInteger(); count.addAndGet(1); 如果是 JDK8,推
荐使用 LongAdder 对象,比 AtomicLong 性能更好(减少乐观锁的重试次数) 。
14. 【参考】 HashMap 在容量不够进行 resize 时由于高并发可能出现死链,导致 CPU 飙升,在
开发过程中可以使用其它数据结构或加锁来规避此风险。
15. 【参考】 ThreadLocal 无法解决共享对象的更新问题, ThreadLocal 对象建议使用 static
修饰。这个变量是针对一个线程内所有操作共享的,所以设置为静态变量,所有此类实例共享
此静态变量 ,也就是说在类第一次被使用时装载,只分配一块存储空间,所有此类的对象(只
要是这个线程内定义的)都可以操控这个变量。
网友评论