在使用Spring/Spring Boot+Spring Data JPA的开发过程中,判断表中满足条件的记录是否存在是一个经常遇到的业务场景,比如检查指定用户名的用户是否存在,检查指定id的设备是否存在等等。在业务开发过程中,通常有两种方法:
1)使用指定的条件查询数据库,然后在业务代码判断返回的结果是否为null,如果为null则满足条件的记录不存在,否则记录存在。
2)使用JPA提供的封装方法existsXXX,方法返回ture表示满足条件的记录存在,否则不存在。
那么这两种方法有何区别,在业务中应该如何选择呢?下面我们从两种方法使用的SQL语句,网络交互以及适用的业务场景出发讲解两种方法。
1 实验环境准备
1.1 版本信息
JPA 版本:2.3.4.RELEASE
MySQL版本:8.0
Wireshark:3.6.1
1.2 数据库表
@Table(name = "t_device", indexes = @Index(name = "device_id", columnList = "device_id"))
public class Device {
@Id
@GeneratedValue(generator = "system-uuid")
@GenericGenerator(name = "system-uuid", strategy = "uuid")
private String id;
@Column(name = "device_id", unique = true, nullable = false)
private String deviceId;
@Column(name = "app_id", nullable = false)
private String appId;
}
1.3 方法定义
@Repository
public interface DeviceRepository extends JpaRepository<Device, String> {
Device findByDeviceId(String deviceId); // 方法1
boolean existsByDeviceId(String deviceId); // 方法2
}
2、SQL分析
有两种方法可以获取上述方法1和方法2执行的SQL语句,一种时在应用程序开启SQL语句打印,一种是通过网络抓包。由于网络抓包相对不够简洁,因此在应用程序开启SQL打印可以方便在日常工作中分析JPA执行的SQL。在application.ymal中添加下面的配置可以开启打印SQL语句:
spring:
jpa:
show-sql: true #控制台显示SQL
方法Device findByDeviceId(String deviceId);
执行的SQL语句为(语句经过了修改,JPA生成的语句比较不方便查看):
SELECT * FROM t_device WHERE device_id = 'your device id'
方法boolean existsByDeviceId(String deviceId);
执行的SQL语句为(语句经过了修改,JPA生成的语句比较不方便查看):
SELECT id FROM t_device WHERE device_id = 'your device id' LIMIT 1
从SQL语句来看,两个方法的主要区别为:
1)方法1查询记录的所有字段
2)方法2只查询记录的主键并且只返回一条记录(limit 1)
方法1返回的数据量要大于方法2,因此当表的字段很多时,这种数据量差异就更加明显。下面我们通过网络抓包来证实数据量的差异。
3 网络分析
可以使用Wireshark软件进行网络抓包和分析,Wireshark支持分析MySQL协议。如果你不方便抓包也没有关系,可以从本文对应的项目下载抓包文件并分析,下载地址:
3.1 方法1对应Server的响应如下:
方法13.2 方法2对应Server的响应如下:
方法2从网络抓包来看,方法1返回的数据量要大于方法2。
4 业务场景选择
从SQL和网络分析来看,两种方法的原来是相同的,都是向Server发送一个查询命令,然后根据查询的结果进行判断。不同的是两种方法执行的SQL不同,Server返回的数据量不同,方法1的数据量以及对带宽的占用多与方法2,那么在开发中如何根据不同的场景进行选择呢?
-
场景1:只需要判断记录是否存在
这种场景选择方法2的成本最低执行效率最高,因为只是判断记录是否存在,不需要查询记录所有的字段。
-
场景2:判断记录是否存在,并且在记录存在时对记录执行其他操作
这种场景选择方法1,因为在判断记录是否存在后还需要进行其他的操作,如果使用方法2还需要再次使用方法1获取记录进行操作。
网友评论