Spring Data JPA如何判断记录是否存在？

作者: 大哥你先走 | 来源:发表于2022-02-10 22:30 被阅读0次

Spring Data JPA如何判断记录是否存在？
SpringBoot系列：6、整合JPA
Spring Data JPA 与 MyBatis简单对比
Spring Boot & Spring Data &a
spring data jpa
Spring Data JPA框架
Spring Data JPA知识 day03
第6章数据持久化 Spring Data JPA
Spring Data JPA 简介
Spring Data JPA 与 Mybatis

在使用Spring/Spring Boot+Spring Data JPA的开发过程中，判断表中满足条件的记录是否存在是一个经常遇到的业务场景，比如检查指定用户名的用户是否存在，检查指定id的设备是否存在等等。在业务开发过程中，通常有两种方法：

1）使用指定的条件查询数据库，然后在业务代码判断返回的结果是否为null，如果为null则满足条件的记录不存在，否则记录存在。

2）使用JPA提供的封装方法existsXXX，方法返回ture表示满足条件的记录存在，否则不存在。

那么这两种方法有何区别，在业务中应该如何选择呢？下面我们从两种方法使用的SQL语句，网络交互以及适用的业务场景出发讲解两种方法。

1 实验环境准备

1.1 版本信息

JPA 版本：2.3.4.RELEASE

MySQL版本：8.0

Wireshark：3.6.1

1.2 数据库表

@Table(name = "t_device", indexes = @Index(name = "device_id", columnList = "device_id"))
public class Device {
    @Id
    @GeneratedValue(generator = "system-uuid")
    @GenericGenerator(name = "system-uuid", strategy = "uuid")
    private String id;

    @Column(name = "device_id", unique = true, nullable = false)
    private String deviceId;

    @Column(name = "app_id", nullable = false)
    private String appId;
}

1.3 方法定义

@Repository
public interface DeviceRepository extends JpaRepository<Device, String> {

    Device findByDeviceId(String deviceId); // 方法1

    boolean existsByDeviceId(String deviceId); // 方法2
}

2、SQL分析

有两种方法可以获取上述方法1和方法2执行的SQL语句，一种时在应用程序开启SQL语句打印，一种是通过网络抓包。由于网络抓包相对不够简洁，因此在应用程序开启SQL打印可以方便在日常工作中分析JPA执行的SQL。在application.ymal中添加下面的配置可以开启打印SQL语句：

spring:
  jpa:
    show-sql: true #控制台显示SQL

方法Device findByDeviceId(String deviceId);执行的SQL语句为（语句经过了修改，JPA生成的语句比较不方便查看）：

SELECT * FROM t_device WHERE device_id = 'your device id'

方法boolean existsByDeviceId(String deviceId);执行的SQL语句为（语句经过了修改，JPA生成的语句比较不方便查看）：

SELECT id FROM t_device WHERE device_id = 'your device id' LIMIT 1

从SQL语句来看，两个方法的主要区别为：

1）方法1查询记录的所有字段

2）方法2只查询记录的主键并且只返回一条记录（limit 1）

方法1返回的数据量要大于方法2，因此当表的字段很多时，这种数据量差异就更加明显。下面我们通过网络抓包来证实数据量的差异。

3 网络分析

可以使用Wireshark软件进行网络抓包和分析，Wireshark支持分析MySQL协议。如果你不方便抓包也没有关系，可以从本文对应的项目下载抓包文件并分析，下载地址：

3.1 方法1对应Server的响应如下：

方法1

3.2 方法2对应Server的响应如下：

方法2

从网络抓包来看，方法1返回的数据量要大于方法2。

4 业务场景选择

从SQL和网络分析来看，两种方法的原来是相同的，都是向Server发送一个查询命令，然后根据查询的结果进行判断。不同的是两种方法执行的SQL不同，Server返回的数据量不同，方法1的数据量以及对带宽的占用多与方法2，那么在开发中如何根据不同的场景进行选择呢？

场景1：只需要判断记录是否存在

这种场景选择方法2的成本最低执行效率最高，因为只是判断记录是否存在，不需要查询记录所有的字段。
场景2：判断记录是否存在，并且在记录存在时对记录执行其他操作

这种场景选择方法1，因为在判断记录是否存在后还需要进行其他的操作，如果使用方法2还需要再次使用方法1获取记录进行操作。