美文网首页
Java Lambda 表达式不为人熟知的特性

Java Lambda 表达式不为人熟知的特性

作者: yzbyzz | 来源:发表于2019-05-01 19:21 被阅读0次

    Lambda 表达式是 Java 8 的新语法,可以极大地简化代码,增强语言的表达力。这里不赘述 Lambda 表达式的语法,主要从一道题目出发来说 Lambda 表达式的一个特性。

    从前阵子开始,坚持每天在 LeetCode 做一道题。这是前话。今天在做这道题的时候,碰到一个问题,记录下来备忘。

    从题目说起

    题目本身很好理解:给几个区间,将其中重叠相交的合并,返回合并后的区间。

    做法也不难:将区间按照"起点小的在前,起点一样的则终点小的在前"排序。

    选定第一个区间 A,按序依次遍历剩下的区间 B,如果 B 的起点比 A 的终点小,则 A 和 B 可以合并。

    不断重复这个选定第一个区间的操作,直至将所有可合并的区间进行合并。

    最后返回剩下的区间即可。

    按理说不难,做完之后,也能通过了。代码如下:

    public int[][] merge(int[][] intervals) {
        Arrays.sort(intervals, (o1, o2) -> {
            if (o1[0] != o2[0]) {
                return Integer.compare(o1[0], o2[0]);
            }
            return Integer.compare(o1[1], o2[1]);
        });
    
        boolean[] vis = new boolean[intervals.length];
        Arrays.fill(vis, true);
    
        for (int i = 0; i < intervals.length; i++) {
            if (!vis[i]) {
                continue;
            }
    
            for (int j = i + 1; j < intervals.length; j++) {
                if (intervals[j][0] <= intervals[i][1]) {
                    vis[j] = false;
                    if (intervals[i][1] < intervals[j][1]) {
                        intervals[i][1] = intervals[j][1];    
                    }
                }
            }
        }
        int count = 0;
        for (boolean v : vis) {
            if (v) {
                count++;
            }
        }
        int[][] ans = new int[count][];
        for (int i = 0, j = 0; i < intervals.length; i++) {
            if (!vis[i]) {
                continue;
            }
            ans[j++] = intervals[i];
        }
    
        return ans;
    }
    

    不太理解的是 LeetCode 上的执行时间是 84 ms,已经战胜 28.32 % 的 java 提交记录。我左思右想,这已经是 O(N) 复杂度的解法(当然还有常数级别的优化空间),难道还能有更高效的做法?

    效率差距的疑惑

    于是我看了一下别人的解法,大体上是一样的,复杂的也是 O(N)。因为一些细节上的处理,会有常数级别的差距,但应该不至于有这么大的差距才对。

    一开始怀疑是数据量很大,在遍历的过程需要访问当前数据和之前的数据,可能是在这时发生了取数据的耗时操作。于是尝试把需要比较的数据用临时变量存储下来。结果发现耗时并没有什么变化。

    最后实在想不出来,于是照着别人的代码,一点点改,边改边看执行时间。

    最后发现是排序这里的 lambda 表达式造成了效率的差距。

    Java 的 Lambda

    Google 搜索后看到了 Stack Overflow 上的这个提问 Java lambdas 20 times slower than anonymous classes

    可以看到 Lambda 表达式的一些特性:

    • Lambda 表达式对应的类是在运行时动态生成的。运行时动态生成,并不是这里慢的原因。动态生成一个结构简单的类,比从外部资源加载同样的字节流要更快。
    • 程序必须要加载用于生成 Lambda 类的框架,才能使用 Lambda 表达式。加载框架才是这里慢的原因。(Oracle JDK 使用 ASM 来实现。)
    • 如果不考虑加载 Lambda 框架的时间,使用 Lambda 表达式的效率会比使用类高一点。

    所以,程序使用 Lambda 表达式后慢的原因也就呼之而出了:LeetCode 执行提交的代码之前,没有使用到 Lambda 表达式。当执行我们的代码时,要先加载处理 Lambda 表达式的框架。加载框架的时间会算到程序的运行时间里。

    进一步的验证

    虽然原理已经知道,但也要用代码从实际来验证一遍。

    • 就像该回答中提到的,定义更多的 Lambda 表达式,也不会对运行时间有明显的影响。
    • 我自己也做了一个实验:在程序的一次运行期间,多次执行"合并区间"的操作。每次都使用相同的数据,可以明显看到第一次执行的时间明显比后面每一次的时间都要长。这也验证了的确存在"加载 Lambda 框架"这个步骤的存在,以及这个加载过程也是主要的耗时操作。

    相关文章

      网友评论

          本文标题:Java Lambda 表达式不为人熟知的特性

          本文链接:https://www.haomeiwen.com/subject/bupwnqtx.html