美文网首页程序员
Hackrank 统计十日通(第一天) 四分位距

Hackrank 统计十日通(第一天) 四分位距

作者: cfcodefans | 来源:发表于2017-04-04 21:31 被阅读0次

    四分位距 Interquartile Range

    一个数组的四分位距是第一个四分位数(Q1)和第三个四分位数(Q3)的差. (例如:(Q3 - Q1)

    维基定义
    四分位距(interquartile range), 是描述统计学中的一种方法, 以确定第三四分位数和第一四分位数的差, 和方差, 标准差一样, 表示统计资料中个变量的分散情况, 但四分位距更多为一种稳健统计

    目标

    给定一个含n个整数的数组X, 和一个数组F, 表示X中各个元素的出现频率. 通过这两个数组得到一个数据集S, X中元素xi应该在S出现fi次. 并计算和打印出S的四分位距, 精确到小数点后一位(例如:12.3)

    提示

    当一个数组有偶数个元素时,不要用整数相除来计算中间两个元素的平均值. 不要把中位数包含在数组大的一半和小的一半中.

    输入格式

    第一行输入一个整数n,表示数组X和F的元素数量.
    第二行输入包含以空格分隔的n个整数,表示数组X的各个元素.
    第三行输入包含以空格分隔的n个整数,表示数组F的各个元素.

    约束条件

    • 5 <= n <= 50
    • 0 < xi <= 100, xi是X数组中第i个元素
    • 0 < fi的总和 <= 1000, -
    • fi是F数组中第i个元素
    • S的元素个数等于F数组的元素之和

    输出格式

    构建数据集S,打印出它的四分位距, 精确到小数点后一位,(例如:12.3)

    示例输入

    6
    6 12 8 10 20 16
    5 4 3 2 1 5

    示例输出

    9.0

    示例解析

    元素 频率
    6 5
    12 4
    8 3
    10 2
    20 1
    16 5

    首先, 根据数组X和对应的元素频率F,创建数据集S,得到:

    S={6,6,6,6,6,8,8,8,10,10,12,12,12,12,16,16,16,16,16,20}

    因为S中有偶数个元素, 我们将S平分为大小两半:

    小的一半(L): 6, 6, 6, 6, 6, 8, 8, 8, 10, 10
    大的一半 (U): 12, 12, 12, 12, 16, 16, 16, 16, 16, 20

    然后,我们查找Q1, 小的一半中有10个元素,那么Q1就是中间两个元素(6和8)的平均值,即Q1 = (6 + 8) / 2 = 7.0

    然后,我们查找Q3, 大的一半中也有10个元素, 那么Q3就是中间两个元素(16和16)的平均值,即Q3 = (16 + 16) / 2 = 16.0

    最后,我们计算四分位距为Q3 - Q1 = 16.0 - 7.0 = 9.0, 打印9.0为我们的答案

    python

    from functools import reduce
    
    def interquartile_range():
        def median_sorted(_sorted):
            _len = len(_sorted)
            if _len == 0:
                return None
            mid = int(_len / 2)
            return (_sorted[mid] + _sorted[mid - 1 + _len % 2]) / 2
    
        n = int(input())
        X = [int(x) for x in input().split(" ")]
        F = [int(f) for f in input().split(" ")]
        S = sorted(reduce(lambda a, b: a + b, [[x] * f for x, f in zip(X, F)]))
        _len = len(S)
        print("{0:.1f}".format(median_sorted(S[int(_len / 2) + _len % 2: _len]) - median_sorted(S[0: int(_len / 2)])))
    
    
    if __name__ == '__main__':
        interquartile_range()
    

    scala

    object Solution {
        def medianOfSorted(sorted: Array[Int]): Float = {
            if (sorted.isEmpty) return Float.NaN
            val mid: Int = sorted.length / 2
            return if (sorted.length % 2 == 1) sorted(mid).toFloat else (sorted(mid - 1) + sorted(mid)) / 2f
        }
        def main(args: Array[String]) {
            import java.util.Scanner
            val scan: Scanner = new Scanner(System.in)
            try {
                val n: Int = scan.nextInt
                scan.nextLine()
                val X: Array[Int] = scan.nextLine().split(" ").map(_.toInt).toArray
                val F: Array[Int] = scan.nextLine().split(" ").map(_.toInt).toArray
                val S: Array[Int] = X.zipAll(F, 0, 0).map(x_f => Array.fill(x_f._2)(x_f._1)).flatten.sorted
                println("%.1f".format(medianOfSorted(S.takeRight(S.length / 2)) -  medianOfSorted(S.take(S.length / 2))))
            } finally {
                scan.close()
            }
        }
    }
    

    java

    import java.io.*;
    import java.util.*;
    import java.util.stream.IntStream;
    import java.util.stream.Stream;
    import java.util.stream.Collectors;
    
    public class Solution {
        static float medianOfSorted(int[] sorted) {
            if (sorted.length == 0) return Float.NaN;
            int mid = sorted.length / 2;
            return (sorted[mid - (sorted.length % 2 == 1 ? 0 : 1)] + sorted[mid]) / 2;
        }
        public static void main(String[] args) {
            try (Scanner scan = new Scanner(System.in)) {
                int n = scan.nextInt();
                scan.nextLine();
                int[] X = Stream.of(scan.nextLine().split(" ")).mapToInt(Integer::parseInt).toArray();
                int[] F = Stream.of(scan.nextLine().split(" ")).mapToInt(Integer::parseInt).toArray();
                int[] S = IntStream.range(0, n).mapToObj(i -> IntStream.range(0, F[i]).map(_i -> X[i])).collect(Collectors.<IntStream>reducing(IntStream::concat)).get().sorted().toArray();
                System.out.printf("%.1f\n", medianOfSorted(Arrays.copyOfRange(S, S.length - S.length / 2, S.length)) - medianOfSorted(Arrays.copyOfRange(S, 0, S.length / 2)));
            }
        }
    }
    

    相关文章

      网友评论

        本文标题:Hackrank 统计十日通(第一天) 四分位距

        本文链接:https://www.haomeiwen.com/subject/gnjzottx.html