美文网首页
天气预报检验方法汇总

天气预报检验方法汇总

作者: 沐辰老爹 | 来源:发表于2019-03-13 14:11 被阅读0次

写在开始之前,由于本人水平有限,代码还有许多不完善或设计漏洞,请指正交流,共同进步.

连续变量

对于连续变量类检验:平均误差(ME)、平均绝对误差(MAE)、相关系数(R)、均方根误差(RMSE)。

  • ME \frac{1}{N}\sum_{i=1}^{N}(F_{i}-O_{i})
  • MAE \frac{1}{N}\sum_{i=1}^{N}(|F_{i}-O_{i}|)
  • RMSE \sqrt{\frac{1}{N}\sum_{i=1}^{N}(F_{i}-O_{i})^2}
    -R \frac{\sum_{i=1}^{N}(F_{i} - \bar{F})(O_{i}-\bar{O})}{\sqrt{\sum_{i=1}^{N}(F_{i} - \bar{F})^2\sum_{i=1}^{N}(O_{i} - \bar{O})^2}}

离散变量(等级)

2)对于等级变量统计检验:TS评分、漏报率(PO)、空报率(FAR)、预报偏差(BS)


image.png
  • TS \frac{NA}{NA+NB+NC}
  • PO \frac{NC}{NA+NC}
  • FAR \frac{NB}{NA+NB}
  • BS \frac{NA+NB}{NA+NC}

介绍完毕,下面直接贴代码

import os
import datetime
import numpy as np
import pandas as pd
from sklearn.metrics import confusion_matrix


class Verify(object):
    def __init__(self):
        super(Verify, self).__init__()
        self.confusion_matrix = None
        self.NA = None
        self.NB = None
        self.NC = None

    def _get_level_verify(self, real_value, predict_value, levels):
        self.__init__()
        real_level, predict_level = self._check_levels(
            real_value, predict_value, levels)
        self.confusion_matrix = self._get_confusion_matric(
            real_level, predict_level)
        if self.NA is None or self.NB is None or self.NC is None:
            self.NA = {}
            self.NB = {}
            self.NC = {}
        for ivalue, vvalue in enumerate(self.confusion_matrix.columns):
            self.NA[vvalue] = self.confusion_matrix.ix[vvalue, vvalue]
            self.NB[vvalue] = self.confusion_matrix.ix[slice(
                None), vvalue].sum()
            self.NC[vvalue] = self.confusion_matrix.ix[vvalue,
                                                       slice(None)].sum()

    def _check_and_remove_nan(self, real_value, predict_value):
        logical_nan = ~np.logical_or(
            np.isnan(predict_value), np.isnan(real_value))
        predict_value = predict_value[logical_nan]
        real_value = real_value[logical_nan]
        return real_value, predict_value

    def _get_confusion_matric(self, real_level, predict_level):
        return pd.DataFrame(confusion_matrix(real_level, predict_level),
                            index=np.unique([real_level, predict_level]), columns=np.unique([real_level, predict_level]))

    def _check_levels(self, real_value, predict_value, levels):
        '''
        引用https://docs.scipy.org/doc/numpy-1.13.0/reference/generated/numpy.digitize.html
        使用numpy.digitize 函数
        '''
        real_value, predict_value = self._check_and_remove_nan(
            real_value, predict_value)
        predict_level = np.digitize(predict_value, levels)
        real_level = np.digitize(real_value, levels)

        return real_level, predict_level

    def _calc_RMSE(self, real_value, predict_value):
        real_value, predict_value = self._check_and_remove_nan(
            real_value, predict_value)
        return np.sqrt(np.mean((predict_value - real_value) ** 2))

    def _calc_MAE(self, real_value, predict_value):
        real_value, predict_value = self._check_and_remove_nan(
            real_value, predict_value)
        return np.mean(np.abs(predict_value - real_value))

    def _calc_ME(self, real_value, predict_value):
        real_value, predict_value = self._check_and_remove_nan(
            real_value, predict_value)
        return np.mean(predict_value - real_value)

    def _calc_R(self, real_value, predict_value):
        real_value, predict_value = self._check_and_remove_nan(
            real_value, predict_value)
        return np.corrcoef(real_value, predict_value)[1, 0]

    def _calc_TS(self, real_value, predict_value, levels):
        '''
        根据等级计算TS评分,即等级预报的准确率
        TS = True / True + Flase Alarm + True negetive
        '''
        self._get_level_verify(real_value, predict_value, levels)
        return (pd.Series(self.NA) / (pd.Series(self.NB) + pd.Series(self.NA) + pd.Series(self.NC))).to_json()

    def _calc_PO(self, real_value, predict_value, levels):
        '''
        PO = True/ True + True negetive
        '''
        self._get_level_verify(real_value, predict_value, levels)
        return (pd.Series(self.NC) / (pd.Series(self.NA) + pd.Series(self.NC))).to_json()

    def _calc_FAR(self, real_value, predict_value, levels):
        '''
        FAR = False Alarm / True + True negetive
        '''
        self._get_level_verify(real_value, predict_value, levels)
        return (pd.Series(self.NB) / (pd.Series(self.NB) + pd.Series(self.NA))).to_json()

    def _calc_BS(self, real_value, predict_value, levels):
        '''
        BS = True + False Alarm / True + True negetive
        '''
        self._get_level_verify(real_value, predict_value, levels)
        return ((pd.Series(self.NA) + pd.Series(self.NB)) / (pd.Series(self.NA) + pd.Series(self.NC))).to_json()

'''
# 方法调试示例
verify_obj = Verify()
real_value = np.random.randint(0, 10, 100)
predict_value = np.random.randint(0, 10, 100)
print(verify_obj._calc_RMSE(real_value, predict_value))
print(verify_obj._calc_MAE(real_value, predict_value))
print(verify_obj._calc_ME(real_value, predict_value))
print(verify_obj._calc_R(real_value, predict_value))
print(verify_obj._calc_TS(real_value, predict_value, [2, 5, 7, 9]))
print(verify_obj._calc_PO(real_value, predict_value, [3, 5, 7, 9]))
print(verify_obj._calc_FAR(real_value, predict_value, [2, 5, 7, 9]))
print(verify_obj._calc_BS(real_value, predict_value, [2, 5, 7, 9]))
'''

相关文章

  • 天气预报检验方法汇总

    写在开始之前,由于本人水平有限,代码还有许多不完善或设计漏洞,请指正交流,共同进步. 连续变量 对于连续变量类检验...

  • 七类一致性检验方法汇总

    七类一致性检验方法汇总 一、一致性检验定义 在做数据分析时,我们经常会遇到一致性检验的问题,即判断不同的模型或者分...

  • 检验正态分布方法的汇总

    在数据分析过程中,往往需要数据服从正态分布,正态分布,也称“常态分布”,又名高斯分布,在求二项分布的渐近公式中得到...

  • 统计学之检验

    与数据相关的检验很多,本文力求逐渐汇总常用的检验(原理,代码实现),因为一个检验可能应用场景众多,这里只按检验罗列...

  • 谈谈t检验和Wilcoxon秩和检验

    t检验和wilcoxon秩和检验是用于检验两独立样本定量资料的常用方法。t检验是参数方法,需要资料满足正态性和方差...

  • D7-多样本秩和检验非参数

    秩和检验 秩和检验是参数检验重要的补充。秩和检验是非参数检验的重要方法。多组定量数据的比较,主要的方法有两种。一种...

  • java.util.BitSet-java中的位图类

    1. 构造方法和汇总统计方法 构造方法 汇总统计 size/length/isEmpty/cardinalit...

  • 卡方检验汇总

    一、卡方检验基本说明 有时,在研究中某个随机变量是否服从某种特定的分布是需要进行检验的。可以根据以往的经验或者实际...

  • Python项目自动生成requirements.txt

    方法一 方法二 (未检验)

  • 平稳性检验方法的有效性研究

    ——针对客观类平稳性检验方法进行分析,从时间序列的样本长度视角探讨检验方法的实际性能,ADF 检验和PP 检验是相...

网友评论

      本文标题:天气预报检验方法汇总

      本文链接:https://www.haomeiwen.com/subject/eyfpuftx.html