美文网首页
2018-05-01 统计决策与模式识别 考试资料整理 + 结合

2018-05-01 统计决策与模式识别 考试资料整理 + 结合

作者: 啊哈JC熙 | 来源:发表于2018-05-02 00:55 被阅读22次

    第一部分 面试准备:结合社交网络的金融风险预测资料整理

    资料来自七月在线:http://www.julyedu.com/video/play/45/245

    社区发现算法的用处

    • 强关系网络 strong tie network : 同质性(即交往的人群从事的工作,掌握的信息都是趋同的)较强、关系紧密、

    • 弱关系网络weak tie network :异质性(即交往面很广,交往对象可能来自各行各业,因此可以获得的信息也是多方面的)较强、关系不紧密、

    社交网路算法 --- 分析指标

    • 一个具体的网路可以抽象为一个由节点(vertex或node)集合V和边(edge)集合E组合的图G =(V,E),节点数记为n=|V|,边数记为m=|E|

    • 衡量指标

      • 度 degree
      • 密度 density
      • 团 clique
      • 度中心性 degree centrality
      • 紧密中心性 closeness centrality
        物理意义:对于一个结点而言,它距离其它结点越近,那么它的中心度越高。



        节点v到其他节点的最短路径长度之和,被节点总数之和减1(除去节点v)除

      • 介数中心性 betweenness centrality
        节点在结构上的链接作用。起到和其他社区链接的作用。
        计算方法:
    • 计算每对节点(i,j)之间的最短路径,当然需要得到具体路径; 【遍历全图,对于一个单一节点要看通过这个节点的最短路径的个数】

    • 对各个节点判断该节点是否在最短路径上

    • 最后将刚刚的判断进行累加得到从i到j的最短路径经过该节点的数量


      • 聚类系数 clustering centerlity
        节点v的k个邻居节点之间实际存在的变数E和总的可能的边数C之比,

    值得注意的是,这些指标都是基于物理拓扑结构的,从直观上很容易理解,但是有些深层的信息却无法被感知,而且基于图结构指标的计算复杂度很高不是个大规模网络,这是人们就提出了网络表示学,希望通过将网络特征向量映射到低维空间,然后结合机器学习技术,来深度挖掘图中的信息。

    基于数据的交易网络分析和基于拓扑结构的交易网络分析

    基于拓扑结构的交易网络分析

    我们一般分析wang

    基于数据的交易网络分析

    互联网金融面临的欺诈风险


    P2P:个人对个人的信用贷款。平安 人人贷 异信
    互联网金融理财
    hadoop(大数据)的四个特性:量 速 类 质


    自动化评估



    欺诈区别于反作弊
    刷单,刷注册
    欺诈信用风险
    中介包装、多借贷、养账号
    信用卡刷流水,刷单
    主要是不还钱,从数据中找出不虚假信息。

    互联网金融风险控制,共享黑名单
    半夜消费,消费游戏,赌博 一般是 不良申请人员

    统计假设检验,逻辑回归,这人的理财状况和黑名单中的人做对比,这是只是一个点。
    而应用社交网络这一块的话,更像是从一个面上来控制全局的风险,


    用户和用户的关系,银行卡的消费关系,地理位置,设备信息。
    图数据库neo4j构建多维度大量的数据。发现更多异常的数据。

    好坏用户

    pagerank用户的重要性,借贷网络中,pagerank值越高,表示用户越活跃,越不好,风险越高
    cypher(萨福)语句 类似与sql,但是不sql跟自然的查询语句。

    材料:
    准备:

    第二部分 统计决策与模式识别 考试资料整理

    第一题 广义齐次线性判别函数

    https://wenku.baidu.com/view/2f7d5c3e5727a5e9856a6137.html?from=search

    扩充维度,我们把例如x的n次方看成一个维度(x,y,z...)

    第二题 正态分布概率模型下的最小错误率贝叶斯决策

    https://wenku.baidu.com/view/14290a99cf84b9d529ea7a01.html?from=search

    第三题 极大似然参数估计法

    https://wenku.baidu.com/view/8be6d0fdf61fb7360b4c652c.html?from=search

    心情💢

    爱了很久的朋友

    其实这些不想发出来的,但是想写些东西于是就整理发出来了,最近好忙呀,感觉自己太弱了,啥都不会,啥都没有别人做的好,统计决策的卷子,复杂网络的ppt,数据挖掘的ppt,现代数据库文档整理,交接工作文档整理,概率论考试,还有我的英语6级考试,一堆事呀,总是做不完,做不好。
    想在短时间内干好,感觉有些不切实际,明明之前也做了努力但是为什么还是这么狼狈呢,你真的很差劲呀,李俊成。
    还有实习工作的事情,估计五一假期结束后人家就要找我谈了,我不知道自己现在这样做是不是正确的,有时候感觉累了,在想是不是自己不因该这样着急呀,有时候心还是蛮累的,还记得面试完的那一天,我高兴的给家里人打电话,家人就开始问我实习工作后会怎么样,是呀,人生哪有休息,都是一个有一个路口,一件事推着另一件事情,兜兜转转,什么是个头呀。我作完自我介绍的时候,面试官第一个问题就是“你是否愿意留在兰州”,其实之前面试过挺多家公司的,这样的提问还挺惊讶的,我大甘肃留不住人才还怎么发展,自己当时点了头,想想当时回来的原因,和身边的她,我想自己因该是想在兰州有一个家🏠呀,所有话说回来,你想拥有的越多,你就要付出的越多。至于到底去不去哪家公司,看之后的条件吧,毕竟5年合约还是太长,没有合理的薪资自己应该会好好考虑一下。还有对于她自己总是抱歉,应该也不对吧,哎...就这样吧。
    时间呀不停走没有终点只有路口。
    愿一切都会好起来吧。

    相关文章

      网友评论

          本文标题:2018-05-01 统计决策与模式识别 考试资料整理 + 结合

          本文链接:https://www.haomeiwen.com/subject/hjlrlftx.html