美文网首页
如何处理不同来源数据

如何处理不同来源数据

作者: Delia时之沙 | 来源:发表于2021-03-26 22:46 被阅读0次

今天稍微聊一下工作吧~

企业数字化的基础是IT信息化,健全的业务系统为数据统计分析提供了基础数据。然而实际情况是经常需要整合不同来源数据。

最近所做的数据需求数据来源杂乱,很多数据是线下手工收集。面对多来源的数据如何做到彼此关联呢?我们需要找到相同的纬度,将不同来源的数据处理到粒度一致。

常见的串联纬度:

①时间信息,比如同一天的访问量和下单量可以放在一起分析;

②地理信息,比如同一国家、同一省份城市的数据可以放在一起分析。

③身份信息,最为理想的还是带有身份标识信息的数据,比如身份证号、手机号、车牌号、邮箱等,这些是最能准确地将不同行为数据串联的有效依据。

确定好串联依据后,需要将数据处理成相同粒度,然后再合并所有信息。

这个原则知易行难,最近在做需求时,没有考虑清楚不同数据来源之间的关系,造成了返工的现象。

治愈系的花朵

相关文章

  • 如何处理不同来源数据

    今天稍微聊一下工作吧~ 企业数字化的基础是IT信息化,健全的业务系统为数据统计分析提供了基础数据。然而实际情况是经...

  • Spring MVC ModelMap.md

    近来发现controller里有不同的处理返回数据的方式,其中包括ModelMap不明白是如何处理数据返回的,所以...

  • Single-channel基因芯片笔记

    数据:single channel的RMA data 数据来源:ArrayExpression RMA数据处理 A...

  • 当我们谈【数据仓库】的时候,我们在谈什么?

    本文共1800字,预计阅读时长 10 min 一、数仓如何产生价值 当企业需要对不同来源、不同形式、不同主题的数据...

  • python机器学习2

    一.数据处理 数据来源https://github.com/wuyimengmaths/data[https://...

  • 2018-06-29 防御式编程

    保护程序免遭非法输入数据的破坏 检查所有来源于外部的数据的值检查子程序所有输入参数的值决定如何处理错误的输入数据 ...

  • Java多线程原理及总结

    并发 如何减少上下文切换 无锁并发编程:将数据ID按照Hash算法取模分段,不同线程处理不同段数据 CAS算法:J...

  • BI产品分析可视化报告

    目录 1 项目背景 2 数据处理 3 业务需求确定 4 需求分解 5 线索分析 5.1 不同年份线索来源数量分析 ...

  • Kaggle 指南(三)—— 数据预处理

    数据预预处理对于机器学习结果来说是至关重要,有时甚至是决定性的。本篇我们将讨论针对不同的数据类型,如何根据不同的数...

  • Apache Flink——数据源算子(Source)

    前言 Flink 可以从各种来源获取数据,然后构建 DataStream 进行转换处理。一般将数据的输入来源称为数...

网友评论

      本文标题:如何处理不同来源数据

      本文链接:https://www.haomeiwen.com/subject/qsashltx.html