美文网首页
shuf, 数据采样

shuf, 数据采样

作者: halfempty | 来源:发表于2021-11-24 08:53 被阅读0次

1. 需求

在提供数据或者测试的时候, 为了保证数据的随机性, 需要从现有文件中抽取子集

2. 方法

shuf取自"shuffle", 意指洗牌

shuf - generate random permutations

DESCRIPTION

  • Write a random permutation of the input lines to standard output.
  • Mandatory arguments to long options are mandatory for short options too.

基本使用

# 1. 抛硬币
[root@maxc107 leon]# shuf -r -n 10 -e '正' -e '反'
反
反
正
正
反
反
正
正
反
正

# 2. 区间取值
[root@maxc107 leon]# shuf -i 1-20 -n 5
5
19
1
3
11

# 3. 文件随机读
shuf -n 10000 domain.csv -o /tmp/1w.domain

相关文章

  • shuf, 数据采样

    1. 需求 在提供数据或者测试的时候, 为了保证数据的随机性, 需要从现有文件中抽取子集 2. 方法 shuf取自...

  • 😆 机器学习采样方法大全

    ? Index 数据采样的原因 常见的采样算法 失衡样本的采样 采样的Python实现 ? 数据采样的原因 其实我...

  • 不平衡数据的处理

    解决方法: 通过采样的方法: 少数数据过采样 多数数据欠采样 生成少数数据:SMOTE 使用分类方法解决欠采样: ...

  • shuf

    把输入行按随机顺序输出到标准输出。 shuf train.txt -o test.txt -n 30

  • Android万能音频播放器03--FFmpeg音频数据重采样后

    1、基本概念 采样率:每秒对音频数据采样的个数(44100hz)采样位数:存储采样数据的位数(16bit 2字节)...

  • 分类不平衡问题

    数据不平衡问题 答案取决于数据 平衡数据 少数样本过采样 多数样本欠采样 ...

  • 网络经营原理——大数据(下)

    大数据的精髓 一,所有数据而不再是随机采样 19世纪以来,当面临大量数据时,社会都依赖于采样分析,但是采样分析是信...

  • R常用的基本函数

    基本数据处理 缺失数据is.na() # 判断数据是否存在NA 处理重复数据 创建序列 随机采样 不放回采样 有放...

  • 学习总结第二篇 5.3

    1、内容总结 (1)读SPEC 了解如何查看数据手册 采样率即单位时间内采样数 采样率及采样精度越高,采集信...

  • 12.2 有限采样,图像重建和离散傅里叶变换

    12.2.1 有限采样 数据截断(truncation) 或者加窗,可以通过将采样得到数据与窗函数相乘。窗函数的边...

网友评论

      本文标题:shuf, 数据采样

      本文链接:https://www.haomeiwen.com/subject/jsnwtrtx.html