美文网首页
2020-01-20 生成list,并且划分数据集

2020-01-20 生成list,并且划分数据集

作者: Joyner2018 | 来源:发表于2020-01-20 14:09 被阅读0次

生成list,并且划分数据集

#!/bin/sh

CURDIR=$(pwd)

genlist(){

    ls $1/ | while read line;

    do

        echo "${1}/${line} ${2}"

    done

}

genlist ${CURDIR}/non-smoking 0 > temp__0.txt

genlist ${CURDIR}/smoking 1 > temp__1.txt

LEN_0=$(cat temp__0.txt | wc -l)

LEN_1=$(cat temp__1.txt | wc -l)

LEN_0_TEST=$((${LEN_0}/5))

LEN_0_TRAIN=$((${LEN_0}-${LEN_0_TEST}))

LEN_1_TEST=$((${LEN_1}/5))

LEN_1_TRAIN=$((${LEN_1}-${LEN_1_TEST}))

cat temp__0.txt | head -n ${LEN_0_TRAIN} > train_0.txt

cat temp__0.txt | tail -n ${LEN_0_TEST} > test_0.txt

cat temp__1.txt | head -n ${LEN_1_TRAIN} > train_1.txt

cat temp__1.txt | tail -n ${LEN_1_TEST} > test_1.txt

cat train_0.txt train_1.txt > train.txt

cat test_0.txt test_1.txt > test.txt

rm temp__0.txt temp__1.txt

rm train_0.txt test_0.txt

rm train_1.txt test_1.txt

相关文章

  • 2020-01-20 生成list,并且划分数据集

    生成list,并且划分数据集 #!/bin/sh CURDIR=$(pwd) genlist(){ ls $1...

  • sklearn数据集的获取与划分

    划分数据集 获取sklearn本地的数据集 描述iris数据集 从网络获取数据集 网络获取 划分训练集和测试集 数...

  • 决策树(二)

    划分数据集 分类算法除了需要测量信息熵,还需要划分数据集,度量花费数据集的熵,以便判断当前是否正确地划分了数据集。...

  • Tensorflow(一) 基础命令

    Tensorflow是怎样运作的 1. 导入或生成数据集 2. 对数据进行标准化 3. 将数据集划分成三部分:训练...

  • 2018-04-25 第五周

    本周任务:按照标准的数据集划分,即训练集:2 测试集:1的比例划分数据,测试模型效果。 首先,划分...

  • LitJson的集合解析

    //生成json数据 List list = new List(); string listJson ...

  • train_test_split

    我们在使用sklearn的train_test_split函数随机划分数据集生成training set 于tes...

  • kaldi中通用脚本

    划分数据集 根据utt2spk生成spk2utt 特征提取 正确排序和筛选目录文件

  • 数据集的划分&更改评估指标

    数据集划分为 训练集 开发集(交叉验证集) 测试集,最大化团队效率。 如何划分 将所有的数据随机洗牌,放入交叉验证...

  • 数据集划分

    常用方法:(1)简单分离训练集和测试集,(2)K折交叉验证分离1.最简单分离测试集和测试集:train_test_...

网友评论

      本文标题:2020-01-20 生成list,并且划分数据集

      本文链接:https://www.haomeiwen.com/subject/mhyjzctx.html