学习 handson-ml 时用到 sklearn 的 train_test_split,记录一下。
sklearn.model_selection.train_test_split(*arrays, **options):
参数:
- arrays: lists, ndarray, scipy-sparse matrices 或者 DataFrame
- options: 选项
- test_size: 测试集大小,int, float,如果是 float 则表示比例,默认 0.25
- train_size: 训练集大小,int, float,默认由 test_size 推出
- random_state: 随机种子,int, RandomState 或者 None
- shuffle: 打乱,默认为True
返回值:
- splitting: 分割后的 list,长度为 2 * len(arrays)
网友评论