美文网首页
随机创建训练集和测试集合的方法

随机创建训练集和测试集合的方法

作者: VanJordan | 来源:发表于2018-12-22 00:17 被阅读5次
  • 使用yield返回每一项的数据。
  • 使用namedtuple保存数据。
MyTupleClass = collections.namedtuple('MyTupleClass',['name', 'age', 'job'])
obj = MyTupleClass("Tomsom",12,'Cooker')
print(obj.name)
print(obj.age)
print(obj.job)
>>Tomsom
12
Cooker
Document = namedtuple('Document',
                      'content is_validation is_test label add_tokens')

random_int = random.randint(1, 10)
is_validation = random_int == 1
is_test = random_int == 2
if (is_test and dataset != 'test') or (is_validation and
                                       not include_validation):
    continue

yield Document(
    content=content,
    is_validation=is_validation,
    is_test=is_test,
    label=class_label,
    add_tokens=True)

相关文章

网友评论

      本文标题:随机创建训练集和测试集合的方法

      本文链接:https://www.haomeiwen.com/subject/pembkqtx.html