美文网首页
随机创建训练集和测试集合的方法

随机创建训练集和测试集合的方法

作者: VanJordan | 来源:发表于2018-12-22 00:17 被阅读5次
    • 使用yield返回每一项的数据。
    • 使用namedtuple保存数据。
    MyTupleClass = collections.namedtuple('MyTupleClass',['name', 'age', 'job'])
    obj = MyTupleClass("Tomsom",12,'Cooker')
    print(obj.name)
    print(obj.age)
    print(obj.job)
    >>Tomsom
    12
    Cooker
    
    Document = namedtuple('Document',
                          'content is_validation is_test label add_tokens')
    
    random_int = random.randint(1, 10)
    is_validation = random_int == 1
    is_test = random_int == 2
    if (is_test and dataset != 'test') or (is_validation and
                                           not include_validation):
        continue
    
    yield Document(
        content=content,
        is_validation=is_validation,
        is_test=is_test,
        label=class_label,
        add_tokens=True)
    

    相关文章

      网友评论

          本文标题:随机创建训练集和测试集合的方法

          本文链接:https://www.haomeiwen.com/subject/pembkqtx.html