美文网首页
Datawhale 零基础入门CV赛事-Task5 模型集成

Datawhale 零基础入门CV赛事-Task5 模型集成

作者: 顾子豪 | 来源:发表于2020-06-02 23:30 被阅读0次

集成学习

  • 集成学习只能在一定程度上提高精度,并需要耗费较大的训练时间,因此建议先使用提高单个模型的精度,再考虑集成学习过程。
  • 具体的集成学习方法需要与验证集划分方法结合,Dropout和TTA是应用较为广泛的方法。

Dropout

  • Dropout 是一种深度学习的一种技巧, 他会随机让某些节点不参与训练,而在预测时,所有节点又参与训练,这样训练时就不会出现该模型对于某一点极其依赖,所以也是一种缓解过拟合的的有效方法。
class SVHN_Model1(nn.Module):
    def __init__(self):
        super(SVHN_Model1, self).__init__()
        self.cnn = nn.Sequential(
            nn.Conv2d(3, 16, kernel_size=(3, 3), stride=(2, 2)),
            nn.ReLU(),
            nn.Dropout(0.25),
            nn.MaxPool2d(2),
            nn.Conv2d(16, 32, kernel_size=(3, 3), stride=(2, 2)),
            nn.ReLU(), 
            nn.Dropout(0.25),
            nn.MaxPool2d(2),
        )
        
        self.fc1 = nn.Linear(32*3*7, 11)
        self.fc2 = nn.Linear(32*3*7, 11)
        self.fc3 = nn.Linear(32*3*7, 11)
        self.fc4 = nn.Linear(32*3*7, 11)
        self.fc5 = nn.Linear(32*3*7, 11)
        self.fc6 = nn.Linear(32*3*7, 11)
    
    def forward(self, img):        
        feat = self.cnn(img)
        feat = feat.view(feat.shape[0], -1)
        c1 = self.fc1(feat)
        c2 = self.fc2(feat)
        c3 = self.fc3(feat)
        c4 = self.fc4(feat)
        c5 = self.fc5(feat)
        c6 = self.fc6(feat)
        return c1, c2, c3, c4, c5, c6

TTA

  • TTA: 测试集数据扩增(Test Time Augmentation)也是一种技巧。不过这个数据口增和训练数据的数据扩增有所不同,不同之处在于:训练数据是概率采用,或自定义的使用数据扩增, 而TTA是对测试集采用N次数据变换, 再将这些变换后的数据传入模型,对结果取平均值。
def predict(test_loader, model, tta=10):
   model.eval()
   test_pred_tta = None

   for _ in range(tta):
       test_pred = []
   
       with torch.no_grad():
           for i, (input, target) in enumerate(test_loader):
               c0, c1, c2, c3, c4, c5 = model(data[0])
               output = np.concatenate([c0.data.numpy(), c1.data.numpy(),
                  c2.data.numpy(), c3.data.numpy(),
                  c4.data.numpy(), c5.data.numpy()], axis=1)
               test_pred.append(output)
       
       test_pred = np.vstack(test_pred)
       if test_pred_tta is None:
           test_pred_tta = test_pred
       else:
           test_pred_tta += test_pred
   
   return test_pred_tta

提交,写入CSV文件

res = np.vstack([
    fc1.argmax(1).cpu().numpy(),
    fc2.argmax(1).cpu().numpy(),
    fc3.argmax(1).cpu().numpy(),
    fc4.argmax(1).cpu().numpy(),
    fc5.argmax(1).cpu().numpy(),
])
for x in res.T:
    pre.append("".join(map(str, x[x!=10])))
df = pd.read_csv("data/resnet18.csv")
df["file_code"] = pre
df.to_csv("data/resnet18.csv", index=False)

相关文章

  • Datawhale 零基础入门CV赛事-Task5 模型集成

    最后一章,将会学习如何使用集成学习提高预测精度,通过学习知道集成学习方法以及交叉验证情况下的模型集成,最终学会使用...

  • Datawhale 零基础入门CV赛事-Task5 模型集成

    5 模型集成 本章讲解的知识点包括:集成学习方法、深度学习中的集成学习和结果后处理思路。 5.1 学习目标 学习集...

  • Datawhale 零基础入门CV赛事-Task5 模型集成

    集成学习 集成学习只能在一定程度上提高精度,并需要耗费较大的训练时间,因此建议先使用提高单个模型的精度,再考虑集成...

  • cv街景门牌字符的赛题理解

    Datawhale 零基础入门CV赛事-Task1 赛题理解 1 赛题理解 赛题名称:零基础入门CV之街道字符识别...

  • 思绪·随笔(11)

    这段时间参加了datawhale 的零基础入门CV赛事,学到了很多东西,对之前不懂的东西理解更加清晰了,就需要多参...

  • 贷款违约预测-Task5 模型融合

    Task5 模型融合 Tip:此部分为零基础入门金融风控的 Task5 模型融合部分,欢迎大家后续多多交流。赛题:...

  • Task01: 计算机视觉赛题理解

    零基础入门CV赛事- 街景字符编码识别 赛事报名页面 数据下载链接 来自SVHN数据集 filesizelinkm...

  • Task1 赛题理解

    1. 理解赛题背景 零基础入门系列赛事第二场 :零基础入门CV赛事之街景字符识别 典型计算机视觉识别:预测真实场景...

  • Task01:赛题理解

    一、赛题背景 本次新人赛是Datawhale与天池联合发起的0基础入门系列赛事第四场 —— 零基础入门金融风控-贷...

  • 贷款违约预测-Task1 赛题理解

    Task1 赛题理解 Tip:本次新人赛是Datawhale与天池联合发起的0基础入门系列赛事第四场 —— 零基础...

网友评论

      本文标题:Datawhale 零基础入门CV赛事-Task5 模型集成

      本文链接:https://www.haomeiwen.com/subject/hjymzhtx.html