再出发

作者: 熊大状 | 来源:发表于2021-11-29 23:28 被阅读0次

框架:

  1. 梳理已经完成的项目,挖掘项目中自己的成长点&项目的亮点&难点,理清项目的背景、意义,待优化点。
  2. 确定自己面试的方向,搜广推,扩展学习基础知识。
  3. 列出第一、二、三阶段面试的公司,第一阶段是用来练手的,第二阶段是中厂保底的,第三阶段是想去的,然后在boss直聘上开始找合适的岗位海投
  4. 想好官方可接受的离职原因,对下份工作的期待,对自己未来3-5年成长的规划想好自己的优势、劣势,如何在面试中扬长避短
  5. 适当[刷题]

准备

1)项目及扩展
项目过程:背景、难点、收益、技术方案、亮点、待优化点
扩展:
2)通用机器学习类
https://www.jianshu.com/p/1b49317beb6b
3)leetcode

项目:

1)实体链指
2)实体识别
3)实体归一
4)文本分类
1) 数据分析:
1)样本量分布
2)长度分布
3)token分布:

2)token分析:

机器学习深度研究:特征选择中几个重要的统计学概念

文本建模常用的预处理方法——特征选择方法(CHI和IG)

过滤法(Filter):方差Var,卡方chi,F检验ANOVA。先对数据集进行特征选择,然后再训练学习器,特征选择过程与后续学习器无关。

方差var:无法区分各类,只分析整体。每个token的重要度(tf-idf)方差大,说明该token按重要性在样本中分布不均匀,有区分度

卡方chi:

包装法(Wrapper):模型优层面。根据目标函数(通常是预测效果评分),每次选择若干特征,或者排除若干特征。

嵌入法(Embedding):树模型、线性模型。先使用机器学习模型进行训练,得到各个特征的权值系数,根据系数从大到小选择特征。

3)数据量分布

4)其他特征的分布

 2)建模
 3)迭代:数据1)

5)特征建模:
1)特征分析
单特征核密度函数
特征重要性
2)GBDT
6)预训练模型:attendtion transformer bert albert albertiny charcnn

相关文章

  • 再•出发

    心中的爱本无边界 他人的怀疑难以将其冻结 任凭直觉的宣泄 唯有本质无邪 将梦想注入满腔热血 感动只因不断努力的书写...

  • “ 再”出发

    有的人只能陪你一程,有的路只能自己去走,有的幸福只能自己去创,有的事更只有自己去做。厚厚的浓雾挡住了我的视线模...

  • 出发!再赴南京!

    今天是2018年5月14日,我奉命赴南京参加业务培训。 一周的培训啊,是我入药监系统以来最长的一次培训吧。 在下一...

  • 再出发、再战斗

    突然发现,现时的我好像要安于现状,准备“岁月静好”了。 看看这段日子自己主要在干些什么:买了一大堆...

  • 再出发,再挑战

    “我手写我心”,多么简单而又重要的叙事生活。这段时间我忽略了很多,而且丢了一个这么好的习惯。是时候重新培养起来自己...

  • 我喜欢出发

    《我喜欢出发 》 ——汪国真 我喜欢出发。 凡是到达了的地方,都属于昨天。哪怕那山再青,那水再秀,那风再...

  • 我喜欢出发

    《我喜欢出发 》 ——汪国真 我喜欢出发。 凡是到达了的地方,都属于昨天。哪怕那山再青,那水再秀,那风再温柔。太...

  • 我也喜欢出发

    我喜欢出发 ——汪国真 我喜欢出发。 凡是到达了的地方,都属于昨天。哪怕那山再青,那水再秀,那风再温柔。太深的流连...

  • Judy教育日签

    美文抄写-汪国真《我喜欢出发》 我喜欢出发 凡是到达了的地方,都属于昨天,哪怕那山再青,那水再秀,那风再温柔,太深...

  • 再忆云南,论出发

    再忆云南,论出发 今天把营期的日记本又看了一遍,已然不知回顾了多少遍。早就想写这么一篇回忆反思,却因为这样那样而耽...

网友评论

      本文标题:再出发

      本文链接:https://www.haomeiwen.com/subject/xgjrxrtx.html