美文网首页机器学习
ML:越千年,太白的不羁仍能懂

ML:越千年,太白的不羁仍能懂

作者: 凡有言说 | 来源:发表于2019-09-26 18:48 被阅读0次

想必除了预测,随机森林、决策树、神经网络等等炫酷词汇从随机出现在你我的订阅号、朋友圈,如今已然到了高频刷存在感地步。身为高学历的文科生,任他公式代码狂轰滥炸,我们不慌。拿出学术训练培养的逻辑力,我们从故事的底层入手,去追问为什么需要机器学习的方法,现有的办法就不能解决嘛?似我们读《诗经》时会想为啥有那么多关于南山的意象。

穿越千年,李太白的不羁、杜子美的悲悯,我们依然能秒懂,因为文化不曾断。有没有条线贯穿着机器学习,帮助我们懂它?

D'où venons-nous ? Que sommes-nous ? Où allons-nous ? Eugène Henri Paul Gauguin,1897

过拟合,这是机器学习首要解决的问题。它是指机器在学习的时候,既学习了全局特征又学习了局部特征,还把局部特征学的过头了,这就造成了其“泛化性”差。好比唐代的诗读过头了,认为唐朝只出律诗和绝句,给首“花间派”温庭筠的词,模型会给出温庭筠不是唐朝人的反事实判断。

为了解决这个大麻烦,产生了交叉验证、正则化等方法。前者如两分法、K折法;后者如Lasso回归、Ridge回归和Elastic Net模型。特别地,交叉验证是机器学习的一个核心思想,用验证样本来判断模型优劣。哎,当我们讨论机器事时,拎得清。到了自身,往往持目标意图行事,把“执行意图”丢了老远。总是先计划棒棒的,再实施一二,来寻找“真实的自我”,熟不知大可以“先做后想”,用现实来测试种种“可能的自我”。即啥也别想,直接上测试数据集,看效果来判断自己的模型,是可以了还是要继续改。

每一次,我们都特希望自己的模型能通过测试样本的“考验”,用数学语言表述就是测试样本所得结果的误差率小。此时,只要把我们的测试样本分到最有可能的分类就好啦。这样的分类方法有:贝叶斯分类,KNN分类、LDA、决策树、支持向量机、集成学习、神经网络、随机森林等等。

公众号.png

相关文章

  • ML:越千年,太白的不羁仍能懂

    想必除了预测,随机森林、决策树、神经网络等等炫酷词汇从随机出现在你我的订阅号、朋友圈,如今已然到了高频刷存在感地步...

  • 对对子

    黄梅戏,出黄梅,恰似黄梅香万里; 太白楼,临太白,终因太白秀千年。

  • 青衣客

    梦倚长剑着青衣, 策马奔腾命不羁。 月下独酌似太白, 梦醒尚可见晨曦。

  • 长相思

    若是懂我,应远赴千里,不相思。 若是懂我,应千里传音,话不绝。 若是懂我,应一日不见,越千年。 若是懂我,应该懂我...

  • 罪恶面具

    越痛苦,越快乐 ——ML

  • 李苏

    唐时太白宋苏轼,文采飞扬垂青史 信手拈来成佳句,豪放不羁叹观止

  • 秦岭千年鸟道

    秦岭千年鸟道 太白山人 中华龙脊太白山, 南北气候分界线。 千年候鸟迁徙道, 雁阵南翔好震撼。 秦岭谷地景色美, ...

  • 聊聊那随性不羁的太白先生

    作者:白梅杰 他有着让无数人倾倒的才情风采,他的诗豪迈奔放,雄奇飘逸,如长江黄河般直泄千里,波澜...

  • 段子1

    越来越不羁的我............

  • 浣溪沙——求缘

    浣溪沙 ——求缘 孤夜游人夜无眠, 太白诗仙话千年, ...

网友评论

    本文标题:ML:越千年,太白的不羁仍能懂

    本文链接:https://www.haomeiwen.com/subject/niqjyctx.html