我看过很多建设方在做算法建设时都是优先建立算法平台,由于算法平台需要建立在大数据平台之上,所以又斥重金建设大数据平台,最终算法缺迟迟没有几个,算法效果也不太好。
究其原因,还是在算法平台建设时,需要做好几件事情,一个就是数据的整理与分析,这里只是抽样分析,但是也是费时费力,很多开发都不擅长也不愿意投入,尤其还需要与非IT人员讨论数据含义,包括看起来是异常,实际上符合业务情况的数据。
二是算法的选择与验证,本来搞开发的就很少懂算法开发,这也导致了一般开发不会搞这块,再加上算法的效果验证既要结合数理分析,也要和业务实际情况关联,这就更让传统开发敬而远之。
三就是算法运行平台的建设,这块但是传统开发喜闻乐见的内容,有批有流还有页面开发,可以说老技术新场景,不懂算法希望可以搞,所以一查做算法平台都是这条路,更有甚者干脆连传统意义上的数据打通,在线运行算法的基础能力都没有,只是实现一个开发版本的发布就号称如算法平台,这也偏离的太远了。
所以,结合我现在自身的情况,从选择具体算法入手反而是短期见效(或者快速失败)的最好路径了。
网友评论