今天我感觉到了瓶颈。开发的时候注意力有点不集中了。思维也略微有点跟不上了。不过还是完成了一点东西的。
首先是爬虫和心情:
爬取的新闻可以算出总的心情了,当做当前的心情值存入系统。后期的打算是把心情值进一步的变成“难过”“开心”这样的具体心情。然后我在想人在接受了一个情感冲击后,其实根据情感冲击与自己的相关性,会进行一个衰减。
首先,心情波动的平复大家肯定都可以理解。其次就是这个相关性了。
比方说:苹果发布了iPhone7,如果你是安卓的忠实粉丝,你的个人特征里有“安卓粉”“排斥苹果”这样的tag,那么虽然这个消息是个正面的,但是你会立刻失去对它的关注。然而如果你是一个果粉,那么你会持续关注它,如果没有后续消息,你也会激动一阵子后,才能恢复平静。
我要做的,就是这个。根据Athena自己——或者用户的喜好。让这个心情值可以波动和衰减。
之后我其实很迷茫:
我的TF-IDF算法没有成型。我想做情感倾向的词汇的爬取和改进,也没有开始。
我还想找到GalGame的语料库,训练我的AI,也没有开始。
不过我倒是把之前一个问题解决了:百度搜索的爬取。之前因为编码问题,我一直没法对我想要的关键词进行搜索。现在搞定了~关键是:encodeURIComponent
最后是今晚的进展:
我用Electron把Athena变成了OS X的应用,她终于可以不再运行在浏览器里了!!!为我自己鼓掌一秒。
然后我把Athena更新到Github上之后,扔到了我们国外的服务器上。运行成功!
这两件事足以冲淡我今天的一些不快。
之后我的开发会越来越慢……我感觉前面如果没有人给我指一下路,我可能会写的非常糟糕……
加油~
网友评论