美文网首页我的世界
赶紧写完睡觉

赶紧写完睡觉

作者: 好名字托雷 | 来源:发表于2017-09-28 02:35 被阅读23次

好累,记一下今天的成果,然后赶紧睡觉

文本挖掘课程

今天上了文本挖掘课程,讲了一些统计语言模型的历史和简单的中文分词技术,然后使用jieba分词做了小练习:用lxml爬一些文章下来,然后分词,最后使用wordcould做词云。

爬文章
import lxml.html
from urllib import request
f1 = request.urlopen('http://news.baidu.com/').read()
lxf1 = lxml.html.fromstring(f1)
lxf1l = lxf1.cssselect('a.a3')
lxf1ls = [[l.get('href'),l.text_content()] for l in lxf1l]
#lxf1lspd = pd.DataFrame(lxf1ls)
for ls in [lxf1ls[0]]:
    ls1 = request.urlopen(ls[0]).read()
    lxls1 = lxml.html.fromstring(ls1)
    lxls1l = lxls1.cssselect('div > p')
    lxls1ltext = '\n'.join([x.text_content() for x in lxls1l])
    print(ls[1])
    print('----------------------')
    print(lxls1ltext)
    print('======================')
http://news.xinhuanet.com/politics/2017-09/27/c_1121734537.htm
词云
import jieba
from wordcloud import WordCloud
jtext = jieba.cut(lxls1ltext,cut_all=False)
wcjtext = '/'.join(jtext)
fp = r'C:\Windows\Fonts\simkai.ttf'
wordcloud = WordCloud(font_path=fp,background_color='white',scale=1.5).generate(wcjtext)
plt.figure(1,(10,10))
plt.imshow(wordcloud)
词云

大概就是这样了。

Python金融大数据分析

下课以后学了这个,感觉pythonpandas库太牛了,做数据分析必备。虽然之前用也在用这个库,但是从来没有系统的学习过,这次稍微看了看书,书上的一些高级用法让人眼前一亮。

从yahoo下载Google股价,计算收益率年化波动
import numpy as np
import pandas as pd
import pandas_datareader as web
import matplotlib.pyplot as plt
import math
import numexpr as ne
ne.set_num_threads(4)

goog = web.DataReader('GOOG',data_source='yahoo',start='2009-01-01',end='2017-01-01') # 用校园网有线连接
goog['Log_Ret'] = np.log(goog['Close']/goog['Close'].shift(1))
goog['Volatility'] = goog['Log_Ret'].rolling(window=252).std()*np.sqrt(252) # 年化
#%matplotlib inline
goog[['Close','Volatility']].plot(subplots=True,color=['blue','red'],figsize=(8,6),grid=True)
Google:2009-2017股价和收益率年化波动
使用numexpr加速numpy科学计算
import numexpr as ne
loops = 1000000
a = np.arange(1,loops)
%timeit r = 3*np.log(a)+np.cos(a)**2
ne.set_num_threads(1)
%timeit r = ne.evaluate('3*log(a)+cos(a)**2')
ne.set_num_threads(4)
%timeit r = ne.evaluate('3*log(a)+cos(a)**2')

10 loops, best of 3: 138 ms per loop
10 loops, best of 3: 61.4 ms per loop
10 loops, best of 3: 31.2 ms per loop

使用numexpr以后,速度翻倍,增加线程数量,速度再次翻倍。

%prun魔法函数代码分析
%prun r = ne.evaluate('3*log(a)+cos(a)**2')
代码分析
IPython的Latex
#%%
%%latex
\begin{equation}
S_T = S_0 e^{(r - 0.5\sigma^2) T + \sigma \sqrt{T} z}
\end{equation}
期权定价公式

Bravo!我一定要好好学python!

MineCraft比拼

想学Java,打算看看之前玩的游戏MineCraft的源码。
下面放几个链接:

http://hopper.minecraft.net/help/pixel-format-not-accelerated/
错误处理:我的电脑只有集显(独显的驱动坏了,不能更新),所以报错,看这个是因为使用Intel HD 3000的集显,太low,所以Java版本不能太高,之前一直用的jre1.8.0_144,降低到jre6就好了。

https://tieba.baidu.com/p/4421623213?red_tag=0927855031
https://tieba.baidu.com/p/4251510226?red_tag=1211872928
教你怎么看MineCraft的源码。Java太恶心看不下去......
http://www.modcoderpack.com/website/content/
反编译器的下载地址,对应好版本下载即可。

我用了原来的我的世界精灵客户端,和网易的客户端,发现网易代理超级卡。当然,如果使用集显,网易客户端不能使用过高版本的MineCraft,因为1.12的我的世界用的是jre8,降低到1.7.10就是用的jie7,jie7下渣渣集显启动成功。

用其他的非网易代理的盗版客户端时候,注意也要更改jre版本。如果改不了的,去%AppData%\Roaming\XXX\下找找java.list、config一类的配置文件,手动修改jre地址。这里XXX就是使用的盗版客户端的名字了(MCELF,MCLC什么的)。无奈,网易代理不给力啊,想玩win10自带的C++版MineCraft了。

睏=_=。

相关文章

  • 赶紧写完睡觉

    好累,记一下今天的成果,然后赶紧睡觉 文本挖掘课程 今天上了文本挖掘课程,讲了一些统计语言模型的历史和简单的中文分...

  • 赶紧写完就睡觉吧

    我都是在应付写文章,也没啥真正倾注感情上去,以至于应付一下,也不觉得心疼。 生活中,对工作,对朋友,似乎大...

  • 3/25/17  阴  六

    好困啊, 赶紧写完睡觉 晚安全世界

  • 写完,睡觉!

    又是一个夜晚,今天突然意识到一个严肃的问题,原来我是一个重度拖延症患者啊,当然这只不过是我自己都给自己的诊断而已。...

  • 写完睡觉

    昨天刷到一条微博热搜,讲的是一位贴膜的摊主忽然接到了一个电话,老婆在医院快生了!!!于是摊主急急忙忙赶往医院连摊位...

  • 写完睡觉

    这两天发生的事情,让我明白了,如果内心想做,就主动去做。不要带期待的去做,收获的全是惊喜。 人生的遗憾你一定要去想...

  • 赶紧睡觉!

    昨晚小吵心情好差到今天白天都没有平复。 总爱沉浸在这样的情绪里无法自拔,怎么还不成熟! 但是去买了些东西,回来心情...

  • 写完就睡觉

    现在是2017年2月12日零点十三分,十几分钟前是元宵佳节,这么晚还刚刚上床上坐着,虽然已经十二点,但是还是想写下...

  • 写完快睡觉

    今日感恩日记 1、二姨给我们带来了很多新鲜的菜 2、午觉睡的超级香 3、看了一遍galaxy 的MV 4、和妈妈去...

  • 写完睡觉——晚安~

    打开简书想记录一下心情,结果被别人的文章吸引住了,看了一会,脑袋里的小瞌睡虫和小天使开始对话了 瞌睡虫:“睡觉吧,...

网友评论

    本文标题:赶紧写完睡觉

    本文链接:https://www.haomeiwen.com/subject/fjapextx.html