看完此文章,你将可以独立完成:
- 在服务器上可以写一个简单的静态网页,并访问
- 可以为你的App写接口,提供Json格式的数据
- 服务器定时执行某项任务
开工大吉了,还不赶紧用六十四卦摇一摇啊?看看新年财运如何~
image因为文章都是涉及到服务器的,所以福利就要写在最前面:
过大年了,大家是不是又有了压岁钱了啊??啊哈哈哈哈,压岁钱买糖吃还不如投资到自己身上。比如用来买课程,或者用来买服务器,来学习编程,写爬虫。来买服务器啊买服务器啊!只在本地跑,根本没用的!恰巧,铲屎官这里就有上千元的阿里云和腾讯云的优惠券给你使用(每一款优惠只要点击优惠链接,进入即可领取):阿里云部分:
【阿里云新人1888元云产品通用代金券】:
https://promotion.aliyun.com/ntms/yunparter/invite.html?userCode=nrkmbo9q【阿里云爆款云主机,2折优惠券】:
https://promotion.aliyun.com/ntms/act/qwbk.html?userCode=nrkmbo9q【阿里云企业级服务器2折优惠券】:
https://promotion.aliyun.com/ntms/act/enterprise-discount.html?userCode=nrkmbo9q腾讯云:
【新客户无门槛领取总价值高达2775元代金券,每种代金券限量500张,先到先得】:
https://cloud.tencent.com/redirect.php?redirect=1025&cps_key=b351b2fc50b15866ff9d19b58a5df0f5&from=console【腾讯云服务器、云数据库特惠,3折优惠券】:
https://cloud.tencent.com/redirect.php?redirect=1014&cps_key=b351b2fc50b15866ff9d19b58a5df0f5&from=console
--接下来是正文--
今天铲屎官给大家带来的是,如何用Tornado来搭建你自己的服务器。
我敢打包票,85%的人看不完这篇文章。大家的自觉性就是这样。
授人以鱼不如授人以渔,这就是我为什么要写这些文章的缘由。今天既然能够通过公众号来访问到小草,那么明天我就可以通过公众号上访问每天新闻的最新消息,或者我关注的人的微博更新,或者美剧是否又跟新了,或者视频网站是否又出新视频了,或者一些论坛是否发了最新的帖子,甚至每天早晨一起来,都可以通过自己的算法再结合昨天的股票数据,来推测今天大盘的涨跌,这些东西背后的原理其实都差不多的。所以,不要把自己的思路局限在一点,要扩散,要放开,这样才会有骚操作的出现。
行了,废话不闲扯了,来开始说说我们今天的主角:Tornado吧。
啥是Tornado
Tornado就是龙卷风,哦不,这里说的Tornado是一种 Web 服务器软件的开源版本。Tornado 和现在的主流 Web 服务器框架(包括大多数 Python 的框架)有着明显的区别:它是非阻塞式服务器,而且速度相当快。
Tornado需要用Python编写,所以,这一系列下来,我们都是用的Python来搞事情,就和我之前说的,Python这个语言,最适合搞事情了!
这里要说一点,Web框架有很多种,不同语言有不同的框架,而且特点都不一样,就Ptyhon而言,用Python开发的Web框架也有好几种,Django,Flask,Tornado,这些框架,也是各有各的特点。所以,我想说的是,至于要用那种框架,请结合你自身的需求来选择。不要盲目的抓起一个随便用,这样将来会坑了自己。我们这里,就是小型服务,自娱自乐用,所以,没有那么多顾虑,随便抓起来一个用就OK,这不,我抓的就Tornado。
把Tornado搞到服务器上
首先,服务器或者你本地的机器上面,应该是有Python的,推荐Python3,然后,你的机器应该是有pip的。
我们需要通过pip来安装Tornado
# pip install tornado
安装完成,如果想测试是否安装功,只需要进入Python,然后输入import tornado,如果没有报错,就说明安装成功。
接着,我们来搞一下本地的配置。
本地,我推荐使用PyCharm来做IDE。这个IDE功能还算可以,如果你已经有自己习惯的IDE,可以略过此处。
PyCharm官网上有两个可下载的版本:
PyCharm官网的两个版本推荐下载第一个,Professional,这个版本功能很强大,而且支持很多Web框架的插件。
但是好多人会发现,这个是收费版本的啊,那怎么用?
别急,破解方法非常简单,第一次打开PyCharm的时候,选择License server激活,然后填入:http://im.js.cn:8888
或 http://idea.java.sx/
或http://xidea.online
,然后点Activate激活即可。
接着,我们需要将本地的代码和服务端的代码要同步起来,做好映射,设置的步骤也很简单。这里,我们假设远端的服务器地址是39.11.12.123
。
在Tools -> Deployment -> Configuration
里面:
点击左上角的 +
号:
出来的对话框里,名字随便写,但是下面的要选择SFTP
。
接着,下面这张图,第一个红框里面填写远程服务器的ip地址:39.11.12.123,第二个填写你服务器上的登录账户名称,一般是root,第三个就是密码。
Deployment接着第二页,Mapping里面,第二个红框里面,填写你本机的工程目录地址,第三个红框填写在服务器上的工程目录地址(提前建好)。
Mappings然后点击OK。接着,在Tools -> Deployment -> Automatic Upload
点击打钩,这样每次编写完一个文件,代码就可以自动同步到服务器上了。
每次如果需要同步的话,可以在Tools -> Deployment
菜单里面,选择Upload to XXXX
就行,或者在需要上传的文件图标点击右键,在Deployment
里面选择就可以。很方便。上传成功的样子大概就是这样:
好了,我们接下来就要尝试着编写我们的代码了。但是,对于第一次接触新框架的你,我们还是先看一下Tornad的“Hello World”怎么写吧。
import tornado.ioloop
import tornado.web
class MainHandler(tornado.web.RequestHandler):
def get(self): # 3
self.write("Hello, world") # 4
def make_app():
return tornado.web.Application([
(r"/", MainHandler), # 2
])
if __name__ == "__main__":
app = make_app() # 1
app.listen(8888)
tornado.ioloop.IOLoop.current().start()
在这个里面,最关键的,有这么几个地方:
- make_app()声明一个tornado的application,里面就规定了服务器接收处理的url路径。
- 服务器接收了url,将会把请求交给MainHandler()来做处理。
- MainHandler中的get方法,是用来处理HTTP GET请求的。
- 返回结果,只返回了一个字符串。
OK,上面简单的分析,就是Tornado处理一个网络请求的逻辑。捋顺这个逻辑之后,我们接下来就开始简单的编写一下我们自己的服务端代码吧。
撸码时刻
明确一下我们的两个目的:
- 我们的网站能够访问数据库并且显示在网页上
- 我们的网站能够做到给App提供数据接口功能,返回Json格式的数据。
好的,下面我们就起来撸代码,不对,是撸起来代码。
遵循我们上面所说的,定义url路径,然后写Handler。所以,我就先按照这个思路,把工程目录按照这个样子建立了一下:
目录结构然后,我们在main.py
这个文件里面编写代码如下:
class Application(tornado.web.Application):
def __init__(self):
handlers = [
(r"/web/", WebHandle),
(r"/json/", JsonHandle),
]
# 定义tornado服务器的配置项,如static/templates目录位置,debug级别等
settings = dict(
debug=True,
static_path=os.path.join(os.path.dirname(__file__), "static"),
template_path=os.path.join(os.path.dirname(__file__), "templates")
)
tornado.web.Application.__init__(self, handlers, **settings)
if __name__ == "__main__":
print("Tornado server is ready for service\r")
Application().listen(8000, xheaders=True)
tornado.ioloop.IOLoop.current().start()
这里简单做一下解释:
我们定义两个Handler,一个是返回网页版本的Handler,另一个是返回Json版本的;我们的Application的写法也和Hellow world例子
中写的不一样,我们这样写,可以自定义很多设置,比如路径,是否Debug模式之类的。
那么我们接下来看看连个Handler怎么写的:
# views.json
class JsonHandle(tornado.web.RequestHandler):
def get(self, *args, **kwargs):
self.write("json view")
# views.web
class WebHandle(tornado.web.RequestHandler):
def get(self, *args, **kwargs):
self.write("web view")
这里是两个及其简单的实现,我们来看一下效果:
JSON Web下面这个是访问错误的url出现的页面,因为我们开了Debug模式,所以页面长这个样子:
404404页面的问题我们之后会说到。
到这里位置,我们有一个地方不知道大家发现没有,十分的不灵活,就是上面url匹配的地方。这里指定了:http://xxxxxx/json/
只能用JsonHandler来处理,但是如果来了http://xxxxxx/json/XX
,他就会报错,页面未找到。处理这样的请求,让我们的服务变得更加强大,更加健壮,我们决定,新加一个url_router,在一定程度上,用它来控制我们的url匹配。
"""
url_router.py
"""
def include(module):
res = import_module(module)
urls = getattr(res, 'urls', res)
return urls
def url_wrapper(urls):
wrapper_list = []
for url in urls:
path, handles = url
if isinstance(handles, (tuple, list)):
for handle in handles:
pattern, handle_class = handle
wrap = ('{0}{1}'.format(path, pattern), handle_class)
wrapper_list.append(wrap)
else:
wrapper_list.append((path, handles))
return wrapper_list
有了router,我们的main文件和handler文件都应该修改一下,在views.json和views.web目录下,分别建立json_urls.py
和web_urls.py
:
"""
main.py
"""
class Application(tornado.web.Application):
def __init__(self):
# >>>> 不一样的地方开始
handlers = url_wrapper([
(r"/json/", include('views.json.json_urls')),
(r"/web/", include('views.web.web_urls')),
])
# 不一样的地方结束 <<<<
# 定义tornado服务器的配置项,如static/templates目录位置,debug级别等
"""
json_urls.py
"""
urls=[
(r'', JsonHandle)
]
"""
web_urls.py
"""
urls = [
(r"", WebHandle)
]
这样写,虽然看上去比较乱一些,但是相当灵活。能够使我们的url变得丰富。比如,如果我想添加一个查看全部json文件的url,那么我只需要在json_urls
里面,添加一个(r'/all', GetAllHandler)
即可,然后在json_view.py
里面实现GetAllHandler
就可以了。这样做完,我们的服务器就可以同时处理http://xxxxxx/json/
和http://xxxxxx/json/all
两个url了,而且是不同的handler处理。
此时此刻,我们大概的框架基本搭建完成。下面就来主要实现一下handler里面的功能吧。
因为我们要实现的是从数据库里面读取了数据在显示到网页上,所以,这里我们用到了PyMongo这个库。这个库是Python专门用来操作MongoDB的,炒鸡简单好用。
我们先来完成Json部分。
Json格式的返回实现
我们要在JsonHandler中,实现get()方法。这里,我们首先从数据库中读取出来数据,然后,得将数据转换成dict()格式,因为PyMongo读取出来的数据,不能够直接转成Json,因为里面有个叫Object_id的东西,所以,这里我们就手动转一下。然后,把数据用self.write(json.dumps({"data": {"block": return_data, "curTime": cur_time}}))
的形式返回回去就好。结构相当简单,大致代码如下:
class JsonHandle(tornado.web.RequestHandler):
def get(self):
# 从数据库中读取数据
self.client = pymongo.MongoClient("mongodb://39.11.12.123/", 27017)
self.db = self.client["DailyProject"]
self.table = self.db["table"]
result = self.table.find()
# 得到当前时间
time = datetime.datetime.now()
cur_time = str(time.year) + "-" + str(time.month) + "-" + str(time.day)
# 筛选出合适的数据
temp_posts = []
posts = []
for item in result:
temp_posts.append(item)
temp_posts.sort(key=lambda k: (k['post_time'][-5:]), reverse=True)
for item in temp_posts:
if item['post_day_time'] == cur_time:
posts.append(item)
# 将数据转换成dict()类型,方便转换成Json
return_data = []
for item in posts:
temp_dic = {'postId': item['post_id'], 'postTitle': item['post_title'],
'postPartUrl': item['post_part_url']}
return_data.append(temp_dic)
# 返回Json格式的数据
self.write(json.dumps({"data": {"block": return_data, "curTime": cur_tim
下面是效果:
[图片上传失败...(image-b81365-1549906571539)]
JSON这样,实现起来是不是超级酷。这里是实现了get方法,你也可以实现post方法来处理HTTP POST请求。具体的逻辑还是要根据你具体的业务来编写。反正最后用json.dumps返回就可以了。
小技巧:如果你返回的json格式都差不多,可以抽离出来,写一个模板,以后返回结果直接将数据传给模板就好。不需要在每个方法都写一遍json的格式,那样如果修改起来,会很费事儿。
Web格式的返回实现
Web返回结果,我们这里就用到了html的东西。首先,我们得在template
里面建一个index.html
文件。然后,在WebHandler中,最后返回结果写成:self.render("index.html", info=posts, today=cur_time)
这样就可以了。这里简单说一下,第一个参数,是你template里面对应的html文件。第二个参数和第三个参数,是你需要传给前端的数据。名字随便叫,但是要和html里面保持一致。
Handler的代码大致如下:
class WebHandle(tornado.web.RequestHandler):
def get(self):
self.client = pymongo.MongoClient("mongodb://39.11.12.123/", 27017)
self.db = self.client["DailyProject"]
self.table = self.db["table"]
result = self.table.find()
time = datetime.datetime.now()
cur_time = str(time.year) + "-" + str(time.month) + "-" + str(time.day)
temp_posts = []
posts = []
for item in result:
temp_posts.append(item)
temp_posts.sort(key=lambda k: (k['post_time'][-5:]), reverse=True)
for item in temp_posts:
if item['post_day_time'] == cur_time:
posts.append(item)
self.render("index.html", info=posts, today=cur_time)
由于名字要和前端一一对应,所以,前端的代码如下:
<body>
<h1>技术讨论 {{today}}</h1>
{% for element in info %}
<div class="post_block">
<p class="post_id">{{element['post_id']}}</p>
<a class="post_url" href="{{element['post_url']}}" data-url="{{element['post_url']}}" target="_blank">{{element['post_title']}}</a>
<p class="post_time">{{element['post_time']}}</p>
</div>
{% end %}
</body>
注意,后端传过来的today
对应的html里面的{{today}}
,info
则对应的for循环里面的info
。这种for循环,语法有点像DoT.js。别慌,这种前端的写法就那么几种,并不是很难,看懂例子怎么写,就照猫画虎的往自己的html里面写就可以。
看到了吗,就是这么简单,最后我们运行起来,效果如下:
Web404页面的处理
处理404页面,只需要在main.py
文件的url中,加入一个(r".*", BaseHandle)
,然后在BaseHandler
里面,返回一个你已经写好的404.html
就好了。炒鸡简单。
最后很关键的,怎么跑起来程序!
最后,代码写好了,我们需要把我们的程序跑起来。
首先,将你的工程部署到你的服务器上,通过前文所讲的部署方法,成功传上去文件。
然后,登录到你的服务器,进入工程指定的文件夹。
由于我们的启动程序是在main.py
里面写的,所以,这里只需要输入指令:
# sudo python main.py &
就可以让你的Tornado后台运行了!千万别忘了后面还有个&
。
如果要关闭你的运行程序,则需要输入:
# ps -ef | grep main.py
来查找你Tornado所在的进程,通过kill
指令关闭就可。
# kill -9 <进程号>
后记不是后记
看到没有,这样就可以了。一个例子虽然很简单,但是这里可以扩展的地方有很多。很多同学肯定苦恼于不知道该怎么写服务端的代码,那么这篇文章所讲的东西可以很好的带你入门,并且入门还前进了一小步,因为并不是简简单单的只给你写hello world。
前面还提到了可以用Tornado来定时执行任务,这个东西我就不再这里说了,如果想更多交流的话,请关注『皮爷撸码』,点击下方的『进群交流』,来一起在群里讨论。
这些所讲的内容的代码,我也给大家共享出来,同样是关注『皮爷撸吗』,回复『代码』,即可获得下载地址。
最后给大家吐槽一句,爬虫的文章,你们看一篇就够了,因为爬虫这个东西,真的不是啥真金白银的技术活,这个东西,根本体现不出来你的技术,说白了就是个工具。没啥技术含量。那些爬来爬去爬美女爬帅哥的文章代码,我估计你写了运行一遍就完事儿了,根本不会再次运行它。因为它给你爬的数据没用啊。根本不像我之前的爬虫,我的爬虫,我把思路给大家讲好,而且,我的爬虫是实实在在的在服务端运行的。爬虫就是为提供数据,并不是什么高深的技术,而且工作岗位,爬虫都是现成的,根本轮不到你写。
这么硬货的公众号,你们不关注一下啊?
底部二维码.png
网友评论