Python 函数式编程入门教程 - 后端 - 掘金
本文为作者原创,转载请先与作者联系。同发于博客园和 SegmentFault专栏 Functional Programming 引言 Functional Programming(函数式编程)的概念最早起源于LISP,由约翰·麦卡锡在1958年创立,最早...
Python 并发编程之协程 / 异步 IO - 后端 - 掘金
引言 随着node.js的盛行,相信大家今年多多少少都听到了异步编程这个概念。Python社区虽然对于异步编程的支持相比其他语言稍显迟缓,但是也在Python3.4中加入了asyncio,在Python3.5上又...
用 Python 写有趣的脚本(上) - 后端 - 掘金
用Python写有趣的脚本(下) 00. 前言 这个项目是我在半年前开始的,当时的计划是每周抽一点工作外的空余时间来写一个python程序(工作不用Python),结果持续不到一个月就弃坑了......
Python 正则表达式 re 模块简明笔记 - 后端 - 掘金
简介 正则表达式(regular expression)是可以匹配文本片段的模式。最简单的正则表达式就是普通字符串,可以匹配其自身。比如,正则表达式 ‘hello’ 可以匹配字符串 ‘hello’。 要注意的是,正则表达式并不是一个程序,而是用于处理字符串的一...
Python 开发的高级技巧 - 后端 - 掘金
本文我列出几个Python高级技巧:写Python代码的时候经常将一系列操作放在一个语句块中,Python 2.5加入了with语法,实现上下文管理功能,这让代码的可读性更强并且错误更少。最常见的例子就是open,如果不使用with,使用open会是这样:如果...
Python 开发微信公众号后台(系列一) - 后端 - 掘金
段晓晨,写过一点爬虫,写过几篇文章。能力虽有限,会尽量把想说的东西讲清楚。知乎ID:段小草知乎专栏:小段同学的杂记,https://zhuanlan.zhihu.com/666666❈——通过这一系列的文章,我们来介绍一下如何用Python开发微信公众号的后台...
理解 Python 并发编程一篇就够了 | PoolExecutor 篇 - 后端 - 掘金
之前我们使用多线程(threading)和多进程(multiprocessing)完成常规的需求,在启动的时候start、jon等步骤不能省,复杂的需要还要用1-2个队列。随着需求越来越复杂,如果没有良好的设计和抽象这部分的功能层次,代码量越多调试的难度就越大...
使用 Python 进行并发编程 - asyncio 篇 (二) - 后端 - 掘金
我们今天继续深入学习asyncio。同步机制asyncio模块包含多种同步机制,每个原语的解释可以看线程篇,这些原语的用法上和线程/进程有一些区别。Semaphore(信号量)并发的去爬取显然可以让爬虫工作显得更有效率,但是我们应该把抓取做的无害,这样既可以保...
Python 黑魔法之协程 / 异步 IO - 后端 - 掘金
本文为作者原创,转载请先与作者联系。 首发于我的博客 协程与异步IO 引言 随着node.js的盛行,相信大家今年多多少少都听到了异步编程这个概念。Python社区虽然对于异步编程的支持相比其他语言稍显迟缓,但是也在Python3.4中加入了asynci...
Python 笔记 - 从迭代器、生成器到协程(一) - 后端 - 掘金
最近看了一篇老的教程,结合最近开始使用的python3,简单介绍一下python中协程的用法,本文中实例的代码都是在python3.5中可以运行的。 协程的内容受以下教程的启发较大: ...
Python 的学习阶段 - 后端 - 掘金
学习基础知识——变量、数据结构、语法; 实践你在 Codecademy 之类的网站上所学到的知识; 参加课程——计算机导论和 Python 编程; 熟悉 Pytho...
分享一些书籍,方方面面,很多值得一读 - 掘金
编程书很多,各式各样的,有的书讲实战,有的书讲内功,主要分享一些自己收集且提升编程内功的书籍。 先介绍老本行的书 初级入门 《JavaScript高级程序设计》 JavaScript圣经之一 进阶书籍 《JavaScript权威指南》 JavaScript圣...
fluent python 读书笔记 1 - 掘金
学习python一段时间会发现,一直都是用python做业务逻辑。每次都是为了解决问题,而解决问题。而python中丰富的库会让我们欣喜,但是也可能让我们变懒,真正对python的理解却没有增加多少。而fluent python是进阶python非常好的一本书...
2 道极好的 Python 算法题 | 带你透彻理解装饰器的妙用 - 后端 - 掘金
前一篇讲了装饰器额基本知识,装饰器我个人认为是Python中最最最难的知识点,上一篇算是一个入门的介绍,有18个小伙伴给我留言,后台也有很多同学跟我讨论,大家总是觉得不过瘾,好像离深入理解还差那么一丢丢赶脚,装饰器到底有啥妙用呢,其实装饰器内容非常丰富,今天我...
Python爬虫之模拟知乎登录 - 掘金
经常写爬虫的都知道,有些页面在登录之前是被禁止抓取的,比如知乎的话题页面就要求用户登录才能访问,而 “登录” 离不开 HTTP 中的 Cookie 技术。 登录原理 Cookie 的原理非常简单,因为 HTTP 是一种无状态的协议,因此为了在无状态的 HTTP...
Python 篇 - 微信公众号历史文章信息爬虫 - 后端 - 掘金
请输入标题 bcdef ...
用 Django 实现一个更实用的博客系统,让写作更简单,更愉快。 - 掘金
July 用Django实现一个更实用的博客系统,让写作更简单,更愉快。 Demo 博客相关页面 博客首页 home 博文详情 article 后台管理相关页面 后台首页 admin 添加文章 add-article 文章列表 artic...
Tornado框架01-入门总概 - 掘金
我们首先来谈谈web框架. web框架的本质其实就是socket服务端再加上业务逻辑处理, 比如像是Tornado这样的框架. 有一些框架则只包含业务逻辑处理, 例如Django, bottle, flask这些框架, 它们的使用需要依赖包含socket的第三...
flask 源码解析:会话(session) - 后端 - 掘金
session 可以看做是在不同的请求之间保存数据的方法,因为 HTTP 是无状态的协议,但是在业务应用上我们希望知道不同请求是否是同一个人发起的。比如购物网站在用户点击进入购物车的时候,服务器需要知道是哪个用户执行了这个操作。 在 flask 中使用 se...
只需十四步:从零开始掌握 Python 机器学习(附资源) - 后端 - 掘金
Python 可以说是现在最流行的机器学习语言,而且你也能在网上找到大量的资源。你现在也在考虑从 Python 入门机器学习吗?本教程或许能帮你成功上手,从 0 到 1 掌握 Python 机器学习,至于后面再从 1 到 100 变成机器学习专家,就要看你自己...
Python 资源大全中文版 - 后端 - 掘金
Python 资源大全中文版 我想很多程序员应该记得 GitHub 上有一个 Awesome - XXX 系列的资源整理。awesome-python 是 vinta 发起维护的 Python 资源列表,内容包括:Web框架、网络爬虫、网络内容提取、模...
10 行 Python 代码实现词云 - 阅读 - 掘金
什么是词云呢? 词云又叫文字云,是对文本数据中出现频率较高的“关键词”在视觉上的突出呈现,形成关键词的渲染形成类似云一样的彩色图片,从而一眼就可以领略文本数据的主要表达意思。 现在,可以从网络上找到各种各样的词云,下面一图来自沈浩老师的微博: 从...
Python 高级编程:完全理解生成器 - 掘金
生成器是 Python 初级开发者最难理解的概念之一,虽被认为是 Python 编程中的高级技能,但在各种项目中可以随处见到生成器的身影,你得不得去理解它、使用它、甚至爱上它。 提到生成器,总不可避免地要把迭代器拉出来对比着讲,生成器就是一个在行为上和迭代器非...
乱谈 Python 并发 - 后端 - 掘金
乱谈Python并发 说实话,我一直觉得PHP真的是最好的语言,不仅养活了一大批PHP程序员,同时还为安全人员提供了大量的就业机会。然而,令人唏嘘的是,安全界很多人其实是吃着Python的饭,操着PHP的心。此外,大量的安全研究工具也都是使用Python开发,...
用 Python 实现微信自动回复信息以及防撤回 - 阅读 - 掘金
今天偶尔看到一个有趣的python库--itchat,一个封装的微信API,可以实现微信自动回复,附件下载,发送文件等功能,同时也可以通过手机发送信息,python执行相应的命令操作电脑。 目前只实现了微信消息自动回复以及防撤回功能。感谢大家意见,防撤回功能在...
Python 爬虫库 - Beautiful Soup 的使用 - 后端 - 掘金
Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库,简单来说,它能将HTML的标签文件解析成树形结构,然后方便地获取到指定标签的对应属性。 如在上一篇文章通过爬虫爬取漫画图片,获取信息纯粹用正则表达式进行处理,这种方式即复...
Python 爬虫 - 用 Scrapy 框架实现漫画的爬取 - 后端 - 掘金
在之前一篇抓取漫画图片的文章里,通过实现一个简单的Python程序,遍历所有漫画的url,对请求所返回的html源码进行正则表达式分析,来提取到需要的数据。 本篇文章,通过 scrapy 框架来实现相同的功能。scrapy 是一个为了爬取网站数据,提取结构性数...
500 行 Python 代码构建一个轻量级爬虫框架 - 后端 - 掘金
引言 玩 Python 爬虫有段时间了,但是目前还是处于入门级别。xcrawler 则是利用周末时间构建的一个轻量级的爬虫框架,其中一些设计思想借鉴了著名的爬虫框架 Scrapy 。既然已经有像 Scrapy 这样优秀的爬虫框架...
Python 数据分析: 赶集网北京各城区二手物品发帖量 - 后端 - 掘金
运用python将前一节爬取的赶集网数据进行分析了解北京城区二手物品发帖量 效果是这样的: 图表展示 ...
用 Python 编写一个本地论文管理器(paper_manager) - 后端 - 掘金
- 介绍和引入 最近初学NLP相关的深度学习,下了很多论文,数量一多,发现论文管理是个问题。首先论文数目一多,必须要按类别放到子文件夹下。但是某一篇论文,往往有多个主题。比如说某论文使用word2vec给短文本分类,那这篇论文...
超详细的 Python 实现新浪微博模拟登陆 - 后端 - 掘金
最近由于需要一直在研究微博的爬虫,第一步便是模拟登陆,从开始摸索到走通模拟登陆这条路其实还是挺艰难的,需要一定的经验,为了让朋友们以后少走点弯路,这里我把我的分析过程和代码都附上来。 首先,我们先用正常的账号登陆,具体看会有些什...
python 爬取落网音乐 - 前端 - 掘金
任务 爬取“落网音乐”下载至本地(源码自己敲) ...
用 Python 实现每秒处理 120 万次 HTTP 请求 - 后端 - 掘金
原文链接 用 Python 做到每秒处理上百万次 HTTP 请求,可能吗?也许不能,但直到最近,这已成为现实。 很多公司都在为了提升程序的执行性能和降低服务器的运营成本,而放弃 Python 去选择其它编程语言,其实这样做并不是必须,因为 Python 完全可...
Python - 对于元祖和字典的认识 - 后端 - 掘金
本篇是一篇随手笔记,记录了对于Python的数据类型中元祖(Tuple)和字典(Dict)的一些认识,以及部分内置方法的介绍。 元祖 Tuple 特点:元祖内...
线程、进程与协程 - 掘金
众所周知, 计算机是由软件和硬件组成. 硬件中的CPU主要用于解释指令和处理数据, 软件中的操作系统负责资源的管理和分配以及任务的调度. 而程序则是运行在操作系统上具有特定功能的软件. 每当程序执行完成特定功能的时候, 为了保证程序的独立运行不受影响往往需要进...
Python 爬虫:把廖雪峰的教程转换成 PDF 电子书 - 掘金
写爬虫似乎没有比用 Python 更合适了,Python 社区提供的爬虫工具多得让你眼花缭乱,各种拿来就可以直接用的 library 分分钟就可以写出一个爬虫出来,今天就琢磨着写一个爬虫,将廖雪峰的 Python 教程 爬下来做成 PDF 电子书方便大家离线阅...
Python3 Buffered I/O 浅析 - 后端 - 掘金
f = open("apache.log", "r+") print(f.tell()) f.read(1) print(f.tell()) f.write("Love") f.close() 控制太输出的结果是0,1文件操作后的结果是 Hello World...
(译) 用 Python 实现每秒百万级的请求 - 后端 - 掘金
原文地址:A million requests per second with Python 原文作者:Paweł Piotr Przeradowski ...
Python 分布式动态页面爬虫研究 - 后端 - 掘金
Selenium的Webdriver爬取动态网页效果虽然不错,但效率方面并不如人意。最近一直研究如何提高动态页面爬虫的效率,方法无非高并发和分布式两种。过程中有很多收获,也踩了不少坑,在此一并做个总结。以下大致是这段时间的学习路线。 ...
使用 Python 爬一爬网易云音乐上那些评论火爆的歌曲 - 后端 - 掘金
网易云音乐这款音乐APP本人比较喜欢,用户量也比较大,而网易云音乐之所以用户众多和它的歌曲评论功能密不可分,很多歌曲的评论非常有意思,其中也不乏很多感人的评论。但是,网易云音乐并没有提供热评排行榜和按评论排序的功能,没关系,本文就使用爬虫给大家爬一爬网易云音乐...
Python 正则表达式学习 - 后端 - 掘金
正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。 Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式。 re 模块使 Python 语言拥有全部的正则表达式功能。 compile 函数根据一个...
Python 篇 - 微信公众号历史文章信息爬虫 - 后端 - 掘金
请输入标题 bcdef ...
Python 爬虫—破解 JS 加密的 Cookie - 后端 - 掘金
前言 在GitHub上维护了一个代理池的项目,代理来源是抓取一些免费的代理发布网站。上午有个小哥告诉我说有个代理抓取接口不能用了,返回状态521。抱着帮人解决问题的心态去跑了一遍代码。发现果真是这样。 通过Fiddler抓包比较,基本可以确定是Java...
Python 高手都知道的内置函数,你不知道就 low 了 - 后端 - 掘金
python内置了一些非常巧妙而且强大的内置函数,对初学者来说,一般不怎么用到,我也是用了一段时间python之后才发现,哇还有这么好的函数,这个函数都是经典的而且经过严格测试的,可以一下子省了你原来很多事情,代码不仅简洁易读了很多,而且不用自己去闭门造车.既...
用 Django 实现一个更实用的博客系统,让写作更简单,更愉快。 - 掘金
July 用Django实现一个更实用的博客系统,让写作更简单,更愉快。 Demo 博客相关页面 博客首页 home 博文详情 article 后台管理相关页面 后台首页 admin 添加文章 add-article 文章列表 artic...
80行代码搞定某电影网站所有的下载资源 - 掘金
最近在学习python爬虫,就尝试着写了一个脚本去抓取某电影网站的ftp下载地址,下面是代码: from multiprocessing import Process,Manager import requests from bs4 import Beaut...
Python 线程进阶篇 | 多线程下载网页 - 后端 - 掘金
Python的并发编程前面只讲了进程和线程的入门篇,线程里面还有很多有用而好玩的招式,我们还没有讲,我一直主张学一门语言一定要有兴趣,带着玩Python的心态去学,会轻松很多,打个比方打扫卫生和打羽毛球,可能都很累,为啥你打球就很high,而在家打扫卫生就很累...
一篇了解爬虫技术方方面面 - 后端 - 掘金
本文全面的介绍了爬虫的原理、技术现状、以及目前仍面临的问题。如果你没接触过爬虫,本文很适合你,如果你是一名资深的虫师,那么文末的彩蛋你可能感兴趣。 原文链接:http://www.jianshu...
如何一小时爬取百万知乎用户信息,并做简单的可视化分析? - 后端 - 掘金
一、使用的技术栈: 爬虫:python27 +requests+json+bs4+time 分析工具: ELK套件 ...
Python 多进程并行编程实践 - 后端 - 掘金
这篇文章简单介绍在 Python 环境下使用 MPI 接口在集群上进行多进程并行计算的方法。...
爬虫代理小记与 aiohttp 代理尝试 - 后端 - 掘金
总结了一些爬虫代理的资料和知识,并尝试使用asyncio和aiohttp使用代理ip访问目标网站,按代理IP的访问效果实时更新代理IP得分,初始获取3000左右代理IP,在稳定后,对摩拜单车信息的访问可以达到40次/秒-100次/秒。 ...
Python 装饰器记录总结 (终极版) - 后端 - 掘金
装饰器是一个函数,一个用来包装函数的函数,装饰器在函数申明(不需要调用)完成的时候被调用,调用之后返回一个修改之后的函数对象,将其重新赋值原来的标识符,并永久丧失对原始函数对象的访问。对某个方法应用了装饰方法后, 其实就改变了被装饰函数名称所引用的函数代码块入...
如何一小时爬取百万知乎用户信息,并做了简单的分析 - 后端 - 掘金
一、使用的技术栈: 爬虫:python27 +requests+json+bs4+time ...
爬虫入门系列(一):快速理解 HTTP 协议 - 后端 - 掘金
4月份给自己挖一个爬虫系列的坑,主要涉及HTTP 协议、正则表达式、爬虫框架 Scrapy、消息队列、数据库等内容。 爬虫的基本原理是模拟浏览器进行 HTTP 请求,理解 HTTP 协议是写爬虫...
用 Python 写个迷你出门问问 | 10 几行代码搞定 - 后端 - 掘金
上一篇讲了JSON文件的用法,小伙伴们感觉好像写的很不过瘾,后台有好几个小伙伴问我能不能再写一篇,其中还有两个小伙伴给我留言,问我什么是Web Api,好今天我会解释一下,同时利用百度开放的API写一个简单的出门问问,算是进一步趣味学JSON文件. ...
一个更优雅的知乎 API 基于 Python3 - 后端 - 掘金
项目简介 Zhihu API For Humans Based on Python3 前置条件 Python3.x Requests2 BeautifulSoup4 ...
Python 爬虫,看看我最近博客都写了啥,带你制作高逼格的数据聚合云图 - 后端 - 掘金
转载请标明出处: http://blog.csdn.net/forezp/article/details/70198541 本文出自方志朋的博客 ...
Python 正则表达式 re 模块简明笔记 - 后端 - 掘金
欢迎加入Python 学习交流群:535993938 禁止闲聊 ! 名额有限 ! 非喜勿进 ! ...
Python 爬虫系列(一)初期学习爬虫的拾遗与总结 - 后端 - 掘金
最近,为了提取裁判文书网的有关信息,自己迈入Python的学习之路,写了快两周的代码,自己写这篇文章总结下踩过的坑,还有遇到一些好的资料和博客等总结下(站在巨人肩膀上,减少重复工作),以便自己后期复习和参考和、分享给大家交流学习,也欢迎大家补充些精彩内容。 ...
爬虫入门系列(三):用 requests 构建知乎 API - 掘金
在爬虫系列文章 优雅的HTTP库requests 中介绍了 requests 的使用方式,这一次我们用 requests 构建一个知乎 API,功能包括:私信发送、文章点赞、用户关注等,因为任何涉及用户操作的功能都需要登录后才操作,所以在阅读这篇文章前建议先了...
技术分享 | 乱谈 Python 并发 - 后端 - 掘金
乱谈Python并发说实话,我一直觉得PHP真的是最好的语言,不仅养活了一大批PHP程序员,同时还为安全人员提供了大量的就业机会。然而,令人唏嘘的是,安全界很多人其实是吃着Python的饭,操着PHP的心。此外,大量的安全研究工具也都是使用Python开发,比...
2 道极好的 Python 算法题 | 带你透彻理解装饰器的妙用 - 后端 - 掘金
前一篇讲了装饰器额基本知识,装饰器我个人认为是Python中最最最难的知识点,上一篇算是一个入门的介绍,有18个小伙伴给我留言,后台也有很多同学跟我讨论,大家总是觉得不过瘾,好像离深入理解还差那么一丢丢赶脚,装饰器到底有啥妙用呢,其实装饰器内容非常丰富,今天我...
Python 3.6 新特性官方文档中文版 - 后端 - 掘金
原文:What’s New In Python 3.6翻译团队: Py字幕组首发刊物: PyCN技术评论Github: PyCN/PTR 由阿橙(@sinoandywong)召集,Ele(@ictar)、苍冥(@east...
Python 并发编程之线程池 / 进程池 - 后端 - 掘金
本文为作者原创,转载请先与作者联系。 同发于SegmentFault和简书 引言 Python标准库为我们提供了threading和multiprocessing模块...
随机森林算法入门 (Python) - 后端 - 掘金
翻译自:http://blog.yhat.com/posts/python-random-forest.html 昨天收到yhat推送了一篇介绍随机森林算法的邮件,感觉作为介绍和入门不错,就顺手把它翻译一下。 目录 1 什么是随机森林 1.1 集成学习 1...
Python 做图的方法 - 后端 - 掘金
最近一直没有更新文章,在学习Machine learning。然后业余在kaggle那里瞎转,对Python常用的作图摸了个遍,本文将对这些作图方法做个简单介绍 一般我们作图主要是为了看数据分布、数据趋势、以及比较大小。常用的图...
Python 函数的艺术:局部状态与 nonlocal 语句 - 后端 - 掘金
来源:2.4 Mutable Data 译者:飞龙 协议:CC BY-NC-SA 4.0 ...
Python 序列:概念、实现与接口约定 - 后端 - 掘金
来源:2.3 Sequences 译者:飞龙 协议:CC BY-NC-SA 4.0 ...
Python 函数的艺术:层级与调度 - 后端 - 掘金
来源:2.2 Data Abstraction 译者:飞龙 协议:CC BY-NC-SA 4.0 ...
Python 函数的艺术:高阶函数 - 后端 - 掘金
来源:1.6 Higher-Order Functions 译者:飞龙 协议:CC BY-NC-SA 4.0 ...
Python 并发编程:锁、信号量和条件变量 - 后端 - 掘金
4.1 引言 目前为止,我们专注于如何创建、解释和执行程序。在第一章中,我们学会使用函数作为组合和抽象的手段。第二章展示了如何使用数据结构和对象来表示和操作数据,以及向我们介绍了数据抽象的概念。在第三章中,我们学到了计算机程序如何解释和执行。结果是,我们理解...
Python 的序列和协程 - 后端 - 掘金
来源:Chapter 5: Sequences and Coroutines 译者:飞龙 协议:CC BY-NC-SA 4.0 5.1 引言 在这一章中,我们通过开发新的工具来处理有序数据,继续讨论真实世界中的应用。在第二张中,我们介绍了序列接口,在...
Python 并发编程之线程池 / 进程池 - 后端 - 掘金
本文为作者原创,转载请先与作者联系。 首发于我的博客 线程池/进程池 ...
基于 Python 的缓冲区分析 - 后端 - 掘金
(欢迎转载,需要保留文末的个人微信公众号二维码) 前段时间有朋友问破解后的ArcGIS做缓冲区时总是失败,想到Python做缓冲区分析应该并不复杂,之前就看到过Shapely这个工具在GIS分析方面的例子,所以查下相关资料,写一...
Python 优化第一步: 性能分析实践 - 后端 - 掘金
前言 We should forget about small efficiencies, say about 97% of the time: premature optimization is the root of all ev...
用 Python 编写一个本地论文管理器(paper_manager) - 后端 - 掘金
- 介绍和引入 最近初学NLP相关的深度学习,下了很多论文,数量一多,发现论文管理是个问题。首先论文数目一多,必须要按类别放到子文件夹下。但是某一篇论文,往往有多个主题。比如说某论文使用word2vec给短文本分类,那这篇论文...
大数据全栈式开发语言 – Python - 阅读 - 掘金
前段时间,ThoughtWorks在深圳举办一次社区活动上,有一个演讲主题叫做“Fullstack JavaScript”,是关于用JavaScript进行前端、服务器端,甚至数据库(MongoDB)开发,一个Web应用开发人员,只需要学会一门语言,就可以实现...
Mysql 与 Pymysql - 掘金
这次介绍mysql以及在python中如何用pymysql操作数据库, 以及在mysql中存储过程, 触发器以及事务的实现, 对应到pymysql中应该如何操作. 首先我们在cmd窗口中展示常见的sql命令: 连接数据库 mysql -u root -p...
代码这样写更优雅 (Python 版) - 掘金
Python 这门语言最大的优点之一就是语法简洁,好的代码就像伪代码一样,干净、整洁、一目了然。但有时候我们写代码,特别是 Python 初学者,往往还是按照其它语言的思维习惯来写,那样的写法不仅运行速度慢,代码读起来也费尽,给人一种拖泥带水的感觉,过段时间连...
Python 正则表达式之二: 捕获 - 后端 - 掘金
在这一篇文章里,我将总结一下正则表达式关于捕获的用法。 捕获 捕获和分组在正则表达式中有着密切的联系,一般情况下,分组即捕获,都...
Python 多线程入门指南 - 后端 - 掘金
一直懒得写Python相关的文章,恰好有天需要简单的给童鞋们讲点课,仓促之余就诞生了此文. 今天本来准备全面的聊聊有关高性能并发这个话题来着,但是周末马上要来了啊.所以我就取了其中的一点来介绍,关于其他的...
Python 多进程并行编程实践:以 multiprocessing 模块为例 - 后端 - 掘金
專 欄 ...
Python 类型检查 - 后端 - 掘金
众所周知, Python 是一门强类型、动态类型检查的语言。所谓动态类型,是指在定义变量时,我们无需指定变量的类型,Python 解释器会在运行时自动检查。与静态类型语言(如 C 语言)相比,这不仅仅是少写了几个类型声明字符: #include <std...
利用 Python 进行深度学习的完整入门指南 (附资源) - 后端 - 掘金
深度学习,是人工智能领域的一个突出的话题,被众人关注已经有相当长的一段时间了。它备受关注是因为在计算机视觉(Computer Vision)和游戏(Alpha GO)等领域有超越人类能力的突破 。自上一次调查 (查看调查:https:/...
Python 全栈之路系列之流程控制 - 后端 - 掘金
if if就是一个条件判断的,当满足不同样的条件的时候执行不同的操作,如法如下: if <条件一>: <条件一代码块> elif <条件二>: <条件二代码块> e...
Python 一周笔记 - 后端 - 掘金
主题 邮件处理 日志模块 pdf处理 md5 ...
怎么样用 Python 实现地理编码 - 后端 - 掘金
(本文已授权Python中文社区发布) 引言 今天看到一篇阿里云的文章天下武功,唯快不破,以物流行业为例,分析了 PostgreSQL 与 Greenplum 在地理位置信息处理,最佳路径算法,机...
Python 异步方案的持续演进之路 - 后端 - 掘金
小梁是一个忠实的电影好爱者,有一天,小梁看到豆瓣这个网站,发现了很多自己喜欢的内容,恰好小梁是个程序猿,于是心血来潮的他决定写个程序,把豆瓣Top250的电影列表给爬下来。小梁平时是个Python发烧友,做起这些事情来自然是得心应手,于是他欣喜地撸起袖子就是干...
Python 基础总结(八)(列表 List) - 后端 - 掘金
Python中的列表和字符串都是序列类型,对字符串的一些操作在列表中同样适合。 1.创建一个列表的方式: list1 = list() list2 = list([2, 3, 4]) list3 = list(["r...
Django 权限机制的实现 - 后端 - 掘金
django-permission 本文涉及的技术,已应用于我基于django 1.8+ 开发的博客系统——MayBlog,欢迎交流。 ...
Python 普通方法和 staticmethod 与 classmethod 的区别 - 后端 - 掘金
不说废话直接Show me the code,整理来源:http://stackoverflow.com/questions/136097/what-is-the-difference-between-staticmethod-and-classmethod-...
前端渲染与 SEO 优化踩坑小记 - 前端 - 掘金
目录 前言1、fragment 标签2、PhantomJS3、Prerender.io4、自己搭建后端渲染服务5、最后一点猜想总结目录前言SEO( Search Engine Optimization )搜索引擎优化在搜索引擎时代对于网站来讲意义重大。一个网站...
普通程序员如何向人工智能靠拢? - 阅读 - 掘金
相信看到这篇文章的朋友,几乎都想成为机器学习科学家。 事实上,绝大多数的付费课程,基本上都有完全免费的课程放在另一个地方。我们只是把这些信息整理好,告诉你在哪儿可以找到他们,以及通过什么样的顺序进行学习。 这样,哪怕你是还没毕业...
仅 78 行代码实现微信撤回消息查看 | Python itchat - 后端 - 掘金
前言 今天一大早奔来图书馆,想想了微信很简洁也很强大的一个工具,最近微信的新闻还是比较多的, 比如:小程序、时间轴等,这不是重点,重点是看到了一个基于python的微信开源库:itchat,玩了一天。Python曾经对我说:"时日不多,赶紧用Python"。 ...
itchat:微信个人号 Python 接口 - 后端 - 掘金
itchat是一个开源的微信个人号接口,使用python调用微信从未如此简单。 使用不到三十行的代码,你就可以完成一个能够处理所有信息的微信机器人。 当然,该api的使用远不止一个机器人,更多的功能等着你来发现,比如这些。 如今微信已经成为了个人社交的很...
机器学习入门 - 掘金
终于有时间了,前几日正式开始了我的机器学习之旅,总结下目前已掌握的知识。 机器学习 机器学习本质是一项监督分类/回归问题,"监督"表示你有许多样本,假设你知道这些样本的正确答案,我们不断地把样本交给机器,并告诉机器这些样本是正确或错误的,...
python2.7 中复制数据模型 (可变与不可变模型) 的几个坑 - 后端 - 掘金
python2.7中对于不同的数据模型对于不同的复制方式会出现不一样的结果,平时工作中遇到很多坑,总结如下。 python的复制问题 ...
一个很不错的爬虫管理工具 - 前端 - 掘金
A scalable admin ui for spider service Features ...
用 python 对人们使用自行车情况分析与预测 - 后端 - 掘金
数据挖掘入门与实战 公众号: datadw 这篇博客中,主要用到了pandas的数据清洗和分析工作,同时也用到了sklearn中回归预测的知识,非常的简单,但是产生了较好的预测效果。所有的数据都是可以下载的,重复这些代码也是能够完全重现以上的这...
Python 编码为什么那么蛋疼? - 掘金
据说,每个做 Python 开发的都被字符编码的问题搞晕过,最常见的错误就是 UnicodeEncodeError、UnicodeDecodeError,你好像知道怎么解决,遗憾的是,错误又出现在其它地方,问题总是重蹈覆辙,str 到 unicode 之间的转...
Python 爬虫库 - Beautiful Soup 的使用 - 后端 - 掘金
Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库,简单来说,它能将HTML的标签文件解析成树形结构,然后方便地获取到指定标签的对应属性。 如在上一篇文章通过爬虫爬取漫画图片,获取信息纯粹用正则表达式进行处理,这种方式即复...
Python HTTP 库:requests 快速入门 - 后端 - 掘金
2013 年我接触 Python 的时候,就听闻 Python 的网络编程能力十分强大。因此,在熟悉 Python 的基本语法之后,我就和几个小伙伴一起合作,试着用 Python 的 urllib 和 urllib2 库构建了一个百度贴吧 Python 客户端...
只需两行,在你的微信上监控 Python 程序 - 工具资源 - 掘金
不知道大家有没有过这样的经历: 电脑上跑着代码,人走开了,在外面特别挂念,想知道那代码跑得怎样了… 写了个小程序,监控某个网页的变化,但没有比较实时的通知方式,邮件太重、短信又不好搞 在过去,这样的问题有时会困扰我。 不过现在,可以把警告/...
只需十四步:从零开始掌握 Python 机器学习(附资源) - 后端 - 掘金
Python 可以说是现在最流行的机器学习语言,而且你也能在网上找到大量的资源。你现在也在考虑从 Python 入门机器学习吗?本教程或许能帮你成功上手,从 0 到 1 掌握 Python 机器学习,至于后面再从 1 到 100 变成机器学习专家,就要看你自己...
gevent 程序员指南 - 后端 - 掘金
介绍 本指南假定读者有中级Python水平,但不要求有其它更多的知识,不期待读者有 并发方面的知识。本指南的目标在于给予你需要的工具来开始使用gevent,帮助你 驯服现有的并发问题,并从今开始编写异步应用程序。 贡献者 按提供贡献的时间先后顺序列出如下: S...
- 什么是装饰器 装饰器是一种修改函数和类的便捷方式,是Python提供的语法糖。它可以是我们定义的函数(函数装饰器),也可以是一个类(类装饰器)。我们可以使用装饰器快速地修改其它函数或类,而不用改变它们原本的代码,这样一来,我们就可...
代码这样写不止于优雅(Python版) - 掘金
Martin(Bob大叔)曾在《代码整洁之道》一书打趣地说:当你的代码在做 Code Review 时,审查者要是愤怒地吼道: “What the fuck is this shit?”“Dude, What the fuck!” 等言辞激烈的词语时...
Python 进程、线程、回调与协程 总结笔记 适合新手明确基本概念 - 后端 - 掘金
怎样让python在现代的机器上运行的更快,充分利用多个核心,有效地实现并行、并发一直是人们的追求方向。 GIL 谈到P...
Python 多线程入门指南 - 后端 - 掘金
一直懒得写Python相关的文章,恰好有天需要简单的给童鞋们讲点课,仓促之余就诞生了此文. 今天本来准备全面的聊聊有关高性能并发这个话题来着,但是周末马上要来了啊.所以我就取了其中的一点来介绍,关于其他的...
Python 爬虫的最佳实践 (九) - Scrapy 的 items 和 pipeline - 后端 - 掘金
不想当将军的士兵不是好士兵,同理,不想当主程的程序员不是好程序员~ 上一节我们讲了Scrapy的初步用法,我们已经学会了如何创建scrapy工程,如何编写简单的爬虫。 ...
12 行 Python 代码,自在随心应付微信拜年群发 - 阅读 - 掘金
虽然这个时间点发布这样的文章有报复社会的嫌疑。不过我想这样的小技巧应该是每位学习编程的同学逢年过节必备的。 既然发出祝福的人可以从网上复制一条段子,甚至可能是随手复制七大姑八大姨群发给TA自己的段子,然后在微信群发助手全选联系人,往里面一粘贴点击发送就...
Pandas 秘籍 - 后端 - 掘金
Pandas 秘籍 原文:Pandas Cookbook 译者:飞龙 ...
基于 Redis 的代理 ip 池设计 - 后端 - 掘金
代理 ip 因为配置简单而且廉价,经常用来作为反反爬虫的手段,但是稳定性一直是其诟病。筛选出优质的代理 ip 并不简单,即使付费购买的代理 ip 源,卖家也不敢保证 100% 可用;另外代理 ip 的生命周期也无法预知,可能上一秒能用,下一秒就扑街了。基于这些...
NumPy 快速教程及参考 - 后端 - 掘金
来源:NumPy Tutorial - TutorialsPoint 译者:飞龙 协议:CC BY-NC-SA 4.0 ...
Python NLTK 学习 5(词性标注) - 后端 - 掘金
本系列博客为学习《用Python进行自然语言处理》一书的学习笔记。 词性标注器 一个词性标注器处理一个词序列,为每个词附加一个词性标记,我们先看一个示例: import nltk words = nltk.word_tokenize('And now for ...
Python2.x 字符编码终极指南 - 后端 - 掘金
在人机交互之字符编码 一文中对字符编码进行了详细的讨论,并通过一些简单的小程序验证了我们对于字符编码的认识。但仅了解这篇文章的内容,并不能帮我们在日常编程中躲过一些字符编码相关的坑,Stackoverflow 上就有大量编码相关的问题,比如 1,2,3。 ...
Vue+Flask 轻量级前端、后端框架,如何完美同步开发 - 后端 - 掘金
导言 我们的Vue2.0应用:简读-微信公众号RSS,即将进入后端开发。 Vue+Flask作为轻量级前端、后端框架,非常...
weibo_terminater - 一个全能的微博爬虫 - 工具资源 - 掘金
weibo_terminator 微博终结者爬虫基本上准备就绪: 这次我们更新了以下功能: ...
Google 研究 | 联合学习:无需集中存储训练数据的协同机器学习 - 后端 - 掘金
联合学习:无需集中存储训练数据的协同机器学习 2017年4月18日星期二 发布人:研究员 Brendan McMahan 和 Daniel Ramage 标准的机器学习方法需要将训练数据集中到一台机器上或一个数据中心内。为了处理此数据,改善我们的服务,...
爬虫入门系列(三):用 requests 构建知乎 API - 掘金
在爬虫系列文章 优雅的HTTP库requests 中介绍了 requests 的使用方式,这一次我们用 requests 构建一个知乎 API,功能包括:私信发送、文章点赞、用户关注等,因为任何涉及用户操作的功能都需要登录后才操作,所以在阅读这篇文章前建议先了...
只需十四步:从零开始掌握 Python 机器学习(附资源) - 阅读 - 掘金
Python 可以说是现在最流行的机器学习语言,而且你也能在网上找到大量的资源。你现在也在考虑从 Python 入门机器学习吗?本教程或许能帮你成功上手,从 0 到 1 掌握 Python 机器学习,至于后面再从 1 到 100 变成机器学习专家,就要看你自己...
利用 Python scrapy 框架用 21 行代码写出一个爬虫 - 后端 - 掘金
开发环境:Pycharm 2017.1(目前最新)开发框架:Scrapy 1.3.3(目前最新) 目标 爬取线报网站,并把内容保存到items.json里 ...
[北京线下活动] QCon 全球软件开发大会 - 后端 - 掘金
QCon 是由 InfoQ 主办的全球顶级技术盛会,每年在伦敦、北京、东京、纽约、圣保罗、上海、旧金山召开。自 2007 年 3 月份首次举办以来,已经有超万名高级技术人员参加过 QCon 大会。QCon 大会源于实践并面向社区,演讲嘉宾依据热点话题,面向 5...
PornHubBot - 🔞 全球最大成人网站 PornHub 爬虫 (Scrapy、MongoDB) 一天 500w 的海量数据 - 后端 - 掘金
Disclaimer: This project is intended to study the Scrapy Spider Framework and the MongoDB database, can not be used for commercial...
PyCharm 官方推出最新入门视频教程 - 工具资源 - 掘金
最近,JetBrains公司应用于的要求,推出了一套PyCharm的短视频教程,一共9集,每集时长约4-5分钟。这套视频教程由JetBrains公司的PyCharm Developer Advocate Paul Everitt录制,重点介绍了PyCharm入...
爬虫代理小记与 aiohttp 代理尝试 - 后端 - 掘金
总结了一些爬虫代理的资料和知识,并尝试使用asyncio和aiohttp使用代理ip访问目标网站,按代理IP的访问效果实时更新代理IP得分,初始获取3000左右代理IP,在稳定后,对摩拜单车信息的访问可以达到40次/秒-100次/秒。 ...
爬虫修炼之道——从网页中提取结构化数据并保存(以爬取糗百文本板块所有糗事为例) - 后端 - 掘金
欢迎大家关注我的专题:爬虫修炼之道 上篇 爬虫修炼之道——编写一个爬取多页面的网络爬虫主要讲解了如何使用python编写一个可以下载多页面的爬虫,如何将相对URL转为绝对URL,如何限速,如何设...
Python 爬虫—破解 JS 加密的 Cookie - 后端 - 掘金
前言 在GitHub上维护了一个代理池的项目,代理来源是抓取一些免费的代理发布网站。上午有个小哥告诉我说有个代理抓取接口不能用了,返回状态521。抱着帮人解决问题的心态去跑了一遍代码。发现果真是这样。 通过Fiddler抓包比较,基本可以确定是Java...
这 10 个 Python 项目超有趣! - 后端 - 掘金
前言: Python可谓是现在很多人正在学或者想学的一个脚本语言了,提到学习自然就少不了拿项目练手,可是一般的项目根本提不起兴趣嘛,这10个项目可是非常有趣的,不信你看看。 【Python 图片转...
机器理解大数据的秘密:聚类算法深度详解 - 后端 - 掘金
在理解大数据方面,聚类是一种很常用的基本方法。近日,数据科学家兼程序员 Peter Gleeson 在 freeCodeCamp 发布了一篇深度讲解文章,对一些聚类算法进行了基础介绍,并通过简单而详细的例证对其工作过程进行了解释说明。 看看下面这张图,有各...
Machine Learning - 线性回归算法分析 - 后端 - 掘金
AI人工智能时代,机器学习,深度学习作为其核心,本文主要介绍机器学习的基础算法,以详细线介绍 线性回归算法 及其 数学原理 探究,做...
深入理解 Dirichlet 过程 - 后端 - 掘金
Dirichlet分布和Dirichlet过程广泛应用于信息检索、自然语言处理等领域,是理解主题模型的重要一步。而且它作为一种非参数模型(non-paramatric model),和非参数模型一样有着越来越广泛的应用空间。 文...
深度增强学习前沿算法思想 - 后端 - 掘金
本文原载于《程序员》杂志2017年1月刊 2016年AlphaGo计算机围棋系统战胜顶尖职业棋手李世石,引起了全世界的广泛关注,人工智能进一步被推到了风口浪尖。而其中的深度增强学习算法是AlphaGo的核心,也是通用人工智能的实现关键。本文将带领大家了解深度增...
十分钟配置云端数据科学开发环境 - 阅读 - 掘金
做数据科学开发,目前最流行的语言之一是 Python,这主要得益于其提供 Numpy、Pandas等强大的软件包,以及 Jupyter 这样便捷的开发环境。 本文将介绍如何在一台云服务器上配置 Jupyter Notebook 环境,从此只要有浏览器和网络,就...
一篇了解爬虫技术方方面面 - 后端 - 掘金
本文全面的介绍了爬虫的原理、技术现状、以及目前仍面临的问题。如果你没接触过爬虫,本文很适合你,如果你是一名资深的虫师,那么文末的彩蛋你可能感兴趣。 原文链接:http://www.jianshu...
一个程序员日常书单 - 阅读 - 掘金
今日元宵节,祝各位节日快乐. 本想谈谈读书这个话题,想来想起觉得无从下手,就此作罢.毕业这几年,一直不敢放松,在现代这个互联网时代更加认同萧抡谓的”一日不读书,胸臆无佳想;一月不读书,耳目失清爽”.如果非...
Python 全栈之路系列之函数 - 掘金
函数 函数是Python为了代码最大程度的重用和最小化代码冗余而提供的最基本的程序结构。 函数式:将某功能代码封装到函数中,日后便无需重复编写,仅调用函数即可 面向对象:对函数进行分类和封装,让开发“更快更好更强...” 函数式编程最重要的是增强代码的重用...
Pandas 秘籍 - 后端 - 掘金
Pandas 秘籍 原文:Pandas Cookbook 译者:飞龙 ...
使用 Python 编写多线程爬虫抓取百度贴吧邮箱与手机号 - 后端 - 掘金
今天是大年初一,首先祝大家新年快乐。 不知道大家过年都是怎么过的,反正栏主是在家睡了一天,醒来的时候登QQ发现有人找我要一份贴吧爬虫的源代码,想起之前练手的时候写过一个抓取百度贴吧发帖记录中的邮箱与手机号的爬虫,于是开源分享给大家学习与参考。 ...
「译」Python 项目应该都有什么? - 掘金
原文地址 Python 语言在过去的几年有着突飞猛进的发展,社区也在快速发展。在发展过程中,社区中出现了许多工具保持着资源的结构性和可获取性。在这篇文章中,我将提供一个简短列表,让每个 Python 项目中都具有可访问性和可维护性。 requirements...
用 Keras 编写你的第一个人工神经网络(Python)—— Jinkey 翻译 - 掘金
译者:Jinkey(微信公众号 jinkey-love)英文原版地址:点击跳转 教程概述 这里不需要编写太多的代码,不过我们将一步步慢慢地告诉你怎么以后怎么创建自己的模型。教程将会涵盖以下步骤: 加载数据 定义模型 编译模型 训练模型 评估模型 结合所有步...
从 0 到 1,Python Web 开发的进击之路 - 后端 - 掘金
从0到1,Python Web开发的进击之路 本文将以个人(开发)的角度,讲述如何从零开始,编写、搭建和部署一个基于Python的Web应用程序。 从最简单的出发...
分布式队列神器 Celery - 后端 - 掘金
Celery 是什么? Celery 是一个由 Python 编写的简单、灵活、可靠的用来处理大量信息的分布式系统,它同时提供操作和维护分布式系统所需的工具。 Celery 专注于实时任务处理,支持任务调度。 说白了,它是一个分布式队列的管理工具,我们可以用 ...
Python logging 模块使用指南 - 掘金
记录日志是追踪事件的一种手段。通过添加日志,开发者可以清楚地了解发生了哪些事件,包括出现了哪些错误。logging 模块提供了一系列便捷的函数,用于简单的日志记录。它们分别是 debug(), info(), warning(), error() 和 crit...
一个 Flask 应用运行过程剖析 - 后端 - 掘金
相信很多初学Flask的同学(包括我自己),在阅读官方文档或者Flask的学习资料时,对于它的认识是从以下的一段代码开始的: <span type="button" ...
简约而不简单的 Django 新手图文教程 - 后端 - 掘金
原文出处: 银河系1234 本文面向:有python基础,刚接触web框架的初学者。 环境:windows7 python3.5.1 pycharm专业版 Django 1.10版...
学习笔记一:改善 Python 程序的 91 个建议 - 后端 - 掘金
第 1 章 引论 建议 1:理解 Pythonic 概念 Pythonic Tim Peters 的 《The Zen of Python》相信学过 Python 的都耳熟能详,在交互式环境中输入import this可以查看,其实有意思的是这段 Python...
11 道 Python 基本面试题 | 深入解答 - 阅读 - 掘金
分享给大家的11道Python面试题,好多小伙伴都很积极的去思考分析,给我留言的同学非常多,非常欣慰有这么多好学的小伙伴,大家一起学习,一起加油,把Python学好,今天我就把11道面试题细细解答一下 1.单引号,双引号,三引号...
传说中 Python 最难理解的点 | 看这完篇就够了 - 后端 - 掘金
菜鸟学Python的入门课程已经写了60多篇,讲了很多好玩有趣的知识点,但是整个入门篇还有一个最难的东西没有讲,这个知识点好多书里面对这块要么不讲,要么就是讲的太深奥,这个知识点卡在那里很难受。这块到底是什么的,猜对了就是传说中的装饰器,我记得我好几年前刚学P...
flask 源码解析:请求 - 后端 - 掘金
对于物理链路来说,请求只是不同电压信号,它根本不知道也不需要知道请求格式和内容到底是怎样的; 对于 TCP 层来说,请求就是传输的数据(二进制的数据流),它只要发送给对应的应用程序就行了; 对于 HTTP 层的服务器来说,请求必须是符合 HTTP 协议的内容;...
Python 函数中,参数是传值,还是传引用? - 掘金
在 C/C++ 中,传值和传引用是函数参数传递的两种方式,在Python中参数是如何传递的?回答这个问题前,不如先来看两段代码。 代码段1: def foo(arg): arg = 2 print(arg) a = 1 foo(a) # 输...
全栈 - 12 数据库 用Python操作MySQL - 掘金
这是全栈数据工程师养成攻略系列教程的第十二期:12 数据库 用Python操作MySQL。 我们已经接触了如何使用Web工具phpMyAdmin和本地软件Navicat操作MySQL,现在再来了解下如何使用Python操作MySQL。 MySQLdb MySQ...
- 什么是装饰器 装饰器是一种修改函数和类的便捷方式,是Python提供的语法糖。它可以是我们定义的函数(函数装饰器),也可以是一个类(类装饰器)。我们可以使用装饰器快速地修改其它函数或类,而不用改变它们原本的代码,这样一来,我们就可...
Python 优雅编程之 str.format() - 掘金
- str.format 的引入 在 Python 中,我们可以使用 + 来连接字符串,在简单情况下这种方式能够很好的工作。但是当我们需要进行复杂的字符串连接时,如果依然使用 + 来完成,不仅会使代码变得晦涩难懂,还会让代码变得难以维护,此时这种方式就显得力...
代码这样写不止于优雅(Python版) - 掘金
Martin(Bob大叔)曾在《代码整洁之道》一书打趣地说:当你的代码在做 Code Review 时,审查者要是愤怒地吼道: “What the fuck is this shit?”“Dude, What the fuck!” 等言辞激烈的词语时...
Python 资源大全中文版 - 后端 - 掘金
Python 资源大全中文版 我想很多程序员应该记得 GitHub 上有一个 Awesome - XXX 系列的资源整理。awesome-python 是 vinta 发起维护的 Python 资源列表,内容包括:Web框架、网络爬虫、网络内容提取、模...
使用数据库的正确姿势(一) - 后端 - 掘金
题图 这是我在慕课网上分享的一个关于数据库操作的逐字讲稿,主要分两部分,第一部分为数据库的基本使用,第二部分为用面向对象的方法来使用数据库,及分布式数据库的基本介绍。 大家好,今天我给大...
使用数据库的正确姿势(二) - 后端 - 掘金
题图 在使用数据库的正确姿势(一)中,我给大家介绍了数据库应用的第一个层次——数据库的基本使用,下面我将给大家介绍剩下两个层次,分别是 面向对象的数据库...
代码这样写更优雅 (Python 版) - 掘金
Python 这门语言最大的优点之一就是语法简洁,好的代码就像伪代码一样,干净、整洁、一目了然。但有时候我们写代码,特别是 Python 初学者,往往还是按照其它语言的思维习惯来写,那样的写法不仅运行速度慢,代码读起来也费尽,给人一种拖泥带水的感觉,过段时间连...
PEP 8 Python编码风格指南概要 - 掘金
Python 拥有简洁优雅的语法,但这并不意味着开发者一定能写出简洁而优雅的代码。要写出好的代码,就要遵循一定的规则。Python 官方给出了 PEP8 风格指南,建议每位 Python 开发者都应该阅读一遍,并在开发过程中遵循该编程规范。 PEP 8 全称为...
Python 多线程简易入门 - 后端 - 掘金
一直懒得写Python相关的文章,恰好有天需要简单的给童鞋们讲点课,仓促之余就诞生了此文. 今天本来准备全面的聊聊有关高性能并发这个话题来着,但是周末马上要来了啊.所以我就取了其中的一点来介绍,关于其他的...
从 0 到 1,Python 网络编程的入门之路 - 后端 - 掘金
理解Python网络编程 最近在学习Python网络编程时看了一些相关的文章,发现大多数要么讲的晦涩难懂,要么讲的比较浅显,我就想为什么不在学习的过程中写一篇心得呢,于是有了这篇文章。我相信技术不全是冰冷的,从人的角度出发,才能...
开年有大礼!阿里珍贵技术资料下载(双日更新中) - 工具资源 - 掘金
开年震撼福利首发!云栖社区独家技术资料,涵盖2016全球热点技术!资深专家行业动向解读,阿里大咖亲授核心技术。 小编精心挑选2016云栖大会、历届在线技术峰会、云栖技术直播核心资料,只把最好的呈现给你!因为资料集合过于庞大,所以分批放出,随时关注社区,可以看...
当我学完 Python 我学了些什么 - 工具资源 - 掘金
本文是本人学完Python后的一遍回顾,加深理解顺便留作手册以备查阅。 学习Python的这几天来,觉得Python还是比较简单,容易上手的,就基本语法而言,但是有些高级特性掌握起来还是有些难度,需要时间去消化。Python给我最大的印象就是语法简洁,...
python 爬虫之 BeautifulSoup - 后端 - 掘金
简介 Beautiful Soup提供一些简单的、python式的函数用来处理导航、搜索、修改分析树等功能。它是一个工具箱,通过解析文档为用户提供需要抓取的数据,因为简单,所以不需要多少代码就可以写出一个完整的应用程序。Beautif...
传说中 Python 最难理解的点 | 看这完篇就够了 - 后端 - 掘金
菜鸟学Python的入门课程已经写了60多篇,讲了很多好玩有趣的知识点,但是整个入门篇还有一个最难的东西没有讲,这个知识点好多书里面对这块要么不讲,要么就是讲的太深奥,这个知识点卡在那里很难受。这块到底是什么的,猜对了就是传说中的装饰器,我记得我好几年前刚学P...
Python 开发者 2017 应该关注的 7 个类库 - 后端 - 掘金
Django 依然是 Python 开发者值得信赖的库。然而,在 2016 年几个还不太知名的库引起了 Python 开发者的关注。在这篇博文中,我向大家揭示 7 个 Python 类库,其中不包括像 Django,Flask 等已广为熟知的库,这些类库在 ...
Python 编码为什么那么蛋疼? - 掘金
据说,每个做 Python 开发的都被字符编码的问题搞晕过,最常见的错误就是 UnicodeEncodeError、UnicodeDecodeError,你好像知道怎么解决,遗憾的是,错误又出现在其它地方,问题总是重蹈覆辙,str 到 unicode 之间的转...
使用 Python 爬一爬网易云音乐上那些评论火爆的歌曲 - 后端 - 掘金
网易云音乐这款音乐APP本人比较喜欢,用户量也比较大,而网易云音乐之所以用户众多和它的歌曲评论功能密不可分,很多歌曲的评论非常有意思,其中也不乏很多感人的评论。但是,网易云音乐并没有提供热评排行榜和按评论排序的功能,没关系,本文就使用爬虫给大家爬一爬网易云音乐...
Xpath 总结 - 爬虫开发必备 - 后端 - 掘金
Firefox + Firepath、Chrome + XPath Helper 如下图 Firefox下,XPath需要通过Firebug + Firepath来方便的获取。 Chrome下,通过XPath Helper插件实现,开启和关闭快捷键...
Python 函数式编程 - 后端 - 掘金
Loading [Contrib]/a11y/accessibility-menu.js 2017-03-15 Python 虽然 Python 不是函数式编程语言(是命令式编程语言),但是支持许多有价值的函数式...
Python 优雅编程之 str.format() - 掘金
- str.format 的引入 在 Python 中,我们可以使用 + 来连接字符串,在简单情况下这种方式能够很好的工作。但是当我们需要进行复杂的字符串连接时,如果依然使用 + 来完成,不仅会使代码变得晦涩难懂,还会让代码变得难以维护,此时这种方式就显得力...
Python 爬虫初探(二) - 后端 - 掘金
相对于系列一做了一些简单的改进,主要是由于科四有图片和动图之分,并且有时候程序会暂停,但不报错,所以一直在想断点继续问题,当然效率依旧低。见谅 ...
Python 爬虫初探(一) - 后端 - 掘金
最近参与了的一个项目,因为项目需要驾照考试科一和科四的完整题库,网上找了好久找不到完整版题库,所以才有了这篇博客的由来,因为技术不太好,之前学习的又是Python web相关的知识,所以关于程序的代码可能有些繁琐、低效。见谅 分析得到标题、选项和...
GitHub - egrcc/zhihu-python: 获取知乎内容信息,包括问题,答案,用户,收藏夹信息 - 工具资源 - 掘金
注意: 本项目不再维护更新! Contents ...
爬虫学习资源整理 - 后端 - 掘金
啊,好久没写东西了,发现收到了好多人的私信,我只要有时间都一一回复了,虽说不一定有用,但权当我们互相交流啊,互相学习呀。最近一篇《我分析了42万字歌词后,终于搞清楚民谣歌手唱什么了》文章(因为原文是微信上的,就不分享链接了,想看的自己搜索即可)在各个平台都可以...
使用 Python 定制词云 - 后端 - 掘金
在互联网时代,人们获取信息的途径多种多样,大量的信息充斥在我们周围。此时,如何从浩如烟海的信息中提炼出关键信息,并让人记住,显得至关重要。本教程我们将教你如何使用Python,制作炫酷的词云效果! 本项目完整教程及在线练习地址:使用Python定制词云...
Python 多线程入门指南 - 后端 - 掘金
一直懒得写Python相关的文章,恰好有天需要简单的给童鞋们讲点课,仓促之余就诞生了此文. 今天本来准备全面的聊聊有关高性能并发这个话题来着,但是周末马上要来了啊.所以我就取了其中的一点来介绍,关于其他的...
基于itchat实现微信群消息同步机器人 - 掘金
最近 全栈数据工程师养成攻略 的微信群已经将近500人,开了二群之后为了打通不同微信群之间的消息,花了点时间做了个消息同步机器人,在任意群收到消息时同步到其他群,并且将聊天内容上传至数据库,以供进一步分析、统计和展示。 基本思路是,用 Python 模拟微信登...
wxpy: 微信个人号 API,用 Python 玩微信 - 工具资源 - 掘金
微信个人号 API,基于 itchat,全面优化接口,更有 Python 范儿 简单入门 ...
Python 进程、线程、回调与协程 总结笔记 适合新手明确基本概念 - 后端 - 掘金
怎样让python在现代的机器上运行的更快,充分利用多个核心,有效地实现并行、并发一直是人们的追求方向。 GIL 谈到P...
弹幕新玩法,热门直播弹幕同时看,异步协程改写开源弹幕爬虫包的尝试 - 后端 - 掘金
效果图 上图为1月22号晚上战旗平台热门直播的弹幕消息截图一行中为 直播房间标题-[发弹幕者昵称]--弹幕内容 ...
爬取个人知乎收藏夹内容生成网站 - 后端 - 掘金
无聊的时候,习惯刷刷知乎,但是新的有价值的内容也不多,多的是不断涌入的营销号、推广和某些知乎live。于是乎,想着不如刷自己的收藏夹吧,很多优秀回答其实看了不久就忘了,静静地躺在收藏夹里,一直没被翻过,何况我收藏频率虽然不高,几年下来积累也不少,这样刷起来也能...
网友评论