课程的主线(cs101cs101):搭建一个网络搜索引擎
搜索引擎总体上可以概括为三大模块:
Module | Function | Capter |
---|---|---|
Find Data | finding data by crawling web pages | Unit 1-3 |
Build an Index | building an index to be able to respond quickly to search queries | Unit 4-5 |
Rank Pages | ranking pages so that we get the best result for a given query | Unit 6 |
In Unit 1, We'll get started by extracting the first link in a web page...
第一单元,从一个网页中提取第一个链接作为 种子 链接,以这颗种子作为起始点,跟踪该种子网页中的链接来发现其他页面,从其他页面再拓展出更多的页面,如此循环,最终得到所有网络中的页面。
编程概述
-
编程的目的是使得计算机去完成我们能想到的任何 “计算” 功能(我们耳闻目睹的计算机功能本质上都是计算产生的),程序是一些列 精确 的操作步骤。
-
Python 语言是一门高级编程语言,它通过 Python 解析器解析完成后由计算机执行。
-
人类语言作为计算机语言的劣势:
- 歧义(Ambiguity)
- 冗长(Verbosity)
-
Python 基本语法:
Python 语法形式源自于美国人 巴克斯(John Backus) ,巴克斯范式的目的是为了用一种简单而概要的方式精确的描述语言。
- Python 基本语句由表达式组成(类似人类语言由句子组成)
- 表达式由表达式、运算符和表达式结合而成
- 表达式可以是其他表达式或 Python 数据类型(数字、字符……)
- 处理器
我的处理器是 2.7 GHz,1 GHz = 10 亿赫兹,也就是 1 秒内可以完成 27 亿次循环。
光速 299 792 458 meter/second,1 nanosecond = 1/1 000 000 000 second
处理器循环一次,光走了多少厘米(为什么处理器那么小):
1/2.7 * 299 792 458 * 1/1 000 000 000 * 100 ≈ 11 cm
单词
Toaster
derive
precise
grammatical
exactly
concise
grammars
strict
recursive definition
网友评论