美文网首页
字节跳动--面经

字节跳动--面经

作者: C1R2 | 来源:发表于2020-10-26 22:40 被阅读0次
    http和https的区别

    https协议需要到CA(Certificate Authority,证书颁发机构)申请证书,一般免费证书较少,因而需要一定费用。

    http是超文本传输协议,信息是明文传输,https则是具有安全性的ssl加密传输协议。
    http和https使用的是完全不同的连接方式,用的端口也不一样,前者是80,后者是443。
    http的连接很简单,是无状态的。Https协议是由SSL+Http协议构建的可进行加密传输、身份认证的网络协议,比http协议安全。(无状态的意思是其数据包的发送、传输和接收都是相互独立的。无连接的意思是指通信双方都不长久的维持对方的任何信息。)

    linux命令,找出关键字出现的次数

    语法:grep 字符串 文件名|wc -l ,grep输出,wc -l按行统计。

    例子:
    统计task-hbase-transform.log中NullPointerException出现的次数:
    grep NullPointerException task-hbase-transform.log|wc -l。

    如果是多个字符串出现次数,可使用:
    grep 'objStr1|objStr2' filename|wc -l#直接用 | 链接起来即可。

    数据库查找

    学生成绩单里两门成绩>80的学生名字。
    SELECT S.name
    FROM Student S
    WHERE S.score > 80
    GROUP BY S.name
    Having count(*)>=2;

    浏览器中输入URL按下回车后

    浏览器查找域名的IP地址

    图片.png
    浏览器与目标服务器建立TCP连接
    • http协议建立在tcp协议之上,http请求前,需先进行tcp连接,形成客户端到服务器的稳定的通道。俗称TCP的三次握手。
    • tcp连接完成后,http请求开始,请求有多种方式,常见的有get,post等。
    • http请求包含请求头,也可能包含请求体两部分,请求头中包含我们希望对请求文件的操作的信息,请求体中包含传递给后台的参数。
    • 服务器收到http请求后,后台开始工作,如负载平衡,跨域等,这里就是后端的工作了。
    • 文件处理完毕,生成响应数据包,响应也包含两部分,响应头和响应体,响应体就是我们所请求的文件。
      -经过网络传输,文件被下载到本地客户端,客户端开始加载。

    html页面的解析与渲染

    • 客户端浏览器加载了html文件后,由上到下解析html为DOM树(DOM Tree)。
    • 遇到css文件,css中的url发起http请求。
    • 这是第二次http请求,由于http1.1协议增加了Connection: keep-alive声明,故tcp连接不会关闭,可以复用。
    • http连接是无状态连接,客户端与服务器端需要重新发起请求--响应。在请求css的过程中,解析器继续解析html,然后到了script标签。
    • 由于script可能会改变DOM结构,故解析器停止生成DOM树,解析器被js阻塞,等待js文件发起http请求,然后加载。这是第三次http请求。js执行完成后解析器继续解析。
    • 由于css文件可能会影响js文件的执行结果,因此需等css文件加载完成后再执行。
    • 浏览器收到css文件后,开始解析css文件为CSSOM树(CSS Rule Tree)。
    • CSSOM树生成后,DOM Tree与CSS Rule Tree结合生成渲染树(Render Tree)。
    • Render Tree会被css文件阻塞,渲染树生成后,先布局,绘制渲染树中节点的属性(位置,宽度,大小等),然后渲染,页面就会呈现信息。
    • 继续边解析边渲染,遇到了另一个js文件,js文件执行后改变了DOM树,渲染树从被改变的dom开始再次渲染。
    • 继续向下渲染,碰到一个img标签,浏览器发起http请求,不会等待img加载完成,继续向下渲染,之后再重新渲染此部分。
    • DOM树遇到html结束标签,停止解析,进而渲染结束。
    无效链接

    死链接(Dead Links)指的是无效链接,也就是那些不可到达的链接。通俗地理解是以前可以通过点击这个链接到达网站页面,后续可能由于网站迁移、改版或操作不当等原因,使得链接指向的目标页面不存在而无法访问所遗留的链接,即称为死链接。

    访问死链接时,一般会出现“抱歉,您所访问的页面不存在”的提示信息或者 404 状态页面。

    进程和线程

    区别:

    • 进程是资源分配的最小单位,线程是程序执行的最小单位(资源调度的最小单位)
    • 进程有自己的独立地址空间,每启动一个进程,系统就会为它分配地址空间,建立数据表来维护代码段、堆栈段和数据段,这种操作非常昂贵。而线程是共享进程中的数据的,使用相同的地址空间,因此CPU切换一个线程的花费远比进程要小很多,同时创建一个线程的开销也比进程要小很多。
    • 线程之间的通信更方便,同一进程下的线程共享全局变量、静态变量等数据,而进程之间的通信需要以通信的方式(IPC)进行。不过如何处理好同步与互斥是编写多线程程序的难点。
    • 但是多进程程序更健壮,多线程程序只要有一个线程死掉,整个进程也死掉了,而一个进程死掉并不会对另外一个进程造成影响,因为进程有自己独立的地址空间。

    进程与线程的资源

    • 线程共享:进程代码段、进程的公有数据(利用这些共享的数据,线程很容易的实现相互之间的通讯)、进程打开的文件描述符、信号的处理器、进程的当前目录和进程用户ID与进程组ID。
    • 线程独有:栈(保存其运行状态和局部自动变量)、程序计数器。

    进程与线程的同步

    • 进程:无名管道、有名管道、信号、共享内存、消息队列、信号量。
    • 线程:互斥量、读写锁、自旋锁、线程信号、条件变量。

    僵尸进程

    • 改写父进程,在子进程死后要为它收尸。具体做法是接管SIGCHLD信号。子进程死后,会发送SIGCHLD信号给父进程,父进程收到此信号后,执行waitpid()函数为子进程收尸。这是基于这样的原理:就算父进程没有调用wait,内核也会向它发送SIGCHLD消息,尽管默认处理是忽略,如果想响应这个消息,可以设置一个处理函数。
    • 把父进程杀掉。父进程死后,僵尸进程成为”孤儿进程”,过继给1号进程init,init始终会负责清理僵尸进程.它产生的所有僵尸进程也跟着消失。
    • 定义:一个进程使用fork创建子进程,如果子进程退出,而父进程并没有调用wait或者waitpid获取子进程的状态信息,那么子进程的进程描述符等一系列信息还会保存在系统中。这种进程称之为僵死进程。
    • 危害:在Unix系统管理中,当用ps命令观察进程的执行状态时,经常看到某些进程的状态栏为defunct,这就是所谓的“僵尸”进程。“僵尸”进程是一个早已死亡的进程,但在进程表(processs table)中仍占了一个位置(slot)。由于进程表的容量是有限的,所以,defunct进程不仅占用系统的内存资源,影响系统的性能,而且如果其数目太多,还会导致系统瘫痪。
    • 处理方法:
    • 改写父进程,在子进程死后要为它收尸。具体做法是接管SIGCHLD信号。子进程死后,会发送SIGCHLD信号给父进程,父进程收到此信号后,执行waitpid()函数为子进程收尸。这是基于这样的原理:就算父进程没有调用wait,内核也会向它发送SIGCHLD消息,尽管默认处理是忽略,如果想响应这个消息,可以设置一个处理函数。
    • 把父进程杀掉。父进程死后,僵尸进程成为”孤儿进程”,过继给1号进程init,init始终会负责清理僵尸进程.它产生的所有僵尸进程也跟着消失。

    孤儿进程
    父进程运行结束,但子进程还在运行(未运行结束)的子进程就称为孤儿进程。孤儿进程最终会被init进程(进程号为1)所收养,因此init进程此时变成孤儿进程的父进程,并由init进程对它们完成状态收集工作。(linux下,init是内核启动的第一个用户级进程,init有许多很重要的任务,比如像启动getty(用于用户登录)、实现运行级别、以及处理孤立进程。)

    Linux命令

    "|":管道符“|”将两个命令隔开,管道符左边命令的输出就会作为管道符右边命令的输入。连续使用管道意味着第一个命令的输出会作为第二个命令的输入,第二个命令的输出又会作为第三个命令的输入,依此类推。

    • grep:-v 不显示匹配上的内容;-n 显示匹配上的内容
      grep -v down,显示不包含down的内容。
      grep -n down,显示包含down的内容。
      du:(disk use)显示每个文件和目录的磁盘使用空间。
      df:(disk free)显示磁盘分区上可以使用的磁盘空间。
    单例模式

    什么情况下会用到:假如有很多地方都需要使用配置文件的内容,也就是说,很多地方都需要创建 AppConfig对象的实例,这就导致系统中存在多个AppConfig的实例对象,在配置文件内容很多的情况下会严重浪费内存资源。类似AppConfig这样的类,我们希望在程序运行期间只存在一个实例对象。
    优点:速度快、在使用时不需要创建、直接使用即可。
    缺点:可能存在内存浪费。

    GET 和 POST 的区别
    • GET在浏览器回退时是无害的,而POST会再次提交请求。
    • GET产生的URL地址可以被Bookmark,而POST不可以。
    • GET请求会被浏览器主动cache,而POST不会,除非手动设置。
    • GET请求只能进行url编码,而POST支持多种编码方式。
    • GET请求参数会被完整保留在浏览器历史记录里,而POST中的参数不会被保留。
    • GET请求在URL中传送的参数是有长度限制的,而POST么有。
    • 对参数的数据类型,GET只接受ASCII字符,而POST没有限制。
    • GET比POST更不安全,因为参数直接暴露在URL上,所以不能用来传递敏感信息。
    • GET参数通过URL传递,POST放在Request body中。
    APP进程和多线程安全性对比

    写网页(html,js,css)的,写的很随意,导致chrome渲染的时候出现bug,整个chrome崩掉,我google再nb的程序员也写不出来0 bug的浏览器,单个页面不行就算了,我越界到别人地址上了,大家一块崩溃吧,
    插件也是参差不齐,插对了没问题,插错了不但是把自己弄坏,整个进程崩了,其他线程也别活了。
    别有用心者,我是黑客要努力的超越漏洞,我从页面a刺穿到别人的页面上(安全性问题).
    原因:多线程程序只要有一个线程死掉,整个进程也死掉了,而一个进程死掉并不会对另外一个进程造成影响,因为进程有自己独立的地址空间。

    序列化和反序列化

    定义:
    Java序列化就是指把Java对象转换为字节序列的过程。Java反序列化就是指把字节序列恢复为Java对象的过程。

    作用:
    序列化:在传递和保存对象时,保证对象的完整性和可传递性。对象转换为有序字节流,以便在网络上传输或者保存在本地文件中。
    反序列化:根据字节流中保存的对象状态及描述信息,通过反序列化重建对象。

    总结:
    核心作用就是对象状态的保存和重建。


    参考链接
    https://mp.weixin.qq.com/s/3G8At3ExExK9K6GiZJOPLA

    相关文章

      网友评论

          本文标题:字节跳动--面经

          本文链接:https://www.haomeiwen.com/subject/zzqemktx.html