php运行生命周期--脚本执行阶段 php_execute

作者: 程序员小饭 | 来源:发表于2020-02-14 11:15 被阅读0次

php运行生命周期--脚本执行阶段 php_execute
《编程原理系列》03 - PHP运行生命周期
从0到1学习网络安全【PHP基础-For 循环】
深入理解PHP内核[读书笔记]--第二章：用户代码执行--PHP
深入理解PHP内核[读书笔记]--第二章：用户代码执行--PHP
【前言】PHP的词法/语法分析
长链接
linux下如何执行PHP脚本2018-10-26
2019-01-22
PHP使用命令函数执行shell脚本

php_execute.png

第1步：词法分析将PHP代码转换为有意义的标识Token。该步骤的词法分析器使用Re2c实现的。

第2步：语法分析将Token和符合文法规则的代码生成抽象语法树。语法分析器基于Bison实现。语法分析使用了巴科斯范式（BNF）来表达文法规则，Bison借助状态机、状态转移表和压栈、出栈等一系列操作，生成抽象语法树。

第3步：上步的抽象语法树生成对应的opcode，被虚拟机执行。opcode是PHP7定义的一组指令标识，指令对应着相应的handler（处理函数）。当虚拟机调用opcode，会找到opcode背后的处理函数，执行真正的处理。以我们常见的echo语句为例，其对应的opcode便是ZEND_ECHO。
注意：这里为了便于理解词法分析和语法分析过程，将两者分开描述。但实际情况，出于效率考虑，两个过程并非完全独立。
下面，我们通过一段示例代码，来建立PHP7运转的初步理解。

示例代码如下：

<?php
echo "hello world";

这段代码首先会被切割为Token。

Token

Token是PHP代码被切割成的有意义的标识。本书介绍的PHP7版本中有137 种Token，在zend_language_parser.h文件中做了定义：

/* Tokens.  */
#define END 0
#define T_INCLUDE 258
#define T_INCLUDE_ONCE 259
…
#define T_ERROR 392

PHP提供了token_get_all()函数来获取PHP代码被切割后的Token，可以在深入源码学习前，粗略查看PHP代码被切割后的Token。如下代码片段：

<?php
$lan = '<?php $a = 1; echo $a';
$tokens = token_get_all($lan);
foreach ($tokens as $token) {
    if (is_array($token)) {
        echo "Line {$token[2]}: ", token_name($token[0]), " ('{$token[1]}')", PHP_EOL;
    }
}

打印结果为

Line 1: T_OPEN_TAG ('<?php ')
Line 1: T_VARIABLE ('$a')
Line 1: T_WHITESPACE (' ')
Line 1: T_WHITESPACE (' ')
Line 1: T_LNUMBER ('1')
Line 1: T_WHITESPACE (' ')
Line 1: T_ECHO ('echo')
Line 1: T_WHITESPACE (' ')
Line 1: T_VARIABLE ('$a')

二维数组的每个成员数组第一个值token[0]为Token对应的枚举值；第二个值token[1]为Token对应的原始字符串内容；第三个值token[2]为代码对应的行号。
可见，Token就是一个个的“词块”，但是单独存在的词块不能表达完整的语义，还需要借助规则进行组织串联。语法分析器就是这个组织者。它会检查语法、匹配Token，对Token进行关联。

PHP7中，组织串联的产物就是抽象语法树（Abstract Syntax Tree，AST）。
2:AST
AST是PHP7版本新特性。在这之前的版本，PHP代码的执行过程中没有生成AST这一步。PHP7对抽象语法树的支持，实现了PHP编译器和解释器解耦，有效提升了可维护性。

顾名思义，抽象语法树具有树状结构。AST的节点分为多种类型，对应着不同的PHP语法。在当前章节，我们可以认为节点类型是对语法规则的抽象，例如赋值语句，生成的抽象语法树节点为ZEND_AST_ASSIGN。而赋值语句的左右操作数，又将作为ZEND_AST_ASSIGN类型节点的孩子。通过这样的节点关系，构建出抽象语法树。
3: Opcodes
AST扮演了源码到中间代码的临时存储介质的角色，还需要将其转换为opcode，才能被引擎直接执行。Opcode只是单条指令，Opcodes是opcode的集合形式，是PHP执行过程中的中间代码，类似Java中的字节码。生成之后由虚拟机执行。

我们知道，PHP工程优化措施中有个比较常见的“开启Opcache”，指的就是这里的Opcodes的缓存（Opcodes Cache）。通过省去从源码到opcode的阶段，引擎可以直接执行缓存的opcode，以此提升性能。