PHP是弱类型,动态的语言脚本。在申明一个变量的时候,并不需要指明它保存的数据类型。例如:
$var = 1;
$var = "variable";
$var = 1.00;
$var = array();
$var = new Object();
动态变量,在运行期间是可以改变的,并且在使用前无需声明变量类型。
问题一、Zend引擎是如何用C实现这种弱类型的呢?
实际上,在PHP中声明的变量,在ZE中都是用结构体zval来保存的。
首先我们打开Zend/zend.h来看zval的定义:
typedef struct _zval_struct zval;
struct _zval_struct {
/* Variable information */
zvalue_value value; /* value */
zend_uint refcount__gc;
zend_uchar type; /* active type */
zend_uchar is_ref__gc;
};
typedef union _zvalue_value {
long lval; /* long value */
double dval; /* double value */
struct {
char *val;
int len;
} str;
HashTable *ht; /* hash table value */
zend_object_value obj;
} zvalue_value;
Zend/zend_types.h:
typedef unsigned char zend_bool;
typedef unsigned char zend_uchar;
typedef unsigned int zend_uint;
typedef unsigned long zend_ulong;
typedef unsigned short zend_ushort;
从上述代码中,可以看到_zvalue_value是真正保存数据的关键部分。通过共用体实现的弱类型变量声明
问题二、Zend引擎是如何判别、存储PHP中的多种数据类型的呢?
_zval_struct.type中存储着一个变量的真正类型,根据type来选择如何获取zvalue_value的值。
type值列表(Zend/zend.h):
#define IS_NULL 0
#define IS_LONG 1
#define IS_DOUBLE 2
#define IS_BOOL 3
#define IS_ARRAY 4
#define IS_OBJECT 5
#define IS_STRING 6
#define IS_RESOURCE 7
#define IS_CONSTANT 8
#define IS_CONSTANT_ARRAY 9
来看一个简单的例子:
<?php
$a = 1;
//此时zval.type = IS_LONG,那么zval.value就去取lval.
$a = array();
//此时zval.type = IS_ARRAY,那么zval.value就去取ht.
这其中最复杂的,并且在开发第三方扩展中经常需要用到的是 资源类型
在PHP中,任何不属于PHP的内建的变量类型的变量,都会被看作资源来进行保存。比如:数据库句柄、打开的文件句柄、打开的socket句柄。
资源类型,会用lval,此时它是一个整型指示器, 然后PHP会再根据这个指示器在PHP内建的一个资源列表中查询相对应的资源。
正是因为ZE这样的处理方式,使PHP就实现了弱类型,而对于ZE的来说,它所面对的永远都是同一种类型 zval
问题三、弱类型会产生哪些问题呢?
- 类型转换问题
- 当一个字符串被当作一个数值来取值,其结果和类型如下:
- 如果该字符串没有包含’.',’e',’E'并且其数值值在整形的范围之内,该字符串被当作int来取值。
- 其他所有情况下都被作为float来取值
- 该字符串的开始部分决定了它的值,如果该字符串以合法的数值开始,则使用该数值,否则其值为0。
<?php
var_dump("abc" == 0); //bool(true)
var_dump("1ab" == 1); //bool(true)
var_dump("ab1" == 1); //bool(false)
var_dump("ab0" == 0); //bool(true)
?>
- 在进行比较运算时,如果遇到了0e这类字符串,PHP会将它解析为科学计数法。
var_dump("0e1234" == "0e5678"); //bool(true)
"0e1234" == "0e5678" 相互比较的时候,会将0e这类字符串识别为科学技术法的数字,0的无论多少次方都是零,所以相等。
- 在进行比较运算时,如果遇到了0x这类字符串,PHP会将它解析为十六进制。
var_dump("0x1046a" == "66666"); //bool(true)
-
函数松散性
- switch()
如果switch是数字类型的case的判断时,switch会将其中的参数转换为int类型。
$abc = "1ab"; switch ($abc) { case 1: echo "this is 1."; //输出 break; case 2: echo "this is 2."; break; case 3: echo "this is 3."; break; }
- md5()
- 0e开头的全部相等(==判断)
var_dump(md5('240610708') == md5('QNKCDZO')); //bool(true)
我们输出240610708 和 QNKCDZO md5值看下
echo md5('240610708'); // 0e462097431906509019562988736854 echo md5('QNKCDZO'); // 0e830400451993494058024219903391
在”==”相等操作符的运算下,结果返回了true,如果使用 === 则返回false
sha1和Md5一样都会有这个问题。
- 利用数组绕过(===判断)
md5()函数要求接收一个字符串,若传递进去一个数组将返回NULL(同时会出现一个PHP Warning);
而NULL===NULL返回true,所以可绕过判断。$array1 = [1,3,5]; $array2 = [6,8,9]; var_dump(md5($array1) === var_dump($array2)); //bool(true)
- NULL,0,”0″,array()使用 == 和false比较时,都是会返回true的
- switch()
网友评论