前言
看过PHP相关书籍的都会了解到PHP有个这样的特性:写时复制。所以在用foreach时,需要对数据做修改的时候,都会复制数据,如果数据很大,那么就会带来一定的内存消耗,所以为了避免这种复制操作,就用到了引用,下面就介绍下引用的坑
问题案例
<?php
$arr = array(4, 5, 6);
var_dump($arr);
foreach ($arr as &$v) {
//do something here
}
foreach ($arr as $v) {
//do something here
}
var_dump($arr);
?>
输出为:
array(3) {
[0]=>
int(4)
[1]=>
int(5)
[2]=>
int(6)
}
array(3) {
[0]=>
int(4)
[1]=>
int(5)
[2]=>
&int(5)
}
问题分析
foreach 中不使用引用就没事, 用 foreach $k => $v 然后 $ar[$k] 来改变原始数组, 略微损失点效率。
执行第一个使用引用的 foreach 时:
一开始, $v 指向 $arr[0] 的存储空间,空间内存储着 4 , foreach 结束时, $v 指向 $arr[2] 的存储空间,空间内存储着 6 。
开始执行第二个 foreach 时:
注意和第一个 foreach 不同, 第二个 foreach 没有使用引用,那么就是赋值方式, 即将 $arr 的值依次 赋值 给 $v 。 进行到第一个元素时,要将 $ar[0] 赋值给 $v 。 问题就在这里,由于刚刚执行完第一个 foreach, $v 不是一个新变量,而是已经存在的、指向 $arr[2] 的那个 引用 , 如此一来,对 $v 进行赋值的时候,就将 $arr[0] = 4 写入了 $arr[2] 的实际存储空间, 相当于对 $arr[2] 进行赋值。 依此类推,第二个 foreach 执行的结果, 就是数组的最后一个元素变成了倒数第二个元素的值。
PHP 的开发者也认为,这种情况属于语言特性造成的,不是 bug。要修复这个问题,一种方法是对 foreach 进行特殊处理, 另一种就是限制 foreach 中 $v 的作用域, 这两种方式都与目前 PHP 的语言特性不符,开发人员不愿改, 但还是在 官方文档 中用 Warning 进行了说明。
解决方案
简单的方法,就是在使用了引用的 foreach 之后, unset 掉 $v
修改后的案例:
<?php
$arr = array(4, 5, 6);
var_dump($arr);
foreach ($arr as &$v) {
//do something here
}
unset($v);
foreach ($arr as $v) {
//do something here
}
var_dump($arr);
?>
输出:
array(3) {
[0]=>
int(4)
[1]=>
int(5)
[2]=>
int(6)
}
array(3) {
[0]=>
int(4)
[1]=>
int(5)
[2]=>
int(6)
}