php过滤utf8_PHP中如何过滤掉非汉字字符

1. 如何使用php批量去除文件UTF8 BOM信息

原理：
UTF8文件，微软为了增加一个识别信息，有了BOM这个东西：BOM —— Byte Order Mark，缺省在Windows等平台上编辑的UTF8文件会在头部增加3个字节的标记信息，我们PHP引擎在处理的时候会完整读取整个PHP代码文档，如果PHP文件头部包含BOM信息，就会输出一个空白，在很多时候会带来问题，比如我们session无法工作、cookie无法设置等等问题。

解决方法：
把头部BOM的3个字节信息识别出来，然后剔除掉。不过一般情况我们不知道哪个文件有BOM，或者是有很多文件，这个时候，就需要进行批量处理了，下面代码主要就是展现了批量处理的情况，应该会对大家工作中有帮助。

执行方法：
设置一个路径，然后直接执行就行。
复制代码代码如下:
<?php
// 设定你要清除BOM的根目录（会自动扫描所有子目录和文件）
$HOME = dirname(__FILE__);
// 如果是Windows系统，修改为：$WIN = 1;
$WIN = 0;
?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<title>UTF8 BOM 清除器</title>
<style>
body { font-size: 10px; font-family: Arial, Helvetica, sans-serif; background: #FFF; color: #000; }
.FOUND { color: #F30; font-size: 14px; font-weight: bold; }
</style>
</head>
<body>
<?php
$BOMBED = array();
RecursiveFolder($HOME);
echo '<h2>These files had UTF8 BOM, but i cleaned them:</h2><p class="FOUND">';
foreach ($BOMBED as $utf) { echo $utf ."<br />n"; }
echo '</p>';
// 递归扫描
function RecursiveFolder($sHOME) {
global $BOMBED, $WIN;
$win32 = ($WIN == 1) ? "" : "/";
$folder = dir($sHOME);
$foundfolders = array();
while ($file = $folder->read()) {
if($file != "." and $file != "..") {
if(filetype($sHOME . $win32 . $file) == "dir"){
$foundfolders[count($foundfolders)] = $sHOME . $win32 . $file;
} else {
$content = file_get_contents($sHOME . $win32 . $file);
$BOM = SearchBOM($content);
if ($BOM) {
$BOMBED[count($BOMBED)] = $sHOME . $win32 . $file;
// 移出BOM信息
$content = substr($content,3);
// 写回到原始文件
file_put_contents($sHOME . $win32 . $file, $content);
}
}
}
}
$folder->close();
if(count($foundfolders) > 0) {
foreach ($foundfolders as $folder) {
RecursiveFolder($folder, $win32);
}
}
}
// 搜索当前文件是否有BOM
function SearchBOM($string) {
if(substr($string,0,3) == pack("CCC",0xef,0xbb,0xbf)) return true;
return false;
}
?>
</body>
</html>
望采纳。

2. php 如何判断字符是否是utf8编码

严格来说，不好判断，但如下方法或许能给你应急处理。 function is_utf8_encode($str, $flag=false){ static $charset = null; if($charset == null){ //gbk中的汉字，但是满足utf-8的编码规范，对于这些汉字当做gbk字符处理 $charstr = '陇搂篓掳卤路脳脿谩猫茅锚矛铆貌贸梅霉煤眉腻脓臎墨艅艌艒奴菐菒菕菙菛菢菤菧蓱伞艺藟藠藡藱螒螔螕螖螘螙螚螛螜螝蚂螠螡萤螣螤巍危韦违桅围唯惟伪尾纬未蔚味畏胃喂魏位渭谓尉慰蟺蚁蟽蟿蠀蠁蠂蠄蝇衼袗袘袙袚袛袝衮袟袠袡袣袥袦袧袨袩袪小孝校肖啸笑效楔些歇蝎鞋协挟携邪斜胁谐写械卸蟹懈泄泻谢屑薪芯锌褉褋裈褍褎褏褑褔褕褖褗袆褜褝褞褟褢'; $charset = str_split($charstr, 2); $charset = array_flip($charset);}$pflag = true;$qflag = false; $len = strlen($str);

3. 用phpstr_replace() 如何替换utf8页面的中文，调用的页面是UTF8

首先保证str_replace时编码程序与调用的页面代码一致，比如程序文件的编码为UTF8，调用页面的编码也是UTF8，这样在程序代码中就可以直接使用中文了。
str_replace('哈哈','呵呵',$buffer)

4. php读取文件时多了个%ufeff，怎样去掉

这是一个文件BOM头，是用来声明UTF-8的，

做法有两种，

1、那个文件在保存的时候选择UTF-8无BOM，或者一些编辑器做去除BOM处理。
2、就是通过PHP，过滤掉BOM。

5. 如何使用PHP批量去除文件UTF8 BOM信息

使用PHP批量去除文件UTF8 BOM信息的方法是移除特定的utf-8 bom文件头。

1、找到\xef\xbb\xbf后并做移除

2、全部参考代码如下：

<?php//RemovesBOM(Byteordermark)fromfile(ifnecessary)functionbomStrip(path,output){
	$bufsize=65536;
	$utf8bom="\xef\xbb\xbf";

	$inf=fopen(path,r);
	$outf=fopen(output,w);

	$buf=fread($inf,strlen($utf8bom));	if($buf!=$utf8bom)
	{
		fwrite($outf,$buf);
	}	if($buf=="")
	{		exit();
	}	while(true)
	{
		$buf=fread($inf,$bufsize);		if($buf=="")
		{			exit();
		}
		fwrite($outf,$buf);
	}
}?>

6. PHP中如何过滤掉非汉字字符

首先需要先把带有中文的字符串进行编码转化，由GB2312编码转化为UTF-8编码。
这样是为了PHP正则表达式可以正确的去匹配
然后通过preg_match_all()函数以及相应的中文匹配正则表达式，把所有的中文匹配出来
最后，把匹配到的中文字符串再转为B2312编码，这样做是为了可以在网页编码为GB2312上正确显示。

例如：
<?php
$str = "ddddvvv(,中文.)dfdsfds字符啊.";

//把GB2312编码转化为 UTF-8编码
$str = mb_convert_encoding($str, 'UTF-8', 'GB2312');

//正则匹配
preg_match_all('/[\x{4e00}-\x{9fff}]+/u', $str, $matches);

//把匹配到的数组连接为字符串
$str = implode('', $matches[0]);

//把UTF-8编码转化为 GB2312编码
$str = mb_convert_encoding($str, 'GB2312', 'UTF-8');

echo $str;
//输出中文字符啊
?>

7. php怎样过滤掉特殊字符啊 ☺

过滤掉特殊字符，可以考虑使用字符串替换的方法，在php中替换字符效率最高也是最简单字符替换函数str_replace函数。

使用方法：str_replace(find,replace,string,count)

参数说明：

find 必需。规定要查找的值。

replace 必需。规定替换 find 中的值的值。

string 必需。规定被搜索的字符串。

count 可选。一个变量，对替换数进行计数。

实例：

str_replace("iwind","kiki","iloveiwind,iwindsaid");

将输出 "i love kiki, kiki said"

当然你也可以采取正则替换的方法，该函数是preg_replace

8. PHP过滤问题 preg_match("/^[0-9a-zA-Z]*$/",$str)

preg_match("/^[0-9a-zA-Z]*$/",$str)
这个/^[0-9a-zA-Z]*$/正则，匹配的string必须有0-9z-aA-Z组成，你加了定位符，所以不能含有其他字符；
如果你只是想判断string里面有没有字母和数字，
可以去掉定位符preg_match("/[0-9a-zA-Z]*/",$str)

9. php怎么解析utf-8带BOM编码的json数据，php解析json数据返回NULL

son_decode函数能够接收utf8编码的参数，但是当参数中包含BOM时，json_decode就会失效。
这个函数能将给定的字符串转换成UTF-8编码，移除其中的BOM。
下面是PHP代码：
function prepareJSON($input) {

//This will convert ASCII/ISO-8859-1 to UTF-8.
//Be careful with the third parameter (encoding detect list), because
//if set wrong, some input encodings will get garbled (including UTF-8!)
$imput = mb_convert_encoding($input, 'UTF-8', 'ASCII,UTF-8,ISO-8859-1');

//Remove UTF-8 BOM if present, json_decode() does not like it.
if(substr($input, 0, 3) == pack("CCC", 0xEF,

导航:首页 > 编程语言 > php过滤utf8

php过滤utf8

与php过滤utf8相关的资料