phpasciiunicode_PHP中文乱码

⑴ 求php ascii码转换成汉字

ascii码没有汉字这一说，ascii只表示英文和西欧字符

⑵ php语言字典代码

求一PHP算法，字典生成。时间一到再加100分。如：字符：0-9，长度：1，

那就生成0,1,2,3,4,5,6,7,8,9

长度：2,就会生成00-99

现在要求字符可以包括a-z，或者其他特殊符号，求一高效的生成算法。

参考答案一

function get_string($strlen){

$source='0123456789'; //任意字符

$len = strlen($source); //长度

$return = array();

for($i = 0 ;$i < $len;$i++){

for($j = 0;$j < $strlen;$j++){

$return[$i] .= $i;

}

return implode(',', $return);

}

如果输入长度2: 输出结果就是:

00,11,22,33,44,55,66,77,88,99

参考答案二

优化了进位算法：

PHP code =0;$no--){ $word=$source{$series[$no]}.$word; $series[$no]+=$tonext_value; if($no>0){ if($series[$no]==$len){ $series[$no]=0; $tonext_value=1; }else{ $tonext_value=0; } } } echo "$word "; } } gene_dic(2); ?>

简单的说，我会把这个理解为0-9(十进制)下十个数字生成两位数字、可重复的排列问题。

排列算法我自己建立过的就是简单的N进制下的+1算法，保证可以遍历。

即：

初始化到0，

1. +1

2. 是否超过要生成的位数?否，则回到1;

3. 输出

参考答案三

PHP code =0;$no--){//循环遍历数组每次从源字串中取一个字符，为便于进位运算，取字符是从后往前取 $word=$source{$series[$no]}.$word;//先取出一个字符 //取出一个字符后就要判断当前数组元素如何如果改变值，为下一次“大循环”做准备 if($no==$n-1){//末位的判断，它比较特殊，每次大循环都要增值 if($series[$no]==$len-1){ $series[$no]=0; $tonext_value=1;//归零时就进位 }else{ $series[$no]+=1; $tonext_value=0;//未归零就增值，不进位 } }elseif($no<$n-1){//中间位的进位判断 $series[$no]+=$tonext_value;//先取得上一位的进位值 if($series[$no]==$len){ $series[$no]=0; $tonext_value=1;//归零了就继续进位 }else{ $tonext_value=0;//不归零就不进位 } }else{ $series[$no]+=$tonext_value;//大循环次数决定了“老大”是只进不出的。 } } echo "$word ";//输入单词 } } gene_dic(2);//测试,结果OK。

参考答案四

参考答案五

应该是:

function get_string($strlen){

$source='0123456789';

$len = strlen($source);

$return = array();

for($i = 0 ;$i < $len;$i++){

for($j = 1;$j <= $strlen;$j++){

$return[$i] .= substr($source,$i,1);

}

return implode(',', $return);

}

【拓展阅读】如何开始一门语言的学习

一门语言从发明到演进必有原因。

现在还有很多人推荐学习不同的语言。通过比较，了解它的发展史，

创始人的初心等因素都需要留意。多个思考，这个语言在5年，在10年后还是否保持活力?

当有几个类似的语言被选择时，我们不妨对它们做一个Swat分析。

列出这些语言的共同点，还有它们之间的规则差异。

了解语言的发展史

开发语言从汇编开始，如最早的计算机ENIAC，使用的就是它来编程。

再到Fortarin，再到C语言，Cobol，Basic。每一个语言都与当时发展的阶段有点密切关联。

人类的每个发明都与懒惰有关，语言也是为便捷性而生。有的语言

C是除汇编外最重视效率的语言，扩展的C++也继承了此特性。Perl是做文本处理效率最佳的语言，虽然它的发展有点慢。PHP做Web开发，是“世界上最好的.语言”，Python的阅读性和大数据处理都做得样样俱佳。

当了解语言的历史沿革后，会让我们对其创始人有很强烈的兴趣，成为忠实的脑残粉，学习该语言的兴趣会更浓烈。

人们常常说某个语言比哪个好，这其实没有必要。不必要为其它人的语言所惑，需要你自己做出选择。

语言的共通点

这个星球的人都是一个鼻子两双只水汪汪的大眼睛，与人们的模样一般，编程语言也有一个大致相同的长相。

语法：这是开发此语言定义的规则“套路”：

运算符顺序，变量常量定义/作用域，表达式定义，字符串定义，行尾结束符等。

流程控制：循环控制

这些语法都是成对的，如if,for,while,foreach，有的语言还提供goto这样类似汇编语言的语法。

函数与方法

一些能够复用的高质量代码组合。函数执行后有返回，有递归，有嵌套，还有干完活就完事的简单任务。有静态函数和动态函数区分。

容器

数组，哈希表(也叫散列)，字典等用来保存数据的容器。

错误/例外处理

现代编程语言基本都支持出错的抛出，除了C语言之外。

比如硬盘不足，网络出错，黑客攻击等情形。就像购物中心里出现煤气泄露时，监测设备，物联网设备能够及时记录与传递给指挥中心。

没有错误抛出的语言，需要自己考虑尽可能出错的场景并处理，比如：

if(is_overfllow)

//处理

if(network_error)

//处理

可以还有不少需要关注的维度，这会让代码变得艰涩难懂，也难以维护。

我们可以用这样的方式，让其更简洁：

on error goto ERROR

ERROR:

..//

但这总是会需要我们照顾很多情形。于是C++推出了一个语法：

try{

//可能会出错的代码

}catch{

//处理出错的逻辑

}finally{

//出不出错都要执行的代码

}

最后一句是微软公司给业界提供贡献的finally代码块。

以上这些成为语言处理异常机制的基础。

容器

容器是很重要的一节，所以我们单独再提出来。很多逻辑处理，使用容器保存数据，该语言会提供便捷的方法来提供存取。

比如C、Perl、PHP、Ruby中均提供的数组和关联数组，LISP提供的列表，Java、Python提供的元组、链表等。

虽然名字相同，但是实现方式却是完全不同，使用方法当然也不一样。

没有万能的容器，只有最合适的。可以从节省内存，节约时间还是编码效率等综合考虑。

字符串与字符编码

是否支持unicode编码。从摩斯码到ASCII到统一的Unicode编码支持。

并发处理

有的语言在设计时并无此方面的考虑，或者天生设计存在缺陷。

即多线程，多进程的概念。包括共享，锁，事备等特性。

面向对象

支持类，继承，模块，包，命名空间，闭包等。有这些特性才会让人们的工作变得更便利、更有效率。

小结

学习一门语言的关键，需要我们在平静地心绪下，带着浓厚的兴趣去学习，在比较中学习，在历史中学习。

有时候感觉还是不够通畅，先做知识的搬运工也是不错。另外，不断的实践会让我们的信心更足。

⑶ php如何实现文字转Unicode编码

为了要将Unicode转换为UTF-8，当然要知道他们的区别到底在什么地方。下面来看一下，在Unicode中的编码是怎样转换成UTF-8的，在UTF-8中，如果一个字符的字节小于0x80（128）则为ASCII字符，占一个字节，可以不用转换，因为UTF-8兼容ASCII编码。假如在Unicode中汉字“你”的编码为“u4F60”，把它转换为二进制为100111101100000，然后按照UTF-8的方法进行转换。可以将Unicode二进制从低位往高位取出二进制数字，每次取6位，如上述的二进制就可以分别取出为如下所示的格式，前面按格式填补，不足8位用0填补。

⑷ 什么是PHP编码

PHP程序设计中中文编码问题曾经困扰很多人，导致这个问题的原因其实很简单，每个国家(或区域)都规定了计算机信息交换用的字符编码集，如美国的扩展ASCII码,中国的GB2312-80，日本的JIS等。作为该国家/区域内信息处理的基础，字符编码集起着统一编码的重要作用。字符编码集按长度分为SBCS(单字节字符集)，DBCS(双字节字符集)两大类。早期的软件(尤其是操作系统)，为了解决本地字符信息的计算机处理，出现了各种本地化版本(L10N)，为了区分，引进了LANG,Codepage等概念。但是由于各个本地字符集代码范围重叠，相互间信息交换困难;软件各个本地化版本独立维护成本较高。因此有必要将本地化工作中的共性抽取出来，作一致处理，将特别的本地化处理内容降低到最少。这也就是所谓的国际化(118N)。各种语言信息被进一步规范为Locale信息。处理的底层字符集变成了几乎包含了所有字形的 Unicode。

现在大部分具有国际化特征的软件核心字符处理都是以Unicode为基础的，在软件运行时根据当时的ocale/Lang /Codepage设置确定相应的本地字符编码设置，并依此处理本地字符。在处理过程中需要实现Unicode和本地字符集的相互转换，甚或以 Unicode为中间的两个不同本地字符集的相互转换。这种方式在网络环境下被进一步延伸，任何网络两端的字符信息也需要根据字符集的设置转换成可接受的内容。

数据库中的字符集编码问题

流行的关系数据库系统都支持数据库字符集编码，也就是说在创建数据库时可以指定它自己的字符集设置，数据库的数据以指定的编码形式存储。当应用程序访问数据时，在入口和出口处都会有字符集编码的转换。对于中文数据，数据库字符编码的设置应当保证数据的完整性。GB2312、GBK、UTF-8等都是可选的数据库字符集编码;当然我们也可以选择ISO8859-1(8-bit)，只是我们得在应

用程序写数据之前先将16Bit的一个汉字或Unicode拆分成两个8-bit的字符，读数据之后也需要将两个字节合并起来，同时还要判别其中的SBCS 字符，因此我们并不推荐采用ISO8859-1作为数据库字符集编码。这样不但没有充分利用数据库自身的字符集编码支持，而且同时也增加了编程的复杂度。编程时，可以先用数据库管理系统提供的管理功能检查其中的中文数据是否正确。

PHP程序在查询数据库之前，首先执行 mysql_query("SETNAMESxxxx");其中xxxx是你网页的编码(charset=xxxx)，如果网页中 charset=utf8，则xxxx=utf8，如果网页中charset=gb2312，则xxxx=gb2312，几乎所有WEB程序，都有一段连接数据库的公共代码，放在一个文件里，在这文件里，加入mysql_query("SETNAMESxxxx")就可以了。

SETNAMES 显示客户端发送的SQL语句中使用什么字符集。因此，SETNAMES'utf-8'语句告诉服务器“将来从这个客户端传来的信息采用字符集utf- 8”。它还为服务器发送回客户端的结果指定了字符集(例如，如果你使用一个SELECT语句，它表示列值使用了什么字符集)。

定位问题时常用的技巧

定位中文编码问题通常采用最笨的也是最有效的办法―在你认为有嫌疑的程序处理后打印字符串的内码。通过打印字符串的内码，你可以发现什么时候中文字符被转换成Unicode，什么时候Unicode被转回中文内码，什么时候一个中文字成了两个Unicode字符，什么时候中文字符串被转成了一串问号，什么时候中文字符串的高位被截掉了……

取用合适的样本字符串也有助于区分问题的类型。如："aa啊aa?@aa"等中英相间，GB、GBK特征字符均有的字符串。一般来说，英文字符无论怎么转换或处理，都不会失真(如果遇到了，可以尝试着增加连续的英文字母长度)。

解决各种应用的乱码问题

1)使用标签设置页面编码

这个标签的作用是声明客户端的浏览器用什么字符集编码显示该页面，xxx可以为GB2312、GBK、UTF-8(和MySQL不同，MySQL是 UTF8)等等。因此，大部分页面可以采用这种方式来告诉浏览器显示这个页面的时候采用什么编码，这样才不会造成编码错误而产生乱码。但是有的时候我们会发现有了这句还是不行，不管xxx是哪一种，浏览器采用的始终都是一种编码，这个情况我后面会谈到。

请注意，是属于HTML信息的，仅仅是一个声明，仅表明服务器已经把HTML信息传到了浏览器。

2)header("content-type:text/html;charset=xxx");

这个函数header()的作用是把括号里面的信息发到http标头。如果括号里面的内容为文中所说那样，那作用和标签基本相同，大家对照第一个看发现字符都差不多的。但是不同的是如果有这段函数，浏览器就会永远采用你所要求的xxx编码，绝对不会不听话，因此这个函数是很有用的。为什么会这样呢?那就得说说http标头和HTML信息的差别了：

http标头是服务器以http协议传送HTML信息到浏览器前所送出的字串。而标签是属于 HTML信息的，所以header()发送的内容先到达浏览器，通俗点就是header()的优先级高于(不知道可不可以这样讲)。假如一个php页面既有header("content-type:text/html;charset=xxx")，又有，浏览器就只认前者http标头而不认meta了。当然这个函数只能在php页面内使用。

同样也留有一个问题，为什么前者就绝对起作用，而后者有时候就不行呢?这就是接下来要谈的Apache的原因了。

3)AddDefaultCharset

Apache根目录的conf文件夹里，有整个Apache的配置文档httpd.conf。

用文本编辑器打开httpd.conf，第708行(不同版本可能不同)有AddDefaultCharsetxxx，xxx为编码名称。这行代码的意思：设置整个服务器内的网页文件http标头里的字符集为你默认的xxx字符集。有这行，就相当于给每个文件都加了一行header("content- type:text/html;charset=xxx")。这下就明白为什么明明设置了是utf-8，可浏览器始终采用gb2312的原因。

如果网页里有header("content-type:text/html;charset=xxx")，就把默认的字符集改为你设置的字符集，所以这个函数永远有用。如果把AddDefaultCharsetxxx前面加个"#"，注释掉这句，而且页面里不含header("content- type…")，那这个时候就轮到meta标签起作用了。

下面列出以上的优先顺序：

..header("content-type:text/html;charset=xxx")

..AddDefaultCharsetxxx

..

如果你是web程序员，建议给你的每个页面都加个header("content-type:text/html;charset=xxx")，这样就可以保证它在任何服务器都能正确显示，可移植性也比较强。

4)php.ini中的default_charset配置：

php.ini中的default_charset="gb2312"定义了php的默认语言字符集。一般推荐注释掉此行，让浏览器根据网页头中的charset来自动选择语言而非做一个强制性的规定，这样就可以在同台服务器上提供多种语言的网页服务。

结束语参考：http://wsiyu.com/read.php?tid=1561

其实php开发中的中文编码并没有想象的那么复杂，虽然定位和解决问题没有定规，各种运行环境也各不尽然，但后面的原理是一样的。了解字符集的知识是解决字符问题的基础。不过，随着中文字符集的变化，不仅仅是php编程，中文信息处理中的问题还是会存在一段时间的。

⑸ php中英文字符串为什么能比较大小

是根据内码进行比较，因为字符的内码叫做ASCII，中文内码有有UTF、UNICODE、ANSI等不同标准，和你说的ASCII类似，你可以这样理解。

例子程序和代码：

【编】【程】两个字进行比较的情况如上，当然汉字是两个字节的，上面只显示了格子的第一个字节。

⑹ PHP中文乱码

看看html页面文件本身编码格式是否gbk

用记事本打开html文件，选择另存为，然后在下面可以看到文件编码，改成 ANSI

导航:首页 > 编程语言 > phpasciiunicode

phpasciiunicode

与phpasciiunicode相关的资料