在任意字符集下正常显示网页的方法

原创作品,转载请注明出处。

通常情况下,我们的网页要指定一个编码字符集,如 GB2312、UTF-8、ISO-8859-1 等,这样我们就可以在网页上显示我们指定编码的文字了。但是我们很可能会遇到这种情况,那就是我们可能希望在 ISO-8859-1 编码的网页上显示汉字,或者在 GB2312 编码的网页上显示韩文等。当然一种解决办法就是我们不用 ISO-8859-1 或者 GB2312 编码,而统统都采用 UTF-8 编码,这样我们只要在这种编码下,就可以混合显示各国文字了,这是现在很多网站采用的方法。

而我这里所说的并非上面这种方法,因为上面这种方法必须要指定字符集为 UTF-8 才可以,一旦用户手工指定为其他字符集,或者可能因为某些原因,那个字符集设置没起作用,而浏览器又没有正确自动识别的话,我们看到的网页还是乱码,尤其是在某些用框架作的网页中,某个框架中的页面如果字符集设置没起作用,在 firefox 中显示乱码而且还没法改变(我是说在不装RightEncode插件的情况下)。

而我这里介绍的方法即使是把网页指定为 ISO-8859-1 字符集,也能够正确显示汉字、日文等。原理很简单,就是把除了 ISO-8859-1 编码中前128个字符以外的所有其他的编码都用 NCR(Numeric character reference) 来表示。比如“汉字”这两个字,如果我们写成“汉字”这种形式,那么它在任意字符集下都可以正确显示。根据这个原理,我写了下面这个程序,它可以把现有的网页转化为在任意字符集下都能显示的网页。你只需要指定源网页的字符集和源网页,点提交按钮,就可以得到目标网页了。你也可以只转化某些文字,只需要把文字填写到文本框中,并指定这些文字原来的字符集,点提交按钮,就会在页面上面显示编码后的文字了。另外我还编写了 WordPress 的插件,现在我的 Blog 已经可以在任意字符集下都能正确显示了。

转化程序地址:http://test.coolcode.cn/nochaoscode/

nochaoscode.php
  1. <?php
  2. function nochaoscode($encode, $str, $isemail = false) {
  3.     $str = iconv($encode, "UTF-16", $str);
  4.     for ($i = 0; $i < strlen($str); $i++,$i++) {
  5.         $code = ord($str{$i}) * 256 + ord($str{$i + 1});
  6.         if ($code < 128 and !$isemail) {
  7.             $output .= chr($code);
  8.         } else if ($code != 65279) {
  9.             $output .= "&#".$code.";";
  10.         }
  11.     }
  12.     return $output;
  13. }
  14. $encode = $_POST['encode'];
  15. if ($encode == '') $encode = 'UTF-8';
  16. if ($_FILES['file']['size'] > 0) {
  17.     $data = nochaoscode($encode, file_get_contents($_FILES['file']['tmp_name']));
  18.     header ("Content-type: application/octet-stream;");
  19.     header ("Content-length: ".strlen($data));
  20.     header ("Content-Disposition: attachment; filename=".$_FILES['file']['name']);
  21.     echo $data;
  22. } else {
  23.     header ("Content-type: text/html; charset=UTF-8");
  24.     if ($_POST['email']) {
  25.         echo htmlentities(nochaoscode($encode, $_POST['email'], true));
  26.     }
  27.     else {
  28.         echo htmlentities(nochaoscode($encode, $_POST['content']));
  29.     }
  30. ?>
  31. <form enctype="multipart/form-data" method="POST">
  32. encode: <input type="text" name="encode" value="UTF-8" /><br />
  33. file: <input type="file" name="file" /><br />
  34. <input type="submit" />
  35. </form>
  36. <form method="POST">
  37. encode: <input type="text" name="encode" value="UTF-8" /><br />
  38. content: <textarea name="content"></textarea><br />
  39. <input type="submit" />
  40. </form>
  41. <form method="POST">
  42. encode: <input type="text" name="encode" value="UTF-8" /><br />
  43. email: <input name="email" /><br />
  44. <input type="submit" />
  45. </form>
  46. <?php
  47. }
  48. ?>

标签: PHP

« 上一篇 | 下一篇 »

只显示10条记录相关文章

1 条回复至 "在任意字符集下正常显示网页的方法" 的评论

每个人都有一道伤口 或深或浅,盖上布,[www.bjkz010.com]以为不存在。 我把最殷红的鲜血流在那里。

北京刻章 于 2011-08-03 07:16:08 提交#1


发表评论

评论 (必须):