完美解决All in One SEO Pack对中文支持不友好的问题

登录

标签搜索

Jonty

累计撰写 292 篇文章
累计收到 999 条评论
今日撰写 0 篇文章

首页
/
正文

完美解决All in One SEO Pack对中文支持不友好的问题

Jonty

2015-01-05 / 2 评论 / 92 阅读 / 正在检测是否收录...

01/05

AI摘要：修改All in One SEO Pack代码可解决中文支持问题，通过替换特定函数代码，支持UTF-8编码的中文描述生成。

大家都知道All in One SEO Pack是wordpress的一个搜索引擎优化的插件，但它对中文支持不友好。修改它的代码可以完美支持中文。
All in One SEO对英文支持很好的。因为它只考虑的单字节语言的情况，没有考虑多字节(例如中文等非英文的语言)的情况。

问题介绍

All in One SEO Pack只截取英文空格(" ")之前的内容作为description(描述)的内容，但是我们写中文博客，多数不会在文章中出现英文空格，更别说在开头的恰当位置了，所以中文博客用它就就悲剧了，只生成很短的描述，甚至不生成描述。

解决方法(最新版)

在{wordpress目录}/wp-content/plugins/all-in-one-seo-pack/aioseop.class.php文件中搜索function trim_excerpt_without_filters方法，类似这样的：

```css

function trim_excerpt_without_filters( $text, $max = 0 ) {
$text = str_replace( ']]>', ']]>', $text );
$text = preg_replace( '|\[(.+?)\](.+?\[/\\1\])?|s', '', $text );
$text = wp_strip_all_tags( $text );
if ( !$max ) $max = $this->maximum_description_length;
$len = $this->strlen( $text );
if ( $max < $len ) {
if ( function_exists( 'mb_strrpos' ) ) {
$pos = mb_strrpos( $text, ' ', -($len - $max) );
if ( $pos === false ) $pos = $max;
if ( $pos > $this->minimum_description_length ) {
$max = $pos;
} else {
$max = $this->minimum_description_length;
}
} else {
while( $text[$max] != ' ' && $max > $this->minimum_description_length ) {
$max--;
}
}
}
$text = $this->substr( $text, 0, $max );
return trim( stripslashes( $text ) );
}
```

使用下面的代码替换掉上面的代码即可。

```css

function trim_excerpt_without_filters( $text, $max = 0 ) {
$text = str_replace( ']]>', ']]>', $text );
$text = preg_replace( '|\[(.+?)\](.+?\[/\\1\])?|s', '', $text );
$text = wp_strip_all_tags( $text );
if ( !$max ) $max = $this->maximum_description_length;
$len = $this->strlen( $text );
if ( $max < $len ) {
if ( function_exists( 'mb_strrpos' ) ) {
$pos = mb_strrpos( $text, ' ', -($len - $max) );
if ( $pos === false ) $pos = $max;
if ( $pos > $this->minimum_description_length ) {
$max = $pos;
} else {
$max = $this->minimum_description_length;
}
} else {
while((ord($text[$max]) & 0x80) != 0 && (ord($text[$max]) & 0x40) == 0
&& $max > $this->minimum_description_length ) {
$max--;
}
}
}
$text = $this->substr( $text, 0, $max );
return trim( stripslashes( $text ) );
}
```

解决原理

wordpress的博客多数都是UTF8格式的，那么我们只需要研究下UTF8格式就好了，当然如果使用gbk或者跟utf8不兼容的格式，那么这个方法是不可行的。

UTF-8是一种变长的编码方式。它可以使用1~4个字节表示一个符号(字)，根据不同的符号而变化字节长度。
UTF-8的编码规则很简单，只有二条：

对于单字节的符号，字节的第一位设为0，后面7位为这个符号的unicode码。因此对于英语字母，UTF-8编码和ASCII码是相同的。
对于n字节的符号（n>1），第一个字节的前n位都设为1，第n+1位设为0，后面字节的前两位一律设为10。剩下的没有提及的二进制位，全部为这个符号的unicode码。

下表总结了编码规则，字母x表示可用编码的位。

```css

Unicode符号范围 | UTF-8编码方式
(十六进制) | （二进制）
--------------------+---------------------------------------------
0000 0000-0000 007F | 0xxxxxxx
0000 0080-0000 07FF | 110xxxxx 10xxxxxx
0000 0800-0000 FFFF | 1110xxxx 10xxxxxx 10xxxxxx
0001 0000-0010 FFFF | 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx

```
那么我们只要以一个字的第一个字节处结束(不包含该字节)就能获取完整的字符串了，也不会有乱码产生。
从上面的编码规则可以看出，如果一个字节的最高位为0，或者前两个高位都为1，那么这个字节一定是一个字的第一个字节。

本文共 542 个字数,平均阅读时长 ≈ 2分钟

广告

0

打赏

technology

版权属于：本文由—→Jonty←—发布，转载请标明出处！！！

本文链接： https://nobb.cc/2015-01-05-2105.html

文章转载：

作品采用：《署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0)》许可协议授权。

相关推荐

WordPress 一键生成填写评论信息的代码

WordPress 一键生成填写评论信息的代码

WordPress无插件反垃圾评论：小墙

WordPress无插件反垃圾评论：小墙

vb截包,发包知识及三大利器的使用

vb截包,发包知识及三大利器的使用

wordpress添加贴心欢迎语

wordpress添加贴心欢迎语

评论 (2)

密语

语录

取消

神父 Lv.3 中国陕西省西安市百度网讯科技西安电信互联网节点
·
Windows 7 / Google Chrome 沙发

特么高深的技术

2015-01-05 回复删除垃圾
1. gkroot Lv.6 中国河南省郑州市北京百度网讯科技有限公司联通节点(BGP)
  ·
  iOS 8.1.2 / UC 浏览器
  
  @ 神父
  
  @神父 ....作者牛逼
  
  2015-01-05 回复删除垃圾