无作为
不仅仅是一种态度!
当前位置: 无作为 » 技术教程 » wordpress技术经验 » WordPress特定的文章屏蔽搜索引擎抓取

WordPress特定的文章屏蔽搜索引擎抓取

有些文章我们并不需要呗搜索引擎收并且被引用,只想留给网站用户查看或者随机的被看见,那么如何实现这一功能了,难道只能通过robots的编辑来提示不抓取吗?那样的话搜索引擎也有可能会直接抓取的。

这里是老文章:WordPress特定文章屏蔽搜索引擎后台添加屏蔽按钮,这里更新了方法也给大家附上!WordPress特定的文章屏蔽搜索引擎抓取

具体怎么实现WordPress 对搜索引擎隐藏特定的文章呢?废话不多说,直接上PHP代码,放到当前主题的functions.php中即可使用(用UTF-8编码另存为):

// 需要说明的是,如果你的WordPress站点开启了页面缓存,此功能无效

function ludouse_add_custom_box() {
 if (function_exists('add_meta_box')) { 
 add_meta_box('ludou_allow_se', '搜索引擎', 'ludou_allow_se', 'post', 'side', 'low');
 add_meta_box('ludou_allow_se', '搜索引擎', 'ludou_allow_se', 'page', 'side', 'low');
 }
}
add_action('add_meta_boxes', 'ludouse_add_custom_box');

function ludou_allow_se() {
 global $post;
 
 //添加验证字段
 wp_nonce_field('ludou_allow_se', 'ludou_allow_se_nonce');
 
 $meta_value = get_post_meta($post->ID, 'ludou_allow_se', true);
 if($meta_value)
 echo '<input name="ludou-allow-se" type="checkbox" checked="checked" value="1" /> 屏蔽搜索引擎';
 else
 echo '<input name="ludou-allow-se" type="checkbox" value="1" /> 屏蔽搜索引擎';
}

// 保存选项设置
function ludouse_save_postdata($post_id) {
 // 验证
 if ( !isset( $_POST['ludou_allow_se_nonce']))
 return $post_id;

$nonce = $_POST['ludou_allow_se_nonce'];

// 验证字段是否合法
 if (!wp_verify_nonce( $nonce, 'ludou_allow_se'))
 return $post_id;

// 判断是否自动保存
 if (defined('DOING_AUTOSAVE') && DOING_AUTOSAVE) 
 return $post_id;

// 验证用户权限
 if ('page' == $_POST['post_type']) {
 if ( !current_user_can('edit_page', $post_id))
 return $post_id;
 }
 else {
 if (!current_user_can('edit_post', $post_id))
 return $post_id;
 }
 
 // 更新设置
 if(!empty($_POST['ludou-allow-se']))
 update_post_meta($post_id, 'ludou_allow_se', '1');
 else
 update_post_meta($post_id, 'ludou_allow_se', '0');
}
add_action('save_post', 'ludouse_save_postdata');

// 对于设置不允许抓取文章和页面
// 禁止搜索引擎抓取,返回404
function do_ludou_allow_se() {
 // 本功能只对文章和页面有效
 if(is_singular()) {
 global $post;
 $is_robots = 0;
 $ludou_allow_se = get_post_meta($post->ID, 'ludou_allow_se', true);

if(!empty($ludou_allow_se)) {
 // 下面是爬虫Agent判断关键字数组
 // 有点简单,自己优化一下吧
 $bots = array(
 'spider',
 'bot',
 'crawl',
 'Slurp',
 'yahoo-blogs',
 'Yandex',
 'Yeti',
 'blogsearch',
 'ia_archive',
 'Google',
 'baidu'
 );
 
 $useragent = $_SERVER['HTTP_USER_AGENT'];
 
 if(!empty($useragent)) {
 foreach ($bots as $lookfor) {
 if (stristr($useragent, $lookfor) !== false) {
 $is_robots = 1;
 break;
 }
 }
 }

// 如果当前文章/页面禁止搜索引擎抓取,返回404
 // 当然你可以改成403
 if($is_robots) {
 status_header(404);
 exit;
 }
 }
 }
}
add_action('wp', 'do_ludou_allow_se');

优化的使用方法

成功添加以上代码到当前主题的functions.php后,我们就可以正常使用了,完全傻瓜式。在WordPress后台文章和页面的编辑页面,右边栏底部我们可以看到这样的选框:WordPress特定的文章屏蔽搜索引擎抓取

如果当前文章/页面需要禁止搜索引擎抓取,勾选即可。勾选后,当此文章/页面被搜索引擎访问时就会返回404状态,无任何内容。如果你不喜欢给搜索引擎返回404,担心死链太多影响SEO,可以将代码中的:

status_header(404);
exit;

改成:

echo "<meta name="robots" content="noindex,noarchive" />\n";

再将:

add_action('wp', 'do_ludou_allow_se');

改成:

add_action('wp_head', 'do_ludou_allow_se');

这样就直接在网页的head部分添加meta声明:

<meta name="robots" content="noindex,noarchive" />

告诉搜索引擎不要索引本页面、不要显示快照。需要注意的是,你的主题目录下的header.php中必须有以下代码:

wp_head();

历史上的今天:

所有免费资源、福利、电影、破解软件未经允许不得转载:www.wuzuowei.net无作为 » WordPress特定的文章屏蔽搜索引擎抓取
分享到: 更多 (0)

来句评论吧! 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

无作为-不仅仅是一种态度

登录/注册文章归档