移动网站搜索引擎优化(SEO)

概述

无论是PC时代还是移动时代,网站的获客渠道都离不开搜索引擎。无论是全网还是内网,爬虫和搜索引擎提供的功能已经比较先进,并且不同厂商的基本策略也很相似。以下便是一些针对移动网站SEO通用法的归纳。

移动站分类

移动站大致有以下三种实现:
1. 自适应(RWD):利用响应式设计实现1个页面,1套代码2端呈现。
2. 动态响应内容:即在浏览器接收到request后根据UA等信息判断,自动返回不同的页面,通常是1个页面,2套代码,2端呈现。
3. 独立网站:PC站、移动站完全两套代码,即2个页面,2套代码,2端呈现。
(以上,简单以PC、移动这两端为例。而更加广义的跨屏可能涉及多端的呈现。)

自适应(RWD)

因为一套代码适应多端,网络爬虫只抓取一套页面。
对于站点下的页面,至少需要做到:
1. 使用 meta name=”viewport” 标记告知浏览器如何调整内容

<meta name="viewport" content="width=device-width, initial-scale=1.0">
  1. 对于自适应图片,添加 元素。

动态响应内容

服务器端通常都具备这个功能,即动态响应内容,这个功能让服务器根据请求相应网页的用户代理,通过同一网址提供不同的HTML内容。
当使用PC的Useragent进行抓取时,移动设备内容会处于“隐藏”状态,因此,需要在服务端使用 Vary HTTP 标头。
Vary HTTP 标头的作用:
1. 它会向在 ISP 和其他位置中使用的缓存服务器表明:在决定是否要通过缓存来提供网页时,它们应考虑用户代理。如果网站没有使用 Vary HTTP 标头,缓存可能会错误地向移动设备用户提供PC版 HTML 网页的缓存内容(或向PC用户提供移动版 HTML 网页的缓存内容)。
2. 它有助于网络爬虫更快速地发现针对移动设备进行了优化的内容。

GET /page-1 HTTP/1.1
Host: www.example.com
(...rest of HTTP request headers...)

HTTP/1.1 200 OK
Content-Type: text/html
Vary: User-Agent
Content-Length: 5710
(... rest of HTTP response headers...)

Vary 标头会告知浏览器响应的内容将根据请求相应网页的用户代理而异。

用户代理嗅探

由以上内容带来了一个问题,就是如何正确地监测Useragent信息,有以下几点需要注意:
1. UA检测当然是以Useragent字段(字符串)为依据的检测,通过对已有数据的掌握,我们可以做一个列表保存这些UA检测的规则,以便于未来的甄别。这个列表需要经常维护,说白了就是要与时俱进。当然成本并不高。
2. UA存在普通化、仿冒等可能,例如一些网络爬虫会以iPhone为代理,如果网站针对爬虫和普通UA展示的内容不一样,一定要切记,页面内容的差异不应太大。否则可能会构成欺骗。

独立网站

由于某些因素导致先有PC站,再有移动站,这种情况很常见。但前提是PC和移动站要有内容的可对应关系,而不是完全不同的业务和内容。
无论这些移动站叫wap版还是3g版,亦或者mobile版,其实都是时代的产物。
通常,一个PC站 www.example.com 对应一个 移动站 m.example.com (当然可以采用别的子域名)。
我们要做的,就是在PC站和移动站之间建立好关系:
1. 通过包含 rel=”canonical” 和 rel=”alternate” 元素的 标记表明两个网址之间的关系
– 在PC网站,添加指向对应移动版网址的特殊 link rel=”alternate” 标记。
– 在移动版网页上,添加指向对应桌面版网址的 link rel=”canonical” 标记。

<!-- 在桌面版网页 (http://www.example.com/page-1) 上,添加: -->
<link rel="alternate" media="only screen and (max-width: 640px)"
 href="http://m.example.com/page-1">

<!-- 在移动版网页 (http://m.example.com/page-1) 上,所需的注释应为: -->
<link rel="canonical" href="http://www.example.com/page-1">

移动版网址中指向桌面版网页的 rel=”canonical” 标记是必需的。(敲黑板)

某些搜索引擎支持sitemap文件定义rel属性,也可以达到同样的效果。

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:xhtml="http://www.w3.org/1999/xhtml">
<url>
<loc>http://www.example.com/page-1/</loc>
<xhtml:link
rel="alternate"
media="only screen and (max-width: 640px)"
href="http://m.example.com/page-1" />
</url>
</urlset>

中国的搜索引擎厂商,一般使用“移动适配”规则来处理此类问题。

https://www.example.com/detail/(\d+) https://m.example.com/detail/\1 

通过一个支持正则表达式的规则列表,让PC网址与移动端网址一一对应,子路径未必相同,因为可以通过正则变量匹配。但理论上,这些路径应该遵循简单路径的设计规范。

另外还有几点要注意:
– 在使用 rel=”alternate” 和 rel=”canonical” 标记时,请在移动版网页及其对应的桌面版网页之间保持 1:1 的比率。尤其要避免添加会让多个桌面版网页引用一个移动版网页的注释(反之亦然)。
– 仔细检查重定向,确保桌面版网页不会意外重定向到一个不相关的移动版网页。
否则多对多的关系会造成搜索引擎建立页面关系出现混乱,影响页面的搜索排名。

  1. 自动重定向
    如果将网站配置为使用不同网址向PC浏览器和移动设备浏览器提供内容,则需要将用户自动重定向至最符合用户需求的网址。如果网站使用了自动重定向,务必像对待其他任何UA一样对待搜索引擎的UA。这一点跟上一节内容的用户代理嗅探类似。

重定向方法:
– HTTP 重定向:推荐使用302状态码,其次是可以使用301状态码。重定向时要与link rel=”alternate” 标记或站点地图中指定的替代网址保持一致。
– JavaScript 重定向,即利用JS检测后实现跳转。规则与HTTP 重定向相同。

重定向策略,如果PC端UA可以访问到PC和移动端两种网站页面,这叫单向重定向,如果 PC只能访问PC,移动端只能访问移动网站,那么叫双向重定向。这里建议:
– PC 可以访问 PC网页 和 移动网页,不用进行自动重定向
– 移动可以访问 PC网页 和 移动网页,但对访问 PC 网页做自动重定向,除非移动端用户执意要访问PC版。

其他策略

robot.txt

通常在网站根目录下,安放robot.txt,允许或者组织网络爬虫访问一些路径,这个配置要正确。

sitemap

移动站可以独立维护一套sitemap,通过各类搜索引擎提供的工具提交这样的sitemap。比如,搜狗搜索引擎站长平台,神马搜索引擎站长平台等。
当然,如果这些搜索引擎足够专业的话,会对响应式网站(RWD)提供支持。

总结

SEO 涵盖的范围很广,包括TDK的技巧、站内结构、内外外链影响、热词和长尾词优化等。但首先要做的就是基础的工作,才能达到最佳的效果。
另外虽然现在已经是大移动时代,有ASO,甚至公众号、小程序搜索优化,但基本万变不离其踪,以下几条与众共勉:
1. 开放面对全网,充分利用资源。
2. 紧追市场变化,了解各大厂商的战略和意图。
3. 积极合作,拓展渠道。
4. 打造好的产品,内容、用户体验、技术指标等要达到业内均值以上。
5. 真正为用户着想。
(以上5条不分先后)

发表评论

电子邮件地址不会被公开。 必填项已用*标注