网络营销知识仓库-第61部分
按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
再采用模拟蜘蛛程序的工具,测试到搜索引擎对该页抓取结果如下:Spidered Text (蜘蛛可识别的文本):Wele 本页使用 FLASH 技术;如果无法正常浏览请下载并 安装插件 或 直接进入 if you are not able to view the animated pleass install plug…in first Spidered Links(蜘蛛可识别的链接):macromedia/shockwave/download/triggerpages/flash。htmlasp…bin/big5/?page=1 (下载 FLASH 插件的链接地址)macromedia/shockwave/download/triggerpages/flash。html因此可以得出结论是:蜘蛛程序没有在这个企业网站首页获得任何有意义的文本内容,也没有获得该 Flash 首页中进入“中文版”“英文版”关键性内容的链接。 FLASH 优化可以从以下三个方面来考虑: 1、做一个辅助 HTML 版本:保留原有 FLASH 版本的同时,还可以设计一个 HTML 格式的版本,这样既可以保持动态美观效果,也可以让搜索引擎通过 HTML 版本的网页来发现网站。 2、将 Flash 内嵌 HTML 文件:还可以通过改变网页结构进行弥补,即不要将整个网页都设计成 Flash 动画,而是将 Flash 内容嵌入到 HTML 文件中,这样对于用户浏览并不会削弱视觉效果,搜索引擎也可以从 HTML代码中发现一些必要的信息,尤其是进入内容页面的链接。即使首页全部动用了 FLASH,也应该将进入内页的关键性按钮/链接置于 FLASH 文件之外,以独立纯文本链接的方式呈现。上文案例将“中文版”链接置于 FLASH 文件中,使得蜘蛛程序一无所获,无法抓取到内页信息。 3、 付费登录搜索引擎:如果 FLASH网站错过了被免费的技术型搜索引擎自动检索的机会,或者搜索结果排名效果不太理想,可以通过付费登录或做搜索引擎关键词广告,同样被用户搜索到。总体上,商业网站应尽量少用 FLASH,站点间进行广告交换时也要避免采用 FLASH广告为上策。表格使用 表格是网页最重要的排版方式。如果某个网页采用了大段的长篇文本,除了可以将一页文本 分成多面,还可以考虑将文本置入不同表格中,这样不仅管理方便,也使得该页加载时每个 表格内容依次加载,这样访问者就可以一边看已下载内容一边等待剩余部分加载,而不是等 待很久之后才一齐加载出来。 表格之内套嵌太多表格也不利于页面加载,因浏览器是先加载完大表格之后再加载内嵌的小 表格,因此内嵌表格会最终降低整页加载速度。 网页减肥 代码设置不妥不仅延长网页加载时间,也严重影响蜘蛛程序对网页内容的抓取。通过对网页 代码进行清减(俗称“网页减肥”),去掉臃肿杂乱的代码,减小网页文件大小,能够加快网 页加载速度,让蜘蛛快速索引到重要内容。正常情况下一个页面的文件大小在 15K 左右,最好不要超过 50K。网页减肥重点涉及以下几个要点: CSS 样式网页制作应通过 CSS(层叠样式表单)来统一定制字体风格,以使代码标准化,避免大量的字体和格式化标签如 h1 /h1 、 font size ×× color ×× /font 充斥页面。通过 css 可以控制任何 HTML 标签的风格。例如 td ; p ; body ; table ; tr ; th 等。只要 在HTML的 head 区内的 style type= text/css 和 /style 之间指定对应标签的风格如字 体,颜色,大小即可,例如: style type= text/css !h2 { font…family: 宋体 ; font…size: 12pt; color: #333366; background…color:#FFCCCC; font…weight: bold}h1 { font…family: Arial ; font…size: 12pt; color: #993300} /style 仅通过以上设置,就把文字的字体、字号、颜色、背景色等统一起来,不用对每段文字单独 进行格式定义,从而减少大量重复性标签。注意把所有 css 文件单独存放在命名为 css 的外部文件中。通过设置 CSS 样式,也可以提升导航文本的美观度,达到与图片导航同样优美观的效果,这点尤其提醒网页设计师注意,没有必要将导航条用图片呈现。 JavaScript:正常情况下,网页尽量以 HTML 作为代码的开始端。但采用 JavaScript 技术的网页往往在页面一开始就堆积大量 JAVA 代码,以至 META 及关键字迟迟不能出现,被推至页面底部,对搜索引擎很不友好。有两种方法可以使之得以改善:1、 将脚本移至页面底部大部分的 JAVA 代码都可以移到页面结束标签之上,而不影响网站功能。这样就能一开始突出关键词,并加快页面加载时间。 2、 将 JAVA 脚本置入一个。js 扩展名的文件。包含你的 JavaScript 的。js 文件通常在网站访问者的浏览器中被缓存下来,使得下次访问 速度加快,也使得网站修改和维护起来更加方便。例:一段 JAVA 代码正常情况下显示如下: script language=JavaScript ! 此处是你的代码,将它们拷贝到一个。js 文件 // /script 忽略开始及结束标签,将中间的代码单独保存为扩展名为。js 的文件,如文件名为 “mycode。js”的一个文件,然后将此文件上传到服务器上与该页同样的目录下。最后将上 文列举的完整的 JavaScript 置换为简单的一行: script language=JavaScript src=mycode。js /script 这样,一个“mycode。js”文件就将大段冗长复杂的 JAVA 代码置换了。工具推荐:网页减肥工具:202。99。237。33/softdown/softdoc/net_opt。htm去除网页中多余 代码,减小网页。第四部分:SEO 指导下的技术支持 对搜索引擎最友好(Search Engine Friendly)的网页是静态网页,但大部分内容丰富或互 动型网站都不可避免采用到相关技术语言来实现内容管理和交互功能。SEO 思想指导下的技术支持,主要是对特定代码的优化和对动态网页进行静态处理的措施。 Title 和 Meta 标签 以。html 或。htm 为扩展名的 HTML文档称为静态网页。Meta 称为元标志,用于网页的<head >与</head>中。Meta 标签的用处很多,目前几乎所有的搜索引擎机器人都通过自动查找 Meta 值来给网页分类,是籍此判断网页内容的基础。其中最重要的是 description(网站描 述)和 keywords(网站关键词)。另外一个基本的属性是 Title 标签,提示搜索引擎关于本 页的主题。Meta 和 Title 的形式在 html 语言中体现为: head title title 标题 /title meta name= keywords content= 网页描述 meta name= description content= 关键词 /head 尽管Meta本身不足以解决排名问题,但对Meta标签的书写仍然是搜索引擎优化的基础工作。 清晰准确的 Meta 文字与正文内容的关键词相呼应,是排名加分的重要条件之一。标题(Title):网页优化可以说是从 Title 开始的。在搜索结果中,每个抓取内容的第一行显示的文字就是 该页的 Title,同样在浏览器中打开一个页面,地址栏上方显示的也是该页的 Title。因此, Title 可谓一个页面的核心。对 Title 的书写要注意以下问题:1、title 简短精炼,高度概括,含有关键词,而不是只有一个公司名。但关键词不宜过多, 不要超过 3 个词组。企业网站的 title 通常以公司名+关键词为内容2、前几个词对搜索引擎最重要,因此关键词位置尽量靠前。3、最好将 title 组织成符合语法结构和阅读习惯的短句或短语,避免无意义的词组罗列式title 关键词(Keywords):Keywords 提示搜索引擎:本网站内容围绕这些词汇展开。因此 keywords 书写的关键是每个词都能在内容中找到相应的匹配才有利于排名。Meta 中的关键词书写技巧见前文的“关键词策略”。 描述(Description):描述部分用简短的句子告诉搜索引擎和访问者关于本网页的主要内容。用该网站的核心关键 词搜索后得到的搜索结果中,描述往往显示为标题后的几行描述文字。Description 一般被 认为重要性在 title 和 keywords 之后。描述的书写要注意以下问题: 1、 描述中出现关键词,与正文内容相关2、 同样遵循简短原则,字符数含空格在内不要超过 200 个字符3、 补充在 title 和 keywords 中未能充分表述的说明其它 Meta 标签:为了限制搜索引擎对内容的抓取,可以采用以下几个Robots Meta 标签:<meta name= Robots content= all|none|index|noindex|follow|nofollow > 其中:all:文件将被检索,且页面上的链接可以被查询; none:文件将不被检索,且页面 上的链接不可以被查询;index:文件将被检索;follow:页面上的链接可以被查询;noindex: 文件将不被检索,但页面上的链接可以被查询;nofollow:文件将不被检索,页面上的链接 可以被查询。但并不是所有的搜索引擎都支持 meta 中的robots 标签,但是所有搜索引擎都支持一个功能更强的 robots。txt 的文本文件来达到上述功能(关于 robots。txt 文件应用的介绍,E 书专家平文胜曾专门撰文详细解说“robots。txt 和Robots META标签”)。其它常用 meta标签还有: META name author 网站作者 META name classification 网站所属目录类别 META name copyright 版权声明 META name generator 网站用什么软件做的首页、重要的内页的 title 和 meta 标签最好分别书写,针对栏目主题体现不同的内容。 动态网页优化 动态网站是指网站内容的更新和维护是通过一个带有数据库后台的软件,即内容管理系统 (CMS)完成。一般采用 ASP,PHP,Cold Fusion,CGI等程序动态生成页面。动态页面在网络空间中实际并不存在,它们的大部分内容通常来自与网站相连的数据库,只有接到用户的请求,在变量区中输入一个值以后才会生成。动态网页扩展名显示为。asp、。php、cfm 或。cgi,而不是静态网页的。html或者。htm。其 URL 中通常出现“?”、“=”、“%”,以及“&”、“”等符号。网站使用动态技术的好处,除了增加网站交互功能,还具有容易维护和更新的优点,因此为许多大中型网站采用。 但大多数搜索引擎的蜘蛛程序都无法解读符号“?”后的字符。这就意味着动态网页很难被 搜索引擎检索到,因而被用户找到的机会也大为降低。因此,建设网站之前首先要端正思想, 即能够采用静态表现的网页尽量不要用动态实现,重要的网页用静态表现。同时使用技术将 动态网页转化成静态网页形式,使 URL 中不再包含“?”“=”等类似的符号。也可以通过对网站进行一些改动,间接增加动态网页的搜索引擎可见度。即坚持“动静结合,以静制动”的原则。 不同技术的解决方案:针对不同程序开发的动态网页有着相应的解决方案。以下是作者 Karen 编译的部分内容:1、CGI/ Perl 如果你在网站中使用的是 CGI 或者 Perl,可用一个脚本拾取环境变量前的所有字符,再将 URL 中剩余的字符赋值给一个变量。这样,你就可以在 URL 中使用该变量了。不过,对于那些内置了部分 SSI(Server…Side Include:服务器端嵌入)内容的网页,主要 的搜索引擎都能够提供索引支持。那些以。shtml 为后缀名的网页也被解析成 SSI 文件,相 当于通常的。html 文件。但如果这些网页在其 URL 中使用的是 cgi…bin路径,则仍有可能不被搜索引擎索引。 2、ASPASP(Active Server Pages: Web 服务器端动态网页开发技术)被用于基于微软的网络服务器 中。使用 ASP 开发的网页,一般后缀名为。asp。只要避免在 URL 中使用符号“?”,大多数搜索引擎都能够支持用 ASP 开发的动态网页。 3、Cold Fusion如果你使用的是 Cold Fusion,那么你就需要在你的服务器端重新对其进行配置,使其能够 将一个环境变量中的符号“?”用符号“/”代替,并将替换后的数值传给 URL。这样一来, 最后到达浏览器端的就是一个静态的 URL 页。当搜索引擎对该转换后的文件进行检索时,它不会遭遇“?”,因而可继续对整个动态页的索引,从而使你的动态网页对搜索引擎仍然具有可读性。 4、Apache 服务器:Apache 是最流行的 HTTP服务器软件之一。它有一个叫做 mod_rewrite 的重写模块,即 URL 重写转向功能。该模块能够使你将包含环境变量的 URL 转换为能够为搜索引擎支持的 URL 类型。对于那些发布后无须多少更新的网页内容如新闻,可采用该重写转向功能。 建立静态入口:在“静动结合,以静制动”的原则指导下,还可以通过对网站做一些修改,尽可能增加动态 网页的搜索引擎可见度。如将动态网页编入静态主页或网站地图的一个链接中,以静态目录 的方式呈现该动页面。或者为动态页面建立一个专门的静态入口页面(gateway/entry),链 接到动态页面,然后将静态入口页面递交给搜索引擎。对一些重要的、内容相对固定的页面制作为静态网页,如包含有丰富关键词的网站介绍、用 户帮助;以及含有重要页面链接的网站地图等。网站首页尽量全部采用静态形式,并将重要 动态内容以文本链接方式全部呈现,虽然增加了维护工作量,但从 SEO 的角度看是值得的。也可以考虑为你的重要动态内容创建静态的镜象网站。 付费登录搜索引擎:当然,对于整个网站都采用与数据库相连的内容管理系统(CMS)发布的动态网站而言,提高搜索引擎可见度的最直接办法就是进行付费登录,直接提交动态网页到搜索引擎目录,或做关键字广告,保证网站被搜索引擎收录。 搜索引擎对动态网站支持的改进 搜索引擎一直在提高自己对于动态页面的支持。到目前为止,GOOGLE、HOTBOT 和百度等开始尝试抓取动态网站页面(甚至包括 URL 带 ? 的页面)。但这些搜索引擎抓取动态页面时为了避免 搜索机器人陷阱 (spider traps,脚本错误,这种错误会让搜索机器人进行无限