5个Web文件可以改善你的网站

WebFX总统。Bill在互联网营销行业有超过25年的经验,专门从事SEO, UX,信息架构,营销自动化等。William在Shippensburg和MIT的科学计算和教育背景为cloudfx和WebFX的其他关键研究和开发项目的营销提供了基础。

5个Web文件可以改善你的网站

开发人员经常遇到的代码数量是惊人的。在任何时候,一个站点都可以利用五个以上的不同网络语言(例如MySQL, PHP, JavaScript, CSS, HTML)。

有许多鲜为人知和未被充分利用的方法来增强您的网站简单但强大的文件。这篇文章的目的是强调这些无名英雄中的五个,它们可以帮助你的网站。它们非常容易使用和理解,因此,可以成为你部署或当前运行的网站的重要补充。

概述

我们将检查(并生成)哪些文件?决定覆盖哪些文件对我来说当然不是一件容易的事,还有许多其他文件(如.htaccess,我们不会涉及)你可以执行,这可以为你的网站提供提升。

我将在这里讨论的文件之所以被选中,是因为它们既有用又易于实现。对我们来说是最大的收获。

我们要去掩护Robots.txt, favicon.ico, sitemap.xml,都柏林。rdf和opensearch.xml。它们的目的包括帮助搜索引擎准确地索引你的网站,作为可用性和互操作性的辅助。

让我们从最熟悉的一个开始:robots.txt。

robots . txt

txt文件的主要功能是声明站点的哪些部分应该禁止爬行。

根据定义,该文件的使用作为选择退出的过程。如果你的网站上没有robots.txt目录,默认情况下,这是一个公平的游戏网络机器人比如搜索引擎爬虫来访问和索引。

虽然您可以在HTML文档中通过使用元标记(),通过单个文本文件控制省略页面的好处是增加了维护的便利性。

注意:值得一提的是,遵守robots.txt文件并不是强制性的,所以它是这不是一个好的隐私机制。

robots . txt这就是robots.txt文件在搜索引擎和网站之间的交互方式。

创建Robots.txt文件

要创建robots.txt文件,首先需要一个文本编辑器。同样值得指出的是,应该调用该文件robots . txt(或者它不会工作),它需要存在于你的网站的根目录,因为默认情况下,那是web机器人寻找文件的地方。

接下来我们需要做的是找出搜索引擎蜘蛛要遵循的指令列表。在许多方面,robot.txt的结构与CSS相似,因为它由指定规则的属性和值对组成。

另一件需要注意的事情是,可以在robots.txt文件中包含注释,在注释之前使用#(哈希)字符。这对于记录您的工作很方便。

这里有一个基本的例子,告诉网络机器人不要爬/成员//私人的/目录:

用户代理:*不允许:/成员/禁止:/私人的/

robots.txt排除标准只有两个指令(还有一些非标准指令,如Crawl-delay我们很快就会讲到)。

第一个标准指令是用户代理.每个robots.txt文件应该以声明一个用户代理值,它解释了文件适用于哪些web机器人(如搜索爬虫)。

使用为了…的价值用户代理指示所有的web机器人应该遵循文件中的指令;表示通配符匹配。

不允许指示指向服务器上不应该访问的文件夹。指令可以指向一个目录(例如:/ myprivatefolder /)或某一特定文件(即/myfolder/folder1/myprivatefile.html).

robots.txt有一个规范,但规则和语法非常简单。robots.txt有一个规范,但规则和语法非常简单。

robots . txt标准指令

当然,虽然有一个搜索引擎和文件的列表,你想隐藏是有用的,有一些非标准的扩展robots.txt规范,将进一步提高它的价值,你和你的网站。尽管这些都是非标准指令主要的搜索爬虫承认并支持他们。

一些更流行的非标准指令是:

  • 网站地图:你的Sitemap.xml文件是
  • 允许:相反的不允许
  • 爬网延迟:设置爬行器可以发出的服务器请求之间的秒数

还有其他不太受支持的指令,比如访问时间,这将限制网络机器人仅在一天中的特定时间内为您的网站编制索引。

下面是一个使用非标准指令的更复杂的robots.txt文件的例子:

我爱你谷歌,进来吧!爬行延迟:10请求速率:1/10m每10分钟一页访问时间:0500-1300#军事时间格式

虽然不是标准,但robots.txt有一个主流支持的扩展。虽然不是标准,但robots.txt有一个主流支持的扩展。

Favicon.ico

favicon(“收藏夹图标”的缩写)是代表一个网站的小图像(像桌面应用程序的快捷方式)。

显示在浏览器的地址栏,favicon给你一个独特的机会,以一种方式,将身份添加到浏览器的收藏/书签(本地和通过社交网络)。

这个文件的优点在于,每个主流浏览器都内置了对它的支持,因此它是一个可靠的额外文件。

这就是favicon.ico文件通过浏览器对网站产生视觉影响的方式。这就是favicon.ico文件如何通过浏览器(如IE)在视觉上影响你的网站。

创建Favicon.ico文件

要创建一个图标,你需要一个图像或图标编辑器。我是它的粉丝Axialis IconWorkshop,但也有免费编辑喜欢IcoFX这项工作做得很好。

您还可以通过查看此链接找到许多免费的在线favicon工具网页favicon生成器的列表

您需要有一个16x16px图标(或32x32px,按比例缩小),以匹配您希望在浏览器中看到的内容。

一旦你完成了你的图标的设计,将文件保存为“favicon.ico”在你的web服务器的根目录(浏览器默认会在那里寻找它)。

注意:使用.ico文件类型是个好主意,因为有些浏览器不支持PNG、GIF或JPEG文件类型。

要使此文件正常工作,请在< >头所有HTML文档的标签,如:

  <头>

rel“快捷图标”或“图标”的属性值被认为是可接受的,MIME类型为“vnd.microsoft. exe”。我con” (as of 2003) replaced the older type (“image/x-icon”) as the official standardized favicon MIME type for .ico files on the web.

注意:虽然Internet Explorer(和其他一些浏览器)默认情况下会主动在站点的根目录中寻找您的图标(这就是为什么您应该在那里有它),但值得将上述代码添加到< >头,以使其他类型的浏览器代理明确地知道它。

有多种在线工具可以创建一个favicon从现有的图像。有多种在线工具可以创建一个favicon从现有的图像。

苹果设备中的图标

另一种(类似的)标准出现在了苹果的iPod、iPad和iPhone上。在这种情况下,你可以提供57×57 PNG, ICO或GIF文件(alpha透明度支持),可以使用网络剪辑功能在设备的主屏幕上显示。

苹果还建议你使用90度角(不是圆角,设备会自动为你做圆角)来保持这些图标的“感觉”。

要使此文件正常工作,请将以下代码放入您的< >头标签:

   .png

对于苹果设备的用户,可以制作一个特别制作的“图标”。对于苹果设备的用户,可以制作一个特别制作的“图标”。

Sitemap.xml

网站所有者担心的一件事是让他们的网站被像谷歌这样的主要搜索引擎正确索引。

当robots.txt文件解释您希望从结果中排除哪些文件时,Sitemap.xml文件列出了站点及其页面的结构。它让搜索引擎爬虫知道你网站上的东西在哪里。

这就是Sitemap.xml文件在搜索引擎和您的网站之间交互的方式。这就是Sitemap.xml文件在搜索引擎和您的网站之间交互的方式。

与往常一样,生成Sitemap的第一个建议步骤是创建包含其代码的XML文件。建议您将该文件命名为“sitemap.xml”,并在网站的根目录中提供它(因为一些搜索引擎会自动在那里寻找它)。

同样值得注意的是,虽然您可以直接向搜索引擎提交Sitemap文件位置,但添加非标准的网站地图给robots.txt文件的指令可能很有用,因为它得到了广泛的支持,可以推动蜘蛛向正确的方向前进。

下面是站点地图的基本示例。

<?xml version = " 1.0 " encoding = " utf - 8 " ?> index.html contact.html 

每个站点地图文件都以一个文档类型定义(DTD)开始,该定义说明该文件是UTF-8编码的,用XML编写,并使用官方网站地图模式

按照这些程序,您只需生成一个存在于网站结构中的URL列表。

每个URL必须包含在两个元素中:< url >< loc >.这是一个非常简单的规范,因此,即使缺乏经验的开发人员也应该能够用很少的努力复制这个基本机制。

要在HTML文档中引用站点地图,请将此代码放在< >头标签:

   .xml

就像大多数基于xml的模式一样,需要遵循协议和规范。就像大多数基于xml的模式一样,需要遵循协议和规范。

其他站点地图标记

虽然您可以限制自己只列出每个文件,但还有许多其他元信息可以包含在< url >标记来帮助进一步定义爬行器如何处理或处理站点中的每个页面,而这正是站点地图真正的威力所在。

您可以使用< lastmod >,例如,声明资源最后一次修改的时间(使用YYYY-MM-DD格式)。你可以添加< changefreq元素>,它使用总是每小时每天每周每月每年的,从来没有建议网页更改的频率(例如,六次修订的首页的值为每天).

还有< >优先标记,它使用0.0到1.0的比例,您可以利用该比例指示网页对网站的重要性。

下面是使用上述标记的示例:

< lastmod > 2010-05-13 < / lastmod > < changefreq >每月< / changefreq > <优先> 0.8 > < /优先

谷歌允许你提交你的站点地图来开始分析你的站点结构。谷歌网站管理员工具允许你提交你的网站地图,开始分析你的网站结构。

Dublin.rdf

确保你提供元数据已经成为一个大业务搜索引擎优化专业人士和语义学倡导者。适当使用HTML、元数据、微格式和编写良好的内容可以提高出现在正确搜索结果中的机会。它们还允许越来越多的浏览器和社交网络聚合和过滤数据,以便它们能够准确地理解你的内容所代表的内容。

都柏林。RDF文件充当官方认可的元元素的容器(由DCMI规范),可以增加您提供的媒体的语义价值。

如果你曾经去过图书馆并试图找到一本书,你就会知道你经常不得不浏览图书馆的目录,根据它们的主题、作者,甚至是书名来找到书。DCMI的目的是为您的网站生成这样一个参考卡,它将帮助搜索引擎、社交网络、web浏览器和其他web技术了解您的网站是什么。

这就是都柏林。RDF文件与支持社交网络的媒体交互。这就是都柏林。RDF文件与支持社交网络的媒体交互。

创建一个都柏林。rdf文件

首先,需要生成文件本身(我们将其命名为“Dublin.rdf”)。为了保持关于站点的一致元细节(相对于针对特定页面和资源的单个DCMI元标记),我们应该创建一个RDF文件(格式化为XML)在HTML文档中有一个引用,表示信息可用。虽然您可以在HTML中嵌入DCMI元标记,但RDF允许您缓存数据。

这就是OpenSearch文件通过浏览器与站点交互的方式。

当支持爬行器或其他确认DCMI核心的资源看到文件时,它们可以缓存并直接与信息关联。

这并不意味着不应该使用传统的元标记,但该文件可以作为有用的补充。

<?xml version = " 1.0 " ?>  Your Name 2008-07-26 This is my website. EN Company http://www.yoursite.com/  

与大多数XML文件一样,这个RDF文档有一个DTD——在DTD中,您有一个description元素(它链接到被引用的资源)。

从上面可以看到,在描述中有几个元素(以前缀dc:) -这些保存页面的元数据。

您可以添加一系列术语(参见以下列表DCMI元数据术语),只需添加术语的名称,然后给出DCMI规范所表示的值。您将得到一个有用的数据库,它可以改进您的站点的语义以及与其他站点和应用程序的互操作性!

要使该文件正常工作,请将下列代码放入< >头标签:

  < >头

这就是OpenSearch文件通过浏览器与站点交互的方式。都柏林。rdf文件利用DCMI规范来提供元信息。

OpenSearch.xml

搜索网站的能力是人们定位内容的最重要方式之一。

OpenSearch文件允许您添加自定义搜索引擎列表(在您自己的网站上),通过搜索功能出现在所有现代浏览器。所有主流浏览器都可以利用OpenSearch;它很耐用。

虽然你仍然想在你的网站上提供一个搜索机制,但这个核心增强功能补充了用户的浏览器内搜索功能。

这就是OpenSearch文件通过浏览器与站点交互的方式。这就是OpenSearch文件通过浏览器与站点交互的方式。

就像我们到目前为止讨论过的所有事情一样,我们需要生成用于放置代码的文件。

由于这种特殊类型的文件没有像robots.txt或sitemap.xml那样的名称保留,所以我们可以随意调用该文件。但是,OpenSearch文件的约定是将文件命名为“OpenSearch .xml”。

您需要包括以下代码作为起始模板,然后继续自定义所需的标记,例如短< >< Url ><描述>(它们是区分大小写的)来描述你的网站。

下面使用的示例是使用谷歌搜索的Six Revisions网站。

<?xml version=“1.0”encoding=“UTF-8”>Six Revisions搜索此网站。favicon.ico

上述标签包括:

  • 简称:你想为你的搜索扩展的标题
  • 描述:解释搜索框的用途
  • 图片:这并不是必须的,但我建议引用您的Favicon与它,这样搜索功能有一个独特的图标
  • Url:需要一个MIME类型和一个链接到搜索条件的模板属性

要使此文件正常工作,请将以下代码放入< >头标签:


            

这就是OpenSearch文件通过浏览器与站点交互的方式。

其他OpenSearch标签

我们可以提供一系列附加标签。其中包括:

  • AdultContent:如果网站有需要过滤的成人内容,请设置为
  • 归属:你的版权条款
  • 联系人:您的网站联络点的电子邮件地址
  • 开发人员:谁创建了这个网站?
  • 输入编码和输出编码:使用的MIME类型
  • 语言:即。对英语
  • 查询:查看更详细的搜索词
  • 标签:关键字,用空格分隔
  • SyndicationRight:人们请求、显示或发送结果的程度

其他标签的用法示例:

版权所有,您的名字2010,保留部分权利。 None@none.com Your Name UTF-8 en-us UTF-8   example Tags Element Website open

这就是OpenSearch文件通过浏览器与站点交互的方式。

简单,小而有效

虽然本指南代表了生成这些有用文件的速成课程,但值得指出的是,花时间理解任何语言的语法是很重要的,以便确定这些文件对你的网站有什么影响。

这些文件代表了一个事实,那就是网站不仅仅是HTML、CSS和JavaScript,虽然生成这些文件肯定不会替代您现有的代码工作流,但它们的内在好处使它们值得考虑来补充您的项目。你自己试试吧!

相关内容