通过搜索引擎查找资料是广大网民上网最普遍、最基本的方式,同样对于网站企业来说,利用搜索引擎推广网站的也是基本方式和主要手段之一。
一、搜索引擎的基本工作原理
1、前台部分,通常就是用户提交查找内容的页面(一般比较简单),用户一旦提交查找内容的关键字,词;网站就会去数据检索列出相关内容的网站页面并显出列表。
2、后台部分,通过专门的程序,(这种程序被称为“网络蜘蛛”)通常以IP或域名的方式对网站主页,并分析主页下的所有超级链接地址,逐层游历下去,一直到超级链接失效或没有可用超级链接地址为止。由于搜索引擎的蜘蛛的算法不同,游历网站时,抓取到搜索引擎数据的页面有所不同。
3、前台,后台的协作。后台将检索出来的信息,按照一定的储存标准,存放到数据库中,前台通过用户提交的内容,检索数据库相关的内容。
二、搜索引擎类网站的差异
1、百度,Google是人们使用得最多的搜索引擎,占70%以上,原因是它们有丰富的数据库。以Google为例,有关报道Google的数据库服务器,每天以1000台的速度在增加,出了百度,Google外,还有一些比较大的搜索引擎,雅虎,一搜,Soso,中搜,搜狗等。这些搜索引擎的蜘蛛抓取网站数据时,利用快照。
2、垂直搜索引擎。这是近两年最热门的搜索技术。就是网络蜘蛛,去游历针对性或专门的网站,按照一定的标准抓取部分数据存到数据中,提供用户查寻使用。例如:奇虎www.qihoo.com提供论坛搜索服务,酷迅www.kooxoo.com提供贴贴信息的搜索服务,中文RSS搜索www.feedsearch.net,检索Rss信息。
三、搜索引擎里网站的推广。
网上推广的文章很多,很多是技术方面的比较重,不利用网站的推广。下面是百度和google的比较实例。
1、头部内容与网站推广的关系。
在一个网页中,<head></head>之间,就是一个页面的头部信息部分,Google的蜘蛛优先抓取网页时的头部文件信息的描述,和关键字描述,百度的蜘蛛的喜欢程度不如Google。如何优化这部分的内容信息。<META content="关键字" name=keywords>关键字这个代码放到头部中去,文字长度一般介于150个字符左右,<meta content="网站描述" name="Description">网站描述也放到头部中去,长度可以多关键字约大一些,约300个字符左右。<title>标题</title>页面标题最好能反应当前的内容描述。优化这一部分内容,可以提高网站在Google里的收录。
2、页面内容与网站推广的关系。
页面内容是指访问网站是生成的页面内容,通常是指生成的html代码文件时<body></body>之间的内容。百度的蜘蛛更喜欢这里的东西,而且这里面除去Html代码标记后的前300个字符通常显示为搜索引擎的检索时的描述内容,也是用户检查网站内容的关键之一。优化这一部分内容,可以提高网站在百度里的收录
3、页面超级链接与网站推广之间的关系(最重要的)。
页面超级级链接,就是网络蜘蛛游历整个网站的线索,W3C标准里,就有一条页面超级链接失效到一定程序,就不能通过W3C认证;同样,失效的超级链接也是网络蜘蛛对网站游历时,游历的一种标准。超级链接有两种情况,A同域下的链接,Google的蜘蛛比较喜欢这种链接方式。B不同域的链接,百度比较喜欢这种方式。要想优化这部分内容Google采用Sitemap.xml文件提交,百度最好采用一个站长地图文件链接到主页。这里介绍一个免费工具(在线sitemap生成工具,http://huluwa.cn/sitemap.aspx ,以生成google所需的Sitemap.xml文件和百度所需的Html文件。不过需要安装Java虚拟机。生成这两个文件后都到到网站根目录,Sitemap.xml到Google去提交,Sitemap.html在网站的页面上做一链接就可以了。)
4、蜘蛛的工作周期与网站的推广的关系。
百度的工作周期相对来说比google短一些,百度大约在10左右重新访问网站一次,Google大约在15天左右重新访问一次网站。由于一天之内不能游历全球所有的网站,如果推广网站时,能到更多的网站上提交相应的网站信息,也是加快蜘蛛收录网站内容的重要环节。
5、搜索引擎的自定义排名。
这是搜索引擎公司益利的主要手段,搜索引擎公司由于可以自定义排名,和可以过滤一些关键字、词和网站,这样可以造成网站无法收录到搜索引擎的数据库中。如果长期内,你的网站在搜索引擎中没有什么变化,可以考虑调整你网站里的字、词和网站里的内容。
四、介绍一些站长们的需要工具或网站。
1、百度,Google查录网站收录情况:site:网址,(如:site:huluwa.cn)
2、Google的站长管理页面http://www.google.cn/webmasters/
3、Sitemap生成页面http://www.xml-sitemaps.com(100页以内可以用,100页以下好像不行),推荐http://huluwa.cn/sitemap.aspx(需要安装JAVA虚拟机,速度完全在于客户端)
4、验证Xhtml是否通过W3C标准http://validator.w3.org/check?url=网址(如http://validator.w3.org/check?url=huluwa.cn)
总之,以上内容纯属个人的见解,很多缺少相关的理论依据,如有错误的地方请大家联系我。我的博客:http://blog.huluwa.cn/xuhaolan/ 或http://haolan.djcz.com
