2013年3月12日星期二

聚在点石是个缘份

虽然和现在抗震救灾的大气氛不太相符,不过昨天还是由衷的高兴了一下。点石最资深的版主网络之心发来email,告诉我他已经因点石结成姻缘,结婚了,结婚的对象是点石人才版版主田野。

由衷的祝福你们幸福美满。

想想真是一种无法用理性去描绘的机缘。他们两个因为互联网而相识,因为SEO而相识,也是直接因为点石而相识。如果没有点石的存在,这两个八杆子打不着的人,又该如何在茫茫人海中找到对方?

点石的成立本身,和其他事情一样,也带有偶然性。四个对SEO有热情,有点经验的人碰在一起,其实互相也不太熟,但是由喜欢张罗的Robin牵线,点石就诞生了。如果Robin找我说这事时,刚好我出去吃饭了或急着上厕所,他会不会找别人?点石还会不会成立?或者成立的那个组织还是不是点石?一切都是未知。

但是事情就按现实中的样子发生了。

所以我回email说,希望他们珍惜老天所安排的发生在他们身上的一切。不用感谢点石,这是机缘。

我和我太太有时候也感慨,如果我太太当时不是因为百无聊赖,又懒得到书桌前拿杂志,所以顺手从床边拿起已经看过的旧报纸,那么我们就不会相识,人生的轨迹就会不同。

既然老天给我们这么安排了,我们就应该珍惜。要知道所有这一切,都是无数的可能性中挑出一个在现实生活中发生。人生的每一个转折,都是一件概率极低的事件,但是它却神奇的发生了。

再次祝福你们!就算以后点石再没什么值得提的发展,我也会觉得很欣慰,因为点石造就了几对SEO佳偶。

以前写过SEO爱情故事,这又是一段值得纪念的SEO爱情故事,点石姻缘。

《SEO实战密码》终于上架了

经过几番折腾,《SEO实战密码》终于陆续在主要网站和书店上架了,读者目前可以在中国互动出版网当当(普通版)卓越亚马逊淘宝购买。另外,前几天回国时到出版社签名了200本书,签名版已全部交当当出售(12月6日注:4号晚上上架的,6号早上貌似已卖完)。签名版数量有限,欲购请快抢。我很少回国,估计以后也不大可能有签名版了。在当当、卓越买的读者欢迎评星和给评语。

这本难产的书,3,4月份就说快写好了,但直到9月底才交稿,再加上编辑、印刷、装订、入库、进货、运输、上架等等必须的过程,11月底才能买到,真是对不住那么多一直关注着的朋友和读者。很多人多次问到底什么时候能买到,我也没有个明确说法。不是我不愿回答,而是,一,我也真不知道什么时候能买到,二,我很汗颜,都不好意思提这事儿。

无论如何,终于能买到了。希望《SEO实战密码》能对SEOer们有帮助,也不枉等了这么久。

另外有几点说明。

1)《SEO实战密码》不是《网络营销实战密码》的改写。虽然名称和封面相似,但这是两本完全不同的书。《网络营销实战密码》中有SEO一章,但仅仅是一章,所占篇幅很小。《SEO实战密码》全书528页,只讲SEO。

2)《SEO实战密码》中80%以上的内容在SEO每天一贴博客中没有出现过,以后也不会出现。《SEO实战密码》不是集合本博客帖子而成,而是全部从头写起。看过《了解搜索引擎》《链接诱饵指南》两个免费样章的读者应该知道,《了解搜索引擎》中的内容在本博客完全没有出现过,《链接诱饵指南》共47页,比链接诱饵博客帖子内容丰富得多。

3)淘宝上也有不少卖家卖这本书。不少读者问是否是假的,或者是盗版。淘宝上鱼龙混杂,我实在无法知道哪家有问题。可以肯定的是,那些卖10几20块一本的,卖电子版的,肯定是假的。知道一个肯定可靠的是这家富益视点,因为是电子工业出版社下属书店。淘宝卖家的优势是进货速度快,最早上架。淘宝商城和老的非商城卖家如淘书工社貌似也挺可靠。

4)各地新华书店我真不知道什么时候有的卖,这取决于他们是否进货,进货、上架速度。

5)无论当当、卓越、互动网还是淘宝,或者实体书店,都是正常售书渠道,与我没有直接关系,谈不上是官方渠道。上面提到的网站和链接只是告诉读者哪里有卖的,算不上是推荐,您在哪里买都行,您平常在哪里买、喜欢在哪里买,就在哪里买。(除了留意淘宝上的黑店。)

6)书卖得还比较快。几天前出版社编辑通知我,第一次印刷5000本不到一星期就全出货了,正在第二次印刷。卓越好像处于预订状态N天,发了些货就又缺货了。所以,如果读者暂时买不到,请稍等待。书已经正式出来,会有货的…

欢迎读者批评指正。

怎样看原始日志文件

读者hiisee问

请问如何用PHP脚本在后台获取蜘蛛的详细信息呀?如哪里的蜘蛛/何时来的/搜索了哪几个页面/哪些它喜欢哪些不喜欢等,和判断浏览器是不是用一样的技术?谢谢,再次麻烦您了.

刚好关于流量统计和分析以前还没有谈过,这两天分几个方面专门谈一下。今天先来谈怎样看服务器原始日志文件(server raw logfile)。

网站服务器会把每一个访客来访时的一些信息自动记录下来,存在服务器原始日志文件中。

一般主机提供商会在控制面板提供给你下载这个文件,如果你的主机提供商不提供原始日志文件的话,你就该换地方了。

原始日志文件只是一个纯文字形式的文件,只要用文字编辑软件如WordPad或Notepad打开就可以了。

下面是我从上个月这个blog本身的日志文件中随机选取的一行,我们来看一下它包括哪些信息:

221.201.77.63 – - [02/Jul/2006:15:30:41 +0800] “GET /seoblog/2006/04/17/user-friendly-website/ HTTP/1.1″ 200 19031 “http://www.baidu.com/s?
wd=PRADA%B9%D9%B7%BD%CD%F8%D5%BE&cl=3″ “Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; Alexa Toolbar)”

用户IP地址

221.201.77.63

这是访问人所使用的IP 地址,能够告诉你来访的人来自什么地理位置。如果你查一下这个IP地址所属位置,可以看到这位访客来自中国北京。

日期/时间

02/Jul/2006:15:30:41

这是某一个文件被访问的时间,和IP地址结合起来,你就可以跟踪某一个特定的用户,从一个网页到另一个网页的访问顺序。

时区

+0800

这个数字是相对格林威治时间的时区差多少。

服务器动作

GET /seoblog/2006/04/17/user-friendly-website/ HTTP/1.1

服务器要做的动作要么是GET,要么是POSP。除了一些CGI脚本外,通常都应该是GET,也就是从服务器上获取某个网页或图片文件。

例子里的这行意思就是按HTTP/1.1协议(protocol)获取文件/seoblog/2006/04/17/user-friendly-website/

返回状态码

200

下一行是服务器反应是否成功。200就是说成功获取了文件,如果是返回了404,就是文件没有找到。401是需要密码,403禁止查看,500服务器错误,当然还有其他很多代码。

文件大小

19031

这一行指的是所获取的文件大小,在我们的来自例子里是19031byte。

访客来源

http://www.baidu.com/s?wd=PRADA%B9%D9%B7%BD%CD%F8%D5%BE&cl=3

这一段是告诉我们访客是从哪里来到这一个网页。有可能是同一个网站的其他页,有可能是来自搜索引擎的搜索页。

例子里的是来自百度,搜索关键词是”PRADA官方网站”。

这段信息是非常重要的。

浏览器类型

Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; Alexa Toolbar)

这最后一段所表示的是浏览器和用户电脑的一些信息。

比如上面这一段所表示的是用户所使用的电脑是与Netscape兼容的Mozilla浏览器,Windows NT操作系统,浏览器是IE6.0,装有Alexa Toolbar。

在这一段如果用户使用的是其他类型电脑或浏览器,你还可能看到这些代码:

msnbot/1.0 (+http://search.msn.com/msnbot.htm)
Baiduspider+(+http://www.baidu.com/search/spider.htm)
Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0; Maxthon; Alexa Toolbar)
http://www.gougou.com RSS Online Reader
Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)

意义不用解释,一看就知道了。

跟踪用户轨迹

这是很多网站运行者需要研究的地方。

从日志文件中剔除对图片的访问,剔除中间插进来的其他访客的信息,只把来自某一个IP地址的用户在一段时间内所看的网页列出来,我们就能看到这个用户在你的网站上都做了哪些行动,看了哪些网页。

用户行为信息给网站运行者提供很大的帮助。

网页的重要性/权威度/能量

昨天Google PR更新了,不过就像以前说的,Google PR在排名中所占的比重越来越小。

现在很多人相信搜索引擎都给网页赋予一个权威度值,名称有不同的看法,不管叫重要性值,还是叫信任级别,还是叫权威度,还是叫强度,或者叫能量。甭管叫什么,很多排名的研究表明,网页本身除了PR值之外,还有一个综合了很多因素所构成的一个与搜索词无关的权威度值。

前几天SEOmoz开发出一个测量网页权威度值的工具,他把它叫Page Strength,大家可以测一下自己的网页能量值是多少。

这个工具采集几个数据:

雅虎所收录的指向这个URL的链接数

雅虎收录的指向这个域名的反向链接数

反向链接数还是各个搜索引擎非常看重的一个因素,是和PR值最有关联的一个因素。

网页标题中前四个单词在Google的排名情况

一般来说标题Title前面的词就是这个网页的目标关键词。那么这个网页在Google中搜索目标关键词时的排名自然是这个网页权威度的指标。

但有时候这个指标也不准,因为有的网页可能把关键词放在标题的靠后,有的时候取前四个单词反而由于分词不同破坏了关键词。

域名年龄

不过这个域名年龄指的不是域名注册时的年龄,而是Wayback Machine所收录的网页第一次出现的时间。

从.edu和.gov来的反向链接

前面说过很多人认为搜索引擎给.edu和.gov域名更大的权重,因为这两个域名都不是一般人所能注册的,所以有更高信任度。

Alexa排名

尽管Alexa排名太容易被作弊了,但到目前为止也还是唯一一个能大致判断流量的指标。

在Google数据库中你的域名被提到的次数

这里指的并不仅仅是反向链接,也包括不是链接的只是提到你的域名的情况。

内部链接的情况

你的整个域名指向这个所测试的URL的链接比例,如果是主页的话,一般都是百分之百。这是看你网站的内部链接结构把这个所测试的页放在一个什么重要的程度。

网摘del.icio.us出现URL的次数

前面说过搜索引擎现在越来越看重用户行为模式,网摘,书签等就是用户行为方式的重要指标之一。

是否被收录进开放目录

雅虎和开放目录是两个最大的由人工编辑的网站目录,由人所判断的网站质量和重要性比机器自然要准确。

在wikipedia中出现URL的次数

同样也是用户行为方式之一。

最后一个才是Google PR值

这个SEO工具就是绝好的链接诱饵,相信短期内就能吸引上千个链接。可惜我不会编程,不然做个中文版。哪位会就赶快吧。

搜索营销基础

上星期五应Reed邀请,去一个搜索营销座谈会做演讲。因为来的都是商人或公司运营人员,而不是站长或IT部门的人,所以只是谈了下最基本的搜索营销话题,诸如搜索营销为什么重要之类的。

来的大概有七八十人,会场设备很好,演讲也很顺利。

不过,反响并不怎么样。演讲后提问时间,没有人提问题。我演讲后,参加所有在亚洲举行的搜索大会的David Temple也做了演讲,重点是怎样与搜索营销服务商沟通及联系。他讲完后,也同样没人提问。

我还以为是因为我讲的太烂了,所以没什么反响,看来不是。要么是听众们太腼腆,要么是还是没意识到搜索营销的重要性,

这就是市场与网络水平的发展差距。就硬件和基础建设来说,新加坡应该是世界上互联网水平最高的国家之一。可惜的是对电子商务,网络应用,网络营销等的认识,距世界水平差的就比较远了,与中国相比也是有差距。

我一直觉得原因之一是因为新加坡太小,立足于本地的电子商务网站,几乎没有什么成功的可能性。所以商人们也自然而然的没有往这方面花心思。

本来想把演讲的录音放上来,不过因为是英语的,还挺长,估计感兴趣的人很少,我的英语又不怎么样,就算了。

我演讲的演示是用Google Docs做的,下面就是演讲的presentation。

更新:本来用iframe在这里嵌入Google Docs文件,据很多读者反应会死机。我用firefox看没问题。不过为读者考虑,还是删除了。愿意看演示文件的可以点击下面的全屏文件。非firefox使用者请慎点,可能造成死机。

想看全屏演示的,请点击这个链接

以后如果大家需要跟其他人介绍搜索营销最基础内容的时候,可以作为参考。

职业SEO应该系统学习哪些知识?

一位姓武的读者来email问,如果想把SEO作为职业,那我应该系统学习哪些方面的知识?与其用email回答,还不如帖个帖子。

我觉得搜索引擎优化是一个比较综合性的技艺,既牵扯到很多纯技术的像服务器方面的知识,也牵扯到很文科的东西,多学总是有好处的。下面只是我认为的至少应该系统学习的知识。

市场营销

这是最最重要的。说到底搜索引擎优化是营销的一种手段。如果你能用其他方式给网站带来免费的针对性强的流量,就算不做SEO,那又何尝不可呢?而懂得了市场营销也非常有助于实际搜索引擎优化操作的执行。

网页制作

包括HTML,CSS,JS,Photoshop等。虽然不一定精通到能直接手写HTML,但至少应该能看的懂,才能知道该优化什么地方。

简单的网站程序编写

比如PHP,ASP,还需要了解数据库调用等。同样,成为真正编程高手是不必要的,但至少应该能读程序,这样在做一些网站优化的时候,很有可能需要在程序当中做一些修修改改。

写作能力

前面说过网站内容是搜索引擎优化最关键的因素,没有内容一切都谈不上。那种五六页宣传册子式的网站,是很难通过搜索引擎优化来获得流量的。

所以做搜索引擎优化的人一般都需要自己写大量的内容,或者修改别人写的内容。不仅要把文章写的有吸引力,有逻辑性,还要自然的在文章中融入关键词。

数据分析

数据分析也不必学到象数学专业本科生似的,只是基本数学,推理,逻辑等的综合。可能看几个别人分析项目的例子是最好的学习方式。

做SEO的人需要对服务器日志文件进行分析,需要对行业情况,关键词情况进行分析,还要对销售数字进行分析,确定优化的方向,判别优化的效果。

基本SEO技术

包括网页标题标签链接,网站结构,关键词等等,这些简单的优化技术都是比较通用和固定的。英文网站有很多这些信息,中文的好像也有两本电子书,其中一本是免费的,可以下载来看看。

项目组织和协调

很多时候网站的优化不是一个人能做完的,比如我就对编程不了解,只能提出要求,由其他人完成,然后再来验收。同时你还可能需要和客户,设计师等进行沟通交流,推动项目的进行。

关注搜索引擎优化技术的新发展

懂得前面提到的基本优化技术,现在是不够的。因为搜索引擎不断在修改他们的算法以对付我们这些做SEO的人。所以做SEO的人需要了解最新动态,这一点最好的方式就是看论坛和博客。

当然前面讲的这些都是比较基本的,如果你能学的更多,当然更有好处。比如广告学,比如自己会编程,有商业知识或者对服务器技术非常了解等,这些或多或少都会对SEO工作有帮助。

搜索引擎优化很重要,Matt Cutts说

接前两段视频

第三段视频

搜索引擎优化好,还是最终用户优化好

Matt Cutts回答,两个都很重要。

这两天我们在讨论搜索引擎优化是不是合法,我想,这已经给了很清楚的回答。

Matt Cutts说,如果不做搜索引擎优化,用户找不着你。如果没有用户优化,那么用户在你的网站上不会停留,不会买东西,不能转化为客户,又有什么用呢?所以两者都很重要。

他的建议是,应该把这两个部分变成同一件事情。如果你能把网站做的既搜索引擎友好又用户友好,这是最理想的。

垃圾检测工具

有的人问有没有垃圾检测工具,好检测一下自己的网站,让自己的网站保持干净。

Matt Cutts说,Google内部有很多检测工具,但当然不能对外公开。他建议大家可以用Yahoo Site Explorer查一下网站的反向链接,用工具查一下在同一个IP地址上有没有其他可疑的网站,也可以用Google网站地图里面的工具看一下你的网站有什么问题。

网页的干净度

有很多人问,网页非常干净(clean),符合W3C标准,对网页排名有没有什么影响?

比较没想到的是,Matt Cutts说,他不会担心这个,因为40%的网页都有编码错误,搜索引擎不会因为网页上有错误而抛弃40%的网站内容。所以用W3C标准验证网页当然是一件很好的事,但是不必太担心,对他来说,这是在他要做的事情里面最后面的一件事。

视频4

静态URL和动态URL对排名有什么影响?

Matt Cutts回答,他们对静态和动态URL处理的方式是类似的,也就是说PR值在动态URL和静态URL页面的传递是一样的。如果纽约时报的一篇文章连向你的动态URL,这个页面会得到相同的PR值

但是他建议,不要在动态URL中使用太多参数,最多用两三个。同时不要用太长的数字,因为那可能会与Session ID混淆。

最好能够用mod_rewrite进行URL改写,把动态URL改为静态URL。

Google网站地图能不能提醒站长,他的网站被黑客侵入

Google目前没有这个资源和计划。

Google对geo-targeting怎么处理

很多大型网站经常使用这一手法,根据用户的IP地址所在地理位置返回相应的不同内容,所谓geo-targeting。

Matt Cutts以前也讲过多次,这种手法本身没有问题,Google自己也用。只要你不把Google蜘蛛特殊对待就可以了。

如果检测用户来自于加拿大,就返回适用于加拿大用户的页面内容。如果用户来自与德国,就返回适用于德国用户的页面内容。

根据用户所在地理位置的IP地址,返回不同内容,不会被认为是隐藏网页(cloaking)。但如果你的网页给予Google蜘蛛特殊的对待,当检测出是Google蜘蛛来访时,返回的内容与用户所看到的内容不一样的话,就会被当作隐藏网页。

明天继续。

Matt Cutts刚刚又发视频了。