2012年2月21日星期二

怎样减少无效URL的爬行和索引 – 无完美解 如何隐藏内容也可能成为SEO问题 非一般链接 佳士得拍卖兽首:纯属事件营销 首页链接的优化 URL静态化还是不静态化? 搜索引擎统一Robots文件标准 绝对路径和相对路径与SEO 博客SEO指南 网站更新与关键词排名

少年老成的云晨守望同学在网络营销实战密码网站贴了个帖子:透过京东商城看国内一线B2C网站SEO通病。简单说,帖子指出一个严重而且现实的SEO问题:很多网站,尤其是B2C,产品条件过滤系统(如选择产品的品牌、价格、尺寸、性能、参数等)会产生大量无效URL,之所以称为无效只是从SEO角度看的,这些URL并不能产生SEO作用,反倒有负面作用,所以这些URL不收录为好。

阅读全文 »

但有时候怎么阻止搜索引擎收录也可能成为一个问题,最近越来越成为问题。

阅读全文 »

这些在正常意义上来说隐藏着的链接,是否会对搜索引擎发现页面、传递权重、页面排名有影响呢?

阅读全文 »

最近佳士得拍卖圆明园被抢去的两件兽首事件引起了很多注意,挑动着国人的神经。

在我来看,这根本就是彻头彻尾的事件营销。

阅读全文 »

在网络营销实战密码读者交流网站上,一个朋友问了一个关于首页链接的问题。

阅读全文 »

数据库驱动的网站需要将URL静态化,一直以来都是SEO最基本的要求,可以算是个常识性的东西。

9月份,Google站长博客发表了一篇讨论动态网址还是静态网址的帖子,却颠覆了这个说法。

阅读全文 »

前两天三巨头又同时宣布,共同遵守的robots.txt文件标准。

阅读全文 »

经常看到有人在论坛里问URL的绝对路径和相对路径问题,在网站中应该使用哪种?对SEO有什么影响?

阅读全文 »

博客SEO指南。

阅读全文 »

网站是否需要更新,以及对排名的影响,视具体情况而定,没有一成不变的规则。

阅读全文 »

2012年2月18日星期六

付费链接是与非

近一两个月,一个关于Google的话题炒的沸沸扬扬,也就是付费链接的问题。

Matt Cutts在他自己的博客里讲了Google不欢迎付费链接,并且用户可以举报付费链接。在前不久的SES大会上,Matt Cutts再次明确的讲,付费链接违反Google网站质量指南。一时间付费链接是与非掀起了不少讨论。

highdiy的博客这几天就疑似因为付费链接挨了一刀

站在Google和其他搜索引擎的立场上,讨厌付费链接可以理解。因为搜索引擎算法中,很大一部分是基于链接关系的,付费链接则打乱了链接关系的可信度。

付费链接很多时候并不是一个信任票,而是因为存在着金钱往来。所以付费链接有可能降低搜索引擎结果的相关度。Google对此当然不满,并想方设法减少付费链接的影响。

最近Matt Cutts大张旗鼓宣扬对付费链接的惩罚,可能是有新的方法能检测到大量付费链接,而且这些付费链接影响了搜索结果的质量。

不过我觉得Google这一次是在正确的目标上,使用了错误的方法,很可能达不到他们的目的。

首先,一个链接是否是付费链接,Google真的能检测的到吗?对此我完全不能相信。试想,我和某个站长认识,跟他一块吃饭时,问他能不能卖个链接到我的网站,行的话这事就定了,立即现金支付。Google怎么能知道这件事呢?我怎么想象Google也知道不了。

顺便说一下,我Blogroll里的人,石头Robin小鹏网鹰幻灭SeoVistaDavidYinhighdiykyw等等,你们可都该续费了。我Blogroll的链接按年收费,已经满一年了,你们不续费,我就撤掉你们的链接了啊。我还准备向Google举报啊。 :-)

Google信吗?不信吗?怎么知道?这么判断呢?

其次,所谓付费链接也可以有很多形式。除了有现金交易没办法发现外,像前面说的例子,请对方站长吃饭算不算?我送对方一个软件算不算?免费提供SEO咨询服务算不算?给他报销的票算不算?这些都怎么检测?

就算Google里面全是天才,这些交易也是天知地知,你知我知,别人谁能知道。

再次,有些网站买卖的链接对搜索引擎结果的影响其实微乎其微。我的网站并没有购买或出卖任何链接。但我知道有的网站有购买链接,可买链接的站长根本不懂搜索引擎优化,人家只是为了建立品牌,多点流量的原因。而且是偶一为之,这种链接购买根本无伤大雅。

Google与其让站长举报买卖链接,还不如把时间精力花在发现那些大规模的链接买卖网络。有很多行业,尤其是竞争厉害的行业,大规模买卖链接是每天发生着的,效用也是很明显的。Google把时间花在发现和处理这些大型网络上,对搜索结果的质量提高,恐怕更有用处。

Matt Cutts谈到付费链接时,也并没有一概反对付费链接。他们强调的是付费链接应该清楚被标明,表现在网页形式上就是,应该清楚标明这是赞助商链接或广告等。在网页代码上最好使用NF属性,这样搜索引擎就知道这个链接不是一项信任投票。

当然,我觉得Google不可能真正检测到所有付费链接,并不是鼓励大家去买卖链接,操纵排名。如果你是出于正常广告目的,买卖链接没什么不可以。但如果是为了操纵PR,操纵排名结果,还是有一定的风险。而且站在SEO的立场上,我也同样反对为操纵PR和排名的链接买卖。

中国虚拟主机市场调查

紫雨知道我在研究中国虚拟主机市场,给了我几个在讨论中国用户对外国虚拟主机的看法的网址,非常感谢。

我最近确是都在研究中国虚拟主机市场,发现不少博客都有提到BlueHost,好像在中国使用外国主机的博客中还蛮流行。综合最近的市场调查,有以下几个初步感想。

目标市场

由于我们的专长在于Unix/Linux主机,所以应该暂不会考虑Windows主机市场。从开始研究中国虚拟主机市场,我就注意到中国用户似乎对Windows/ASP/Access更感兴趣,对Unix/PHP/MySQL的需求要小的多。这与世界范围的行业情况相反,在世界范围Unix/Linux主机占绝对优势。

不过也有不少人,尤其是博客,在寻找Unix主机,原因是某些程序,比如WordPress更适合在Unix主机。

而且有不少人提到对国内虚拟主机提供商很不满,不过大部分语焉不详,我也不是很清楚哪些方面不满。我猜想也许和不少国内虚拟主机提供商把服务分成太多的等次,每加一个功能都要收钱的关系吧。

我将把需要国外的Unix主机的人群作为我们的目标市场

速度和带宽

外国的服务器当然在速度上占劣势,但是这是针对国内用户来讲的,如果中国用户想建立一个吸引世界范围访客的网站,那么外国主机反而有速度优势。因为说实话从境外访问,绝大部分中国网站速度都极慢。

另外一个相对优势是,境外主机似乎没有南北相通的问题。

技术支持

不少人在寻找外国主机,但比较犹豫的地方是,很少外国主机提供商能使用中文提供技术支持。被讨论的主机提供商都是美国的,很难想象这些美国公司什么时候能够用中文提供支持。这可以是我们的优势。

控制面板

国内很多用户还是挺熟悉CPanel,但似乎国内的主机提供商很少有用这一国际主流控制面板的。我没有试过国内的主机面板,所以不知道相比之下国内主机面板与CPanel哪一个更用户友好。不过就我自己的使用来看,CPanel很好用,成为世界上最受欢迎的控制面板是有它的原因的。

问题是CPanel没有中文版本,我正在寻找解决方法。

价格

这恐怕是我们的劣势,与美国服务商相比,新加坡的带宽成本非常高,所以我们的主机服务价格肯定比美国随处可见的廉价服务商价格要高。

付款方式

中国用户绝大部分没有信用卡,在向美国服务商付款时会有不少困难,这也可以是我们的优势。因为我们可以在中国通过分公司或亲戚朋友等渠道,通过银行汇款,支付宝,贝宝等接受付费。

如果读者对使用国外虚拟主机有什么想法,要求,建议,批评,欢迎留言。相信我的读者大部分都是做网站的,很希望知道你们的意见。

我目前还是在考察当中,最后的计划还没有确定。

深圳及香港游

14号参加深圳点石茶话会,顺便去香港玩了几天。发些照片留念。

深圳演讲中:

深圳演讲

买了书的读者签字:

签字

对不住找我签字的朋友,我的字挺难看。我记得我年轻时写字还不错呢,现在越写越难看了。可能原因就是,现在已经基本不写字了…

和一位朋友合影:

Zac合影

没错,左边那个就是我。和博客右上角大家常见的照片差别很大?是啊,胖得不像话了。我也很郁闷。老丘说我老是拿很久以前的照片给大家看,其实我冤枉啊,那张大家常见到的照片仅仅是三年前照的啊。这才是最郁闷的。

回来看到照片大喊,老婆,这几天别给我做饭了,我减肥。

第二天,随着肚子开始饿,自己越想越委屈。我都四十的人了,还管什么外表啊?年轻时得保持身材(当然其实也没保住),说心里话,不就是为找个好老婆嘛?现在都找到了,爱谁谁吧。又大喊,老婆,今天吃红烧肉吧。

太太和女儿,香港维多利亚港:

太太和女儿,香港,维多利亚港

女儿不算好看,爸爸妈妈都是双眼皮,她到现在还是单眼皮。但还算可爱。喜欢看飞机:

女儿看飞机

还有点可爱吧?有时候也烦,看看把家里折腾的,爸爸把罪证都留着:

家里一片狼藉

维多利亚港前kiss爸爸一下:

kiss daddy

在饭店房间学妈妈做手势:

学妈妈

宝贝儿,这买包包的爱好就别学了:

学妈妈买包包

深圳,世界之窗,太太被拉上台跳舞去了:

深圳,世界之窗

世界最大瀑布前和爸爸合影:

深圳,世界之窗,瀑布

顺便说一下,我下个月会去厦门参加SMX大会,去参加的读者,欢迎找我交流。

我们的网络爱情

不是网恋。我们远距离的平凡爱情生活,因为互联网的存在发展,而成为可能并恋得有声有色。

我和我太太1994年初就认识了,并迅速进入热恋。那时候我们都没有上过网,那时很少有人知道互联网这回事。那时候有呼机,有电话。不过对恋爱中的人来说,有些话说出来总没有写出来显得那么甜蜜。所以虽然我们同处一个城市,几乎天天见面,还是积累下一大堆情书。也许我的写作能力就是那时候练出来的。

20多岁的人毕竟还不成熟,因为种种原因,95年两个人分手了。不是因为感情出现大的变化,却由于各种各样的困难,压力,烦恼而分开。两个人就此失去联系。

97年我来到新加坡,工作,然后还是工作。年纪越来越大,转眼30多岁了。回想以前的日子,和我太太谈恋爱的时光还是最甜蜜的,心里一直没忘记她。

2000年夏天回家探亲的时候,鬼使神差两个人又碰面了,而且两个人还都是单身。在短短几天探亲的日子里,和我太太见了几面,做的最重要的一件事,就是帮她申请了雅虎的电子邮件地址。

在此之前,我偶尔会上网。虽然工作都是在电脑上做,但上网还远没形成习惯,只是查email和偶尔看看新闻。我太太对电脑和互联网就更没有什么兴趣了。

从我回新加坡后,互联网在我们的生活中突然开始变得越来越重要了。最初是通过email联系。现在看一下两个人的雅虎邮箱,里面还有大堆的情书。这些情书会留在雅虎的服务器里多久?没人知道。当我们两个都不在了,会不会有人偶尔发现几十几百年前这一对恋人的电子情书?还是就永远尘封在那里?

渐渐的,恋爱中的人哪满足于电子邮件,我们想在想念对方的时候,可以感受到对方,自然就想到要用即时通讯。现在用惯MSN,QQ,SKYPE的人,觉得语音甚至视频聊天是多么的普遍正常。问题是那时候只有ICQ和QQ,而且这两个软件那时都还没有语音聊天功能,只能打字聊天。

这对当时的我们来说也是爱不释手,经常彻夜长聊。周末的时候,都会聊到早晨天亮。虽然困的不行了,可是自己心爱的人在线的那一边,和自己想着同样的事情,在大家都熟睡的时候,我们两个人被一条无形的线连着,知道彼此在想着对方,那种感觉让人很难下线。看着一行一行的字跳出来,那是她纤细温暖的小手一个字一个字打出来的,想到这个,心里就像拉着她的手一样温柔起来。

不过打字真的是很累。

爱情的力量让我又开始搜索更好的联系方法。打电话不在考虑之列,像我们那样天天数小时的打,账单将会是天文数字。所以开始找语音聊天系统。那时候网上也有一些,可试来试去居然没有一个能通话清楚又不掉线的。

也就是在那个时候开始了大量使用搜索引擎,在网上研究资料。后来发现,最好的语音聊天软件早在电脑中装好了,就是Netmeeting。当时两边都是拨号上网,距离又那么远,但Netmeeting的通话效果相当不错。缺点是不像MSN,QQ等有帐户可以登录。使用Netmeeting必须知道对方的IP地址,所以每次都要查一下自己的IP地址,先上ICQ,告诉我太太我的IP,她再用IP地址从Netmeeting打过来。

这一下可以听到对方的声音了,很清楚。那时候就开始感慨,网络的发明真是及时雨。只要花上网费,就可以通过电脑听到远在千里之外的对方的声音,质量和打市内电话差不多。可这相当于每天数小时的国际长途啊,没有互联网,我们还没结婚就得先破产了。

节假日或生日的时候,我们必会上网聊天,一起迎接纪念日的到来。虽然不能把她抱在怀里,但我知道她和我是同在一个空间,中间隔了无数节点,却只有我们两个人,没人打扰。哪怕只静静地听着她呼吸的声音,心里也知道,此时此刻,她是和我一起渡过的。

恋爱中的人并不满足于此,又想在听见对方声音的同时可以看见彼此,于是又开始研究视频。Netmeeting有视频功能,我特意去买了视频卡装上,把摄像机接上,我太太在那边也买了摄像头装上。

不过因为当时国内还没有普及宽带,网速太慢,一打开视频,Netmeeting几乎就死在那儿了,声音也几乎传不过来了,只能看到一张模糊的照片固定在那儿。我在新加坡这边用的是宽带,我太太能看到我的视频,但我却看不到我太太的视频。那时候心里那个急呀!

不过,至少能够听到对方的声音,继续经常彻夜长聊。就这样,我们长聊了四年多。以前听到很多故事,夫妻其中一个人出国了,结果因为远距离而感情疏远,最后分开。我们这四年多,因为有了网络的维系,我们越来越近了。从最初的电子邮件到打字传情,再到语音聊天,最后可以在电脑屏幕上看见自己心爱的人。

我们的感情随着在互联网上的恋爱,也变得越来越深。2000年刚重逢的时候,说实话,因为多年没有联系,还真有点生疏。四年下来,又找回了以前热恋时候的感觉。

四年多时间,我们只见过几面。因为这边工作的关系,都是匆匆去匆匆回。不过,有了网络,我们并没觉得天涯各一方。

那四年多,有快乐的对话,也有闹别扭不愉快的时候。2004年7月,不记得是什么原因,正在闹别扭。我给太太做了个网站,在她过生日的时候,发了个短信让她去看,当然网站上是一些不可告人的甜言蜜语。我们和好如初。

2004年十月,我们终于结婚了。结婚后,她来到新加坡,我们有了可爱的女儿。

去年太太怀孕,回中国养胎的时候,和以前相比,条件已经变得太好了。我们用SKYPE可以看到非常清楚的视频,两边都是宽带,声音视频质量都很好,就更 是每天几个小时的在网上聊着,和太太在家里的时候没什么大区别。我在这里边工作边说着话,她在那边做她的事。想看对方的时候,就看一下视频,所以两个多月 很快也就过去了。

如果没有网络,我们的感情会是怎样的结果?不得而知。四年多,如果没有经常能感受到对方,感情恐怕真的会淡了。那种在网上的在一起的感觉,既虚幻,因为你碰不到对方,也真实,因为千真万确两个人是一起渡过那一分一秒。

回想起来,我对互联网和搜索引擎的热情,可能就是从和太太在网上谈恋爱开始的。没有互联网,也许就没有我现在这个甜蜜的小家庭,没有那段网络爱情,我不知现在在做什么,也许就没有SEO每天一贴。

我和我太太5年失去联系,4年多远距离爱情,最终走到一起,要感谢两件事,命和互联网。

希望你会爱上我的博客

这是我的第一个中文博客,目的是想向中国的网站建设者,运行者,设计者们提供最新的搜索引擎优化排名技术研究

我们是新加坡的主机服务商,目前正在探索进入中国市场的可能性。所以我做了很多对中国虚拟主机市场及网站设计,搜索引擎优化,网络营销等方面的调查研究。

给我的感觉是,目前中国网络营销和网站建设发展速度之快是令人惊叹的。但同时,网络上的一切都似乎良莠不齐,多少显得混乱无序。就我最感兴趣的搜索引擎优化排名和网络营销领域来看,似乎还没有形成一个强有力的群体,也没有出现大家都公认的权威。

另外,所看到的介绍搜索引擎优化的材料,文章和博客里面,介绍的大多是最基本的优化推广技术,缺少与国际最新研究同步的讨论。

本人每天工作的一部分,就是花至少两个小时阅读三十多个英文博客和十几个论坛,主要是搜索引擎优化和网络营销领域,对搜索引擎优化技术的最新发展还算比较了解。所以,在努力进入中国市场的同时,我也希望能带给中国网站建设者一些新的信息。

欢迎所有网站建设者,爱好者和专业人士来我的博客,也欢迎发表评论。

我的目标是:每天都抽出一些时间发一篇博客。当然,如果有的时候,因为工作太多,时间太紧,没能发表,你也别见怪。希望我对最新搜索引擎优化排名技术的介绍,能给你的网站带来更大的成功。

去接孩儿她娘了

过几个小时就要飞回北京,接我太太回来。20号左右回新加坡。

明天都在路上,不会发帖。

在中国期间我会尽量正常发帖。不过评论就没时间回了。

又要大吃大喝啦。

博客还是暂停吧

博客暂停

想了一下,写新书期间,博客还是暂停吧。

昨天试了试微博客式的帖子,不过看着很别扭,也太短了点。写长帖子又非我力所能及,所以还是决定专心写书,SEO每天一贴暂停。

Twitter

本来想做个调查,是在这里发微博客呢,还是干脆去Twitter发发信息呢?昨天下午看到消息,不用调查了,Twitter选项暂时不存在了…

想看我唠叨的还是可以先follow下Twitter,也许过段时间就好了。或者饭否

病,饼,兵,必应

微软Bing刚上线,现在一定郁闷得很,哭着说,咱不带这样玩儿的…

Bing还不错,比我预想的好多了。但要超过Google,凭目前的Bing,还是没戏,没有彻底的革命性,我想不出有什么理由以后要去用一下Bing。看看情况,了解一下,然后又不再去用了。

40岁啦

我今年40岁了,刚刚好过了两个20岁。20年前我已经20岁,正在热火朝天地上着大学。

所以,这没什么,真的没什么。这算什么啊,不值一提。

几件挺郁闷的小事

周末放轻松,跟大家分享几个有时挺让人无奈又郁闷的小事。

1)MSN有人申请加入好友,一般我都是批准。

过几天对方留言:你是谁?对这样的留言,一般我就不理了。你不知道我是谁,加我干什么?

但有时对方锲而不舍的问我是谁,我只好回答:Zac。

对方又来一句:说了和没说一样,有中文名没有?

这让我该怎么回答呢?你要是不知道Zac是谁,我告诉你中文名,你更不知道是谁了。

烦请大家加别人MSN时,先搞清楚人家是谁,并且记住。

2)接到客户的email:

Zac,我是John,我访问不了我的网站,是怎么回事?

完了,没其他话了。

谁是John?说的是哪个网站?令我一头雾水。可以理解,有的时候客户会与我来往不少邮件,客户可能会认为我会记住他的名字及他的域名。可不好意思的是,当你有上千个客户时,还真记不住谁是谁,更别提某个叫John的人网站是哪个。

有的时候通过查email地址,能够查出来对方说的是哪个网站。有的时候还查不出来,对方随便从自己的一堆email地址中挑一个就发email,和当初注册时留的还不一样。

结论是,别假设你的服务商认识你并记得你。

3)收到email,只有一句话:谢谢,帮我再弄一个。

没其他话了。

弄一个什么呀?我只好回复。

过一会儿对方回复:就是再帮我弄一个点石论坛的帐号啊。

然后我发现对方回复email时,都没有保留以前的email信息。这是件挺奇怪的事,有好多人还特愿意这么做,回复email时把以前的来往email删掉。我还以为所有email客户端软件都是自动把邮件原文附在下面,看来好像不一定。

切记回复email保留原文,让对方知道前因后果怎么回事。

4)我看博客都是订阅的,很少去博客网站直接看。偶然去Google官方博客看了一眼,留意到博客上Feedburner订阅数竟然是548。不会吧?这也太少了。赶紧到自己的Bloglines看看,再到抓虾,Google reader看看订阅数,不会是这么少啊?折腾一圈才发现少看了一个K,是548K,54万多订阅者,这也太强大了。

2012年2月17日星期五

关于网络营销书的写作

有的读者注意到这几天的帖子偶尔提到“这本书”,问是否书出来了。这里简单汇报一下。

书还没出,正在写。暂名“网络营销实战”,章节提纲已经和编辑讨论确定了,出版社也已经通过了出版计划。刚刚开始写具体内容,估计写作需要6,7个月吧。再加上编审,修改,校订,印刷之类的工作,我想得快年底才能出版了吧。

是中国的出版社。当当,卓越等应该都买的到。出版时当然肯定会在博客大声喊的 :-)

所以接下来几个月博客的内容大部分会是书的初稿的一部分。要同时给博客和这本网络营销书写不同内容,我肯定力不从心了,不是那种能每天写二三十篇博客的牛人。最近发的很多帖子,比如电子商务思考系列,就已经是整理思路的一部分。

写书时必须得照顾到对网络营销没概念的大部分读者,而不能针对博客的读者。我的博客读者大多对网络营销电子商务,至少网站运营,应该有一定了解。如果读者觉得下面几个月的帖子太基础,请谅解,就当是复习吧。

就算读者觉得内容太简单,还是希望朋友们踊跃留言,任何建议,批评指正都欢迎,都需要。虽然我不能都回复,但大家的留言和意见我都会看,有建设性的意见我会在书稿里修正。

本来我也考虑是不是暂停博客。书的内容发在博客上,以后大家都不买书了。可再想想,觉得不必担心。毕竟只是初稿,会缺少很多细节,数据,案例,有的对方甚至可能是错误的。我现在只是把我脑子里想到的先写下来,以后再整理。发在博客上的也只是一部分。

写书其实是费时费力的事。从书的版税上得到的收入恐怕还没有我三五天能完成的一个顾问咨询项目收费多,可写书得花半年以上时间。但还是会认真写,甚至已经为此推掉了不少顾问项目。我不想分心,希望集中精力把书写好。

是亏本的事吗?当然不会。我现在一小时收费一千,书出版后就收两千了。 :-)

另外,我也真的很想把自己的经验介绍给更多人。目前有系统性的中文网络营销实战书籍和文章真是不多。

这种游戏什么时候结束?!

今天不写了,写了国内的读者也看不见。本博客所在IP地址被墙了。

我已经检查了这个IP上所有网站,没有不该有的内容。

这是为什么???!!!

从feed阅读器能看到这篇的读者有没有谁有本事告诉我,这是为什么???

该找谁申诉?

我们怎么强大到什么都怕了?

靠!

凌晨5点更新:冷静下来还是换了IP。但还是得说,靠。

面对疯狂无耻的抄袭者,我想骂人!

(这篇是两三个月前写的,一直没发,目前暂时也不想采取提到的行动。贴出来做纪念。)

我的博客开通快两个月了,虽然没有进行任何真正的推广,但还是得到了不少读者的关注。

看到自己辛辛苦苦写出来的每一个字,对读者有些帮助,心里很高兴。

但也有感到非常郁闷的时候,那就是短短不到两个月的博客,内容就已经被很多网站抄袭和不正当的转载。

我在博客上已经很清楚的注明:欢迎转载,但必须以链接形式标出作者,原始出处和版权声明。但是竟然有那么多网站完全不理睬你,在转载我的文章时,删除了作者的名字,或者没有用链接形式指明出处。

最可气可恨的是,有不少网站干脆就写这是他们本站原创。有的网站对原作者信息完全不提,虽然没有声明是他们自己写的,但给人的错觉就是他们自己的作品。

这些非法转载和抄袭数量之多,出乎我的意料。就我所看到的大部分的转载,都没有按照我的要求标明作者和出处。

现在我可以理解那么多外国公司为什么对中国版权保护的执行非常失望和愤怒。眼看着自己花时间花心血写出的文章竟被别人那么疯狂和无耻的抄袭,心里真的愤怒的想骂人。

我相信大部分抄袭者都会经常来我的博客浏览,在这里我明确列出我将采取的行动:

1)以电子邮件或论坛留言等方式通知网站管理人员,请他们或者按要求以链接形式注明作者和原始出处及版权声明,或者把抄袭或非法转载的文章删除。

2)在5到10天内,如果被通知的网站没有作出反应,我会再通知一次。

3)两次通知后还不作出反应的网站,将被列入我的抄袭者黑名单网页。我要声明的是,一旦进入这个抄袭者黑名单,就算抄袭者以后作出了改正,我也不会把抄袭者的域名等信息拿下,以做历史见证。

4)对不做出修正行动的网站,我将向所有重要搜索引擎提出违反版权行为投诉。

根据国际版权公约,这些搜索引擎必须将触犯他人作品版权的网页从他们的搜索引擎中删除。而且从现有的投诉案件来看,Google,雅虎,MSN等对侵犯版权者都毫不留情。一旦被证实,将把他们的网站从搜索结果中删除,并冻结他们的Adsense和Adwords帐号。

对中国搜索引擎在这方面的政策我还不是很了解,但我希望中国本地搜索引擎像其他国际性搜索引擎一样重视知识产权。

5)对抄袭和非法转载者,我将向他们的服务器提供商和域名注册提供商投诉。

同样,几乎所有国际性的服务器提供商和域名注册提供商对侵犯版权行为都必须采取行动,也就是关掉网站及域名。

对国内服务器提供商和域名注册提供商的政策也不十分了解,希望他们能尊重知识产权。

如果这些服务器提供商和域名注册提供商对他们自己客户的违法行为不能作出处理的话,我们将把这些服务提供商列为侵权诉讼的共同被告。

6)对抄袭和非法转载行为十分恶劣,并造成一定影响者,我们将把网站所有人控上法庭。并将把没有对客户违法内容负责的服务提供商列为共同被告。

根据中国和新加坡之间签订的政府条约,新加坡企业组织及个人的知识产权,在中国也必须得到中国政府的保障。

我注意到内容被抄袭或非法转载的决不仅仅是我一个人的文章,上面这些给其他受害者做参考。

对正在抄袭和非法转载者,你们也可以预先知道该怎么做了。

徐静蕾的博客值1500万美金

徐静蕾的博客超越Boing Boing成为Technorati世界排名第一。

Technorati是根据反向链接的数量来排名的。在看到这个新闻前,从来没想过流行度世界第一的博客会是中文博客。

虽然我也很喜欢老徐,可无论从哪个角度看,影响力,价值,质量,老徐的博客也不能和那些真正厉害的博客相比。之所以排到第一,唯一的原因就是反向链接最多。

这足以说明,中国就是人多力量大,中国市场真是大呀,而且很多上网的人喜欢动手,建自己的网站或博客。不管目前情况有多混乱,市场前景惊人。

用这个博客估价工具查了一下, 徐静蕾的博客价值US$15,892,365.54美金。厉害,拍电影不怕没人投资了。

又查了一下我常看的几个中文博客:

BianYue – US$0, 没ping到Technorati吧?

石头 – US$0, 也没ping到Technorati吧?

网络营销日志 $18,629.82

网鹰 – US$3,387.24

车东 – US$163,152.06

Google黑板报 – US795,436.86,果然厉害,开通没几天

NetFox – US$0

卢亮 – US$135,489.60

吕伯望 – US$0,不会吧?

小添 – US$0,看来很多人不ping Technorati。

幻灭的麦克风 – US$183,475.50

新竞争力 – US$0

月光博客 – US$1,129.08

柳焕斌 – US$$564.54

洪波 – US$832,131.96,发财啦!

我自己的搜索引擎优化排名SEO每天一贴 – US$3,387.24,这数儿眼熟。

以上数字纯为娱乐。

2012年2月16日星期四

博客有时候挺误导

博客这么流行,自然有它的道理。建站方便,写帖子方便,短小精悍,有针对性,有实效性。

但博客也有它的弱点。没有系统性,不便于整体把握某个话题。单看某个帖子时,还容易被误导。举两个我自己博客的例子。

前几天有读者email问我,W3C网站卖PR9链接的事,问我怎么联系W3C,他们想买链接。

首先,W3C的联系方式在他们自己的网站上。问我我也不知道,我也没买。

更重要的是,W3C在一个PR9的网页上,加上了赞助商或者说捐款人的链接,这等同于出售链接。不过这已经是过时的消息了。就在那个网页被发现以后,我印象中几天之内那个PR9网页的PR值就被至零。这表达了Google的一种态度。接到了那个读者的邮件后,我又看了一下这个网页的PR值,又变回为9。

赞助1000美金就可以登上自己的链接,当然物超所值。但问题是,再进一步研究一下就可以发现,这个网页传递PR的能力已经被人工取消掉了。点击一下网页上列出的捐款网站,就会发现这些网站没有得到传递来的PR值。里面很多都是PR3,PR4的网站,并没有因为有这么一个PR9的链接,而提升自己的PR。

当然这些都是后续发展,我在原来的那个帖子里面不可能提到。要不是今天写这个帖子,也不会特意再去谈这个问题。看到那个帖子的人,还真有可能被误导。

第二个例子是,我看到精品博客上说:ZAC认为html比php文件权重要高。实际上我完全没有这个意思。精品博客看到的是这篇友情链接伎俩的帖子说html文件比php文件优先度高。我指的是通常服务器的设置是这样,浏览器访问某个目录名时,服务器会自动寻找相应目录下的index文件,做为这个目录的首页。网站首页实际上就是根目录下的index文件。

如果存在多个index文件时,服务器会按文件扩展名优先顺序处理。一般来说index.html比较靠前,优先选择做为首页文件,index.php排在其后。所以当有index.html和index.php同时出现在目录下时,index.html的优先级比index.php高,会被当作目录首页。这和SEO完全没有关系,只是纯粹服务器设置技术问题。

精品博客的作者被我那个没有详细解释的帖子误导了。看精品博客帖子的读者就更可能被误导了。

我在精品博客上试着留言,可惜点击提交之后,出现一个空白页面,就没有反应了,留言也并没有贴上去。精品博客的作者看到这个帖子,可以修正一下。

结论是,看博客帖子,尤其是涉及很具体的话题时,不能百分之百无条件接受,还要考虑到实效性,上下文等相关问题。

给百度和雅虎出个主意

Google地球推出好长时间了,上面有各种各样好玩的东西。月光介绍了不少在Google地球和地图上稀奇古怪的画面,有军事基地,有楼顶上裸体晒太阳的,有疑似外星人留下的痕迹。

全世界不知道有多少Google地球粉丝,每天在上面找各种各样新鲜的玩意。玩过Google地球和地图的人也都知道,确实很好玩,满足了大部分人想旅行却没钱没时间旅行的愿望。

在Google地球上可以看到我现在住的那栋楼,也可以看到美国纽约街上的汽车。中国很多城市画面的清晰度也相当高,下面是北京城区内某个地方的Google地图抓图,这是我和我太太当年谈恋爱时常去的湖边,清楚得都快看到当时坐的那张椅子了。

map.gif

谁要能看出来这是什么地方,答对者有奖。 :-)

这么一个好玩到万众瞩目的应用,我一直觉得奇怪,为什么很少人在上面做广告?不用去找Google买,而是自己就能在上面做广告,只要你能找到足够大的场地。

那么多城市高楼上面的巨大的几里外都能看到的巨型霓虹灯广告板,那成本估计每年也得几十万上百万。如果跟那个楼的业主商量一下,把楼顶朝天的那面也租下了,不告诉他是干什么用的话,也许免费当bonus送给你了,反正你买了他的巨大霓虹灯广告,楼顶闲着也是闲着。

然后在上面油漆三个大字:Zac。过一段时间后,你公司的大名将会出现在Google地球和地图上。当然这段时间多长,还不确定,也许长达一两年。

虽然对咱们老百姓是不太现实,但对大公司来说,成本应该不算太高,与那些大公司花在电视报纸,巨型灯箱上的预算相比,应该挺划算。

与直接广告效应相比较,最吸引人的倒不是能在Google地球上能看到你的商标或产品名,而是最先这么做的必然会引起大家都关注。

月光会报道,世界上其他地方的Google地球粉丝也会报道。你的广告会被作为经典案例写进网络营销教材。主流媒体也许也会注意到。大家都在谈论你的广告。计划的好的话,潜在效益无穷。

有一定实力的公司应该都可以这么做,但谁做最能引起效果呢?当然是Google的竞争对手:百度和雅虎。冲突对立最有看头。如果哪天百度雅虎的巨大Logo,出现在Google地球或地图上,这本身就是条新闻。

也许有公司做了,我不知道。谁知道留言告诉我一下。

搜索引擎怎样判断文章或网页的原始出处?

复制内容网页有的时候会影响网页排名。

比如说原本是你写的文章,本来应该排名很好,但是其他人抄袭或转载你的文章,而且搜索引擎不幸的判断那篇被抄袭或转载的网页是原始出处的话,你应有的排名就会被那个网页夺走。

那么搜索引擎怎样才能从多个网页中挑出哪一个是原始出处呢?可能有以下几个考虑:

1)网页PR值。网页PR值越高,被认为是原始版本的可能性就越大。

2)网页第一次被收录的时间。网页被搜索引擎收录的时候越早,相比后发现的相同内容的网页来说,被当作原始出处的可能性就越大。

3)域名注册时间。越老的域名上面的网页被当成原始出处的可能性也越大。

4)网站的权威度。这就有点说不清了,可能包含前面3个因素,还有很多其他因素。

但到目前为止,无论以哪一个因素为主,或怎样组合这些因素,都不可能完全正确从多个网页中挑出原始出处。

比如说我这个博客就很新,域名也很新,文章被收录的时间有的时候也不一定是最早的,就权威地位和被信任度来说,也肯定比不上很多中文网站。但我的博客新,我的域名新,并不意味着我的内容就不是原始出处,实际上我的所有博客都是原创。

我最近也发现了很多网站都转载,有的时候是抄袭我的博客内容,很多网站的规模,历史,PR值都比我的网站要高的多。

在检测文章原始出处方面,Google做的比较好,基本上能够正确判断,百度做的就比较差。从我的文章在不同的地方出现的情况看,百度似乎认为域名比较老的就是原创。

这个问题不是网站管理员自己可以解决的,只有依靠搜索引擎算法的改进。

新站点怎样寻找外部链接

外部链接对搜索引擎优化的重要性大家都知道。

但现实情况是富的更富,穷的更穷。如果你的网站已经有了很多外部链接,PR值也高,排名已经不错,那么你的文章就更容易被其他人发现,其他站长很可能自动就链接向你的网站,不用费多大功夫。就算是寻找友情链接也比较容易。

但对一个新站来说,找最初的几个链接却是最难的。下面提几个建议。

新站点开通三个月以后,再开始寻找链接

全新的站点非常不容易得到外部链接。

我一般是从自己现有的高PR值网页,链接到这个新站点后三四个月才开始寻找其他链接。这样可以确保新站已经有了不错的PR值,而且已经被搜索引擎收录了大部分网页,其他站长看了你的网站,不会觉得链接到你有什么危险。

新站点刚一开通的时候,不要太着急。

登录分类目录

网站分类目录,网址站等就是要收录其他网址,所以从分类目录得到链接相对比较容易。

除了大型的分类目录,像开放目录,雅虎,好123等,互联网上还有很多行业分类目录,地方政府分类目录和个人的小型站点站等。花点时间找到这些目录登录。

当然前提是你的网站至少看起来应该不错,大部分分类目录也不会收录看起来就像垃圾站的网站。

写博客

博客社区和普通网站的一个很大分别就是经常更新,而且经常互相引用。只要你的博客内容有特色,其他写博客的人很容易就链接到你的网站。

先链接到别人

要想得到必须先要付出。而且导出链接也不是什么坏事,只要不要链接到垃圾站点。

链接到别人后,点击一下这些链接,让对方能够发现你已经链接到他们了。大部分站长都有检查日志的习惯,他们会发现你的网站已经链接到他了。

我几乎每天都会看日志,从日志中发现很多链接过来的网站,很自然的就会看一下。如果这些网站有好的内容,我会收藏,观察一段时间,真正质量好的,我会自动链接回去。

先做非商业性网站

一个完全商业性的电子商务网站确实很难从其他站点得到链接。设想一下,我为什么要平白无故链接到一个卖化妆品的网站呢?除非是朋友帮忙。

可以尝试先把网站的非商业性部分,比如行业知识,使用窍门等建立起来,然后在同一个站点再发展商业部分,或干脆建另外一个商业网站,然后从非商业网站再链接到商业网站。

与其他站长保持友好关系

和同行业内的其他站点多多交流,不一定一开始就以交换链接为目的。交流一下心得体会,行业新闻等对双方都有好处,时间长了成为朋友,再提交换链接的事情就容易多了。

怎样增加外部链接(二)

怎样增加反向链接/外部链接(一)

提交分类目录

两个重要的网站分类目录雅虎和开放目录对网站排名,特别是克服Google Sandbox沙盒效应还是有很大作用的。

不过进入这两个目录挺困难,雅虎英文目录收取每年299美金的审查费,却不保证收录。雅虎中文目录似乎已经被取消了。开放目录是由志愿编辑来审查网站的,有的时候编辑处理很慢,有的时候会带有一些偏见。

还有不少行业性或地区性的网站分类目录,都尽量逐渐向这些目录申请登录。

向个人网站寻求链接

由于互联网刚开始的时候没什么商业性,很多很个人的网页历史非常早,PR值很高,被信任度也很高,尤其是一些大学或非盈利组织的网站中的网页。

很多大学老师都在所在学校域名有专门的网页,有很多学生也都有建在学校域名的网页。而不少大学网站PR值和信任度都相当高,这些比较个人性质的和研究性质的网页也都有很高的链接投票权重。

如果你找到和你的行业相近的这类网站,不妨直接和网页的主人联系,如果你有一个内容丰富的网站,看对方能不能给你一个外部链接。

买链接

虽然搜索引擎对买卖链接,尤其是以PR为目的的买卖链接,非常不喜欢。如果被检测到是买卖的链接,一般链接的投票权重都会消失。但毕竟买卖的链接和自然的链接的判断是很困难的。搜索引擎怎么从链接本身来知道私下有金钱交易呢?

当然在购买链接的时候,应该避免那些经常被判断为买卖链接的特征。比如说在链接周围有广告赞助等字样,链接出现在左面的菜单下面,买链接的网站和你的行业完全无关,整个网站每个网页都链接向你等等。

交换链接

也就是我链接向你,你链接向我。有时候不少站长用三向的间接交换链接,其实这种三向的模式对搜索引擎来说并不难判断。

虽然交换链接的价值越来越低,尤其对Google来说。但是两个相关的网站,或者是好朋友的站长之间交换链接是很正常很自然的一件事情。只要内容相关,交换链接在一定时期内不会完全没有作用。

发新闻稿

你的网站或公司如果有什么具有新闻价值的事件发生,可以向新闻类的网站发新闻稿。在英文网站中有不少专门提供发送新闻稿服务的网站,其他新闻类的网站也都到这些网站来搜取新闻,所以你只要把新闻稿发到这几个新闻稿服务网站就可以了。

这些链接都是单向的,而且一般来说新闻类网站的权威度和被信任度都比较高。不知道中文类网站有没有这种服务。还没有?商业机会出现了。

网摘和书签

现在有不少社会网摘和书签类网站,这些网摘的链接经常也会在网摘本身网站和做网摘的人自己的网站上出现。而且这类链接是由读者自愿提供的,这类用户行为方式最近越来越被重视了。

充分利用维基百科(wiki)

维基Wiki这两年挺流行,你可以找一下和你行业相关的条目,或者自己写新条目,然后在外部链接下列上你的网站和其他相关的网站。当然前提是你的网站必须是真的相关,有价值,不然你的条目很快就会给别人修改了。

小工具诱饵

小工具作为链接诱饵最近是个挺热门的话题。Matt Cutts在SMX大会上提到过,前几天一直在介绍的Matt Cutts访谈也谈过工具诱饵

这个话题之所以变得热门,部分是因为有一个大家津津乐道的,从成功使用到用过了头被惩罚的案例。

很有才华的前SEOMoz员工Matthew Inman,自己建了一个网上交友网站Mingle2,然后想了一个很好的方法吸引外部链接。他编写一些小测试和问答题,用户做完这些题后,程序显示一个成绩,并且提供一段HTML代码。用户可以把这段代码放在自己的博客上,显示出这个问答的分数。当然,代码中包含链接。这就是典型的小工具链接诱饵,widgetbait。

Matthew写的这些小测试题都挺有意思,比如你能在月球上生存多久?你能在真空中生存多久?测试一下你在博客里是不是话太多了?如果被困在家里,你能生存多久?你在5分钟内可以想出多少个国家名称等等。据Matthew说他写了几十个这样的小测试题。链接文字就是免费网上交友(free online dating),网上交友(online dating)等。

他的个人网站取得了很大成功,网站被另外一个网上交友网站JustSayHi所收购,人也被挖了过去。在新公司Matthew就继续发挥自己工具诱饵的效能,把JustSayHi网站排名迅速提高了。

到这里都挺好,然后麻烦开始了。

网站JustSayHi的母公司Next Internet又收购了一些其他网站,包括贷款卖药等类的。很自然的,母公司希望Matthew使用同样的方法,帮助推广那些新收购的网站。Matthew就在自己的工具代码中,放上了那些新网站的链接。没过多久,不但那些新网站排名没上去,连原来的已经排名第一的网站JustSayHi,也被惩罚了。连搜索网站名称时,都没有排在前面,到现在也还是这样:

好在Matthew与Google内部人员有些联系,经过询问后,知道被惩罚的原因是什么。具体原因Matt Cutts在前些天的访谈中也有提到过。主要是方法用过了头,链接不仅有指向原来开发工具诱饵的JustSayHi网站,还开始指向第三方网站,有付费链接的嫌疑。而且这些网站都是有大量垃圾网站的行业。虽然这些网站都同属于一个公司。工具中链接的有堆积关键词嫌疑,而不是简单的Powered by 中新网络科技这种标准格式。

Matthew提交了重新收录请求,承认了自己的错误。不过并没有使网站从惩罚中逃出来。迫不得已,Next Internet公司以及Matthew放弃了JustSayHi网站,新建了一个OnePlusYou网站。虽然还是用同样的工具诱饵做为网站推广方式,不过这次做的比较谨慎,没有再放上指向第三方网站的链接,只是链接文字还用的是free online dating。

几个星期之后,Google内部的人通知Matthew,怎么这些不相关的工具诱饵又出现了?可能会伤害那个新的网站。估计凡是与Matthew及JustSayHi公司相关的网站,都被特殊照顾了,哪怕是一个全新的网站。Matthew赶紧把链接文字改成Created By OnePlusYou。

从这个案例可以看出,很多有创意的链接诱饵,也是有个界限。使用得当,SEO效果威力惊人。像Matthew的工具诱饵,几十天内造出几十万外部链接。但使用过头,Google很生气,后果很严重。

2012年2月15日星期三

反向链接策略在未来几个月的趋势

最近Google收录网页数下降及对排名所做的一些调整都和链接质量有关,尤其对买卖链接和垃圾链接进行了一定强度的清理。

在接下来的6到12个月里,我想网站的链接策略应该有这样一些趋势。

发表文章或被引用的文章还会有用

不管是主动发表还是其他网站引用的文章,通常都会链接回原始出处,这些反向链接在未来的一些时间都会有用。

反向链接在网页上的位置非常重要

尤其对买来的链接。搜索引擎也不傻,一般来说买的链接都是在几个标准的常用的地方,比如说网页的底部,或者左面的导航栏里。这些地方的导出链接在很多时候是有金钱交易的,当然还要考虑其他因素。所以在买卖链接的时候,如果能把链接融入到网页正常内容中就最好了。

网页内容相关性非常重要

搜索引擎很可能在不久的未来,把来自高PR值,高权威度,但是不相关网页的链接权重降低。由于历史的原因,互联网上存在很多老的,PR值很高的网站,像一些地方政府,地方报纸,学校,研究机构等等。来自这些网站的链接如果和你的网站内容毫无关系,对排名的帮助在未来会大为下降。

网站自身的年龄和质量也很重要

你的网站如果提供了大量独特的有用的信息,那么即使轻度牵扯进一些垃圾链接或买卖链接,可能是可以被原谅的。如果你的网站没有大量有用的内容,就比较危险了。所以要想反向链接起作用,网站本身质量首先要保证。

博客链接

来自博客Blogroll的链接,会被降低权重。一般博客都会有一个很长的Blogroll,列出作者经常参考的其他博客或友情链接,这些链接是非常容易被识别出来的。虽然没有垃圾或买卖之嫌,但因为友情性质比较重,可能在未来这些链接也会被降低权重。

但是在博客正文里面所引用的其他网页链接重要性非常高。

震惊-AOL公布3个月的搜索数据

美国在线AOL今天干了一件令很多人震惊的蠢事,他们公布了3个月的真实的搜索记录。

根据AOL的网页介绍,所公布的数据是2006年3月1号到5月31号,包括1900万搜索,1080多万不一样的搜索词,还有65万8000个用户ID。

问题是这非常有用的资料也同时可以泄漏用户个人隐私。

有的搜索词本身就含有个人隐私性质,比如可能有的人会搜索”xxx小姐裸照”,或”某某某先生破产记录”,这些搜索本身就可能含有当事人不愿意告诉别人的信息。

大量的搜索记录也有可能与特定的人相联系。虽然用户ID都是匿名的,但是从某个用户ID所做的一系列搜索,可能可以找到这个用户的真实身份。

比如某位用户搜索了”site:xxx.com”,我们可以查一下这个域名的所有人,也许这个用户还搜索过某个具体的人名。这两种搜索都是站长们很常做的,看一下自己网站的收录情况,看一下自己名字在其他地方被提到的情况。如果这位用户同时又搜索了其他不愿意让人家知道的信息,当所有这一系列行动都被公布的时候,隐私就岌岌可危了。

我看了一眼搜索记录其中的一段,举一个例子,一位用户搜索了这些关键词:

怎样炸掉一栋楼
怎样给别人下药
怎样制造炮弹
怎样攻入别人的电脑

同一个客户还搜索了几个域名。

AOL公布的信息量非常大,2G多的文字,我只是随机的看了一小段,如果有心人士编个程序分析,得到的资料会相当丰富。

当然AOL发布这个信息几小时后就意识到了这件事的愚蠢,已经把网页撤下了,并公开道歉。可是在网络上覆水难收,这些资料已经被放在了很多地方供下载

再看几个随机的关键搜索词:

怎样杀掉太太
怎样杀人不会惹上麻烦
怎样成为三级片明星
免费照片
车祸照片

当然这些搜索记录对要进行关键词研究的人实在是无价之宝,因为这是真实的,来自主流搜索引擎的最新资料。

从这个事件,我们也可以看出为什么前一阵Google拒绝美国司法部要求提供搜索信息,得到绝大部分人的叫好。

更新:

纽约时报记者根据搜索数据(地址和名字)轻易地找到一位62岁的老太太,这个老太太证实那些列出的搜索词确实是她搜的。

不知多少人正在挖掘呢。

Yahoo正在更新

Yahoo官方博客刚刚发布消息,Yahoo又在进行更新

我查了一下比较关注的几个关键词,排名上下波动比较大,应该还没稳定下来。

Yahoo!雅虎更新

几个小时前Yahoo!开始新一轮更新。

虽然在搜索引擎市场份额不大,我对雅虎一直充满敬意。

另外,Yahoo!将在一个星期左右开始支持NOODP标签

雅虎挑战Google PR

Google PR是现在搜索引擎技术的基石之一,其他搜索引擎不一定叫PR,但肯定也在使用相同的技术。PR值在搜索引擎排名的各个阶段都可能用到,比如计算最后的相关度,决定抓取周期,抓取深度,以及是放在主数据库还是补充材料数据库

PR值的计算是假设网页上的链接有相同的权重。据SEO by the SEA报道,雅虎今年1月10号刚刚被批准的一份名为用户敏感PageRank的专利对PR值的这一假设做出了挑战。

申请这一专利的人对PR有非常深入的了解,挑战的PR计算基本假设包括:

不是所有链接都是相同的

用户并不是随机的点击网页上的链接,有些链接天生就比其他链接更重要。比如说网页上的隐私权政策链接,很少有人点击。

用户并不随机访问网页

PR计算的一个假设是当用户烦了的时候,并不点击网页上的链接,而是随机的转到网上的另外一个网页。这种假设并不现实。因为一般人离开原来网页去其他网站时,并不真正随机。重要门户和个人网站被随机访问的机会相差甚远。

无聊的用户并不只是去被信任的网页

像上面说的,无聊的用户不再点击链接时,下一个访问目标既不完全随机,也不一定就会去被信任的网站。

网页随时间以不同速率改变

PR值的计算忽略了有时网页会被买卖或起其他变化,有的时候会过时,这些变化的速率对不同网站也是不同的。

雅虎的这份专利引入用户行为数据来修正PR值计算中不现实的假设。考虑的用户行为方式包括:

链接权重

链接权重受用户实际上点击的比例影响。点击多的链接权重比较大。

随机到达新网页的可能性

用户不是点击链接,而是随机来到新网页的可能性也被用户数据所修正。

对网页的满意度

用户停在网页上,并不再继续访问新网页的可能性,也通过用户数据有反应。用户停在某个网页上,意味着对这个网页满意度更高。

这三个部分组合起来,将产生一个网页文件的权重值。

一直以来,雅虎在引入用户行为模式方面走的就比较远,所拥有的社会化网络也比较多。这份专利申请体现了雅虎在用户数据上的专注。

Zac访谈小鹏

小鹏是谁就不用多介绍了。知道我的就知道点石,知道点石的就知道小鹏。

虽然同是点石的创始人,我们去年才在南京的SMX大会上第一次见面。

小鹏一直以来都带领SEO团队,在SEO工作流程、团队及项目管理等方面有很多经验。可以这样说,小鹏一说话,全国与SEO团队、项目工作相关的人都得仔细听。

Zac访谈Netconcepts中国总裁渠成

厦门SMX第一天,到会场太早了,会展中心大门还没开呢。进入会场后看到Netconcepts中国总裁渠成在忙着布置展台。

渠成是搜索营销大会的常客。去年南京SMX和今年点石深圳茶话会都有遇到渠成,不过这次才第一次和他正式交谈。

下面是与渠成的访谈视频。

Zac访谈Matt Cutts

SEO专家访谈系列刚刚完成第一篇。有的问题比较敏感,Matt Cutts也很忙,所以花了比较长时间。

不过希望大家能觉得等有所值。

访谈主要围绕中文搜索和搜索引擎优化。Matt Cutts和Google的“顶级中文反垃圾工程师”, Jianfei(朱健飞),回答了我的问题。当然很多问答并不局限于中文搜索和SEO,对所有SEOers都有参考意义。

佳伦兄第一个猜对访谈对象。能否告知邮寄地址,我会寄件小礼物。:-)

下面是访谈的中文翻译。英文原文在这里

Zac: 首先谢谢你们接受这个访问,我相信对中国的SEO和网络营销者们会很有帮助。

目前在中国对SEO有不少误解。有的人听到SEO的第一个念头是“垃圾”。有的说SEO是短视的,是自寻死路。从搜索引擎的观点看,这是真的吗?对Google来说,SEO是被讨厌的,允许的,还是鼓励的?我指的是白帽SEO。

Matt: 认为搜索引擎不喜欢SEO是常见的误会。事实是,遵循Google质量指南(quality guidelines)的SEO是OK的。这包括像确保你的站点能被爬行,想出人们在搜索时会用的词并把这些词自然地包含在网站内容中,让网页标题和URL具有描述性等。

Google和其他搜索引擎不喜欢的是,有些人尝试欺骗或走捷径获得比他们本应有的更高的排名。当站点违反我们的质量指南时,Google称为垃圾(spam)。

Zac: Google在2006年4月正式启用中文名“谷歌” ,不过大部分中国用户好像不喜欢这个新名字。

根据中国互联网信息中心的调查,Google的市场份额从05年的33%降到了06年的25.3%。你们怎么看调查中市场份额的降低?

Jianfei (朱健飞): 就这个市场份额,让我们参考李开复的说明,“这些调研数量可能会有一定的误差。不同的用户,使用搜索引擎的频率会不同,有人可能一天用10次搜索引擎,有人可能一天只用一次,简单的采样结果也许并不能真实反映流量。”

Zac: 我注意到Google总部有中国员工。知不知道Googleplex里有多少中国人?他们做的怎么样?对想加入Google的粉丝有什么建议?

Jianfei: 我们在Googleplex确实有很多中国工程师。他们做得都很出色。你可以浏览 http://www.googlechinablog.com/ 上一些中国工程师关于他们在Google生活的文章。

想加入Google的粉丝可以在 http://www.google.cn/jobs/ 查招聘的职位。不能加入Google也欢迎给我么建议和想法。他们的支持对我们很重要。举报垃圾站可以到 http://www.google.cn/contact/spamreport.html

Matt: 实际上,如果你注册了Google Webmaster Central
http://www.google.com/webmasters/

你也可以用这两个表格报告垃圾
https://www.google.com/webmasters/tools/spamreport?hl=zh-cn
https://www.google.com/webmasters/tools/spamreport?hl=zh-tw

另外,如果你不想注册Google账户,也可以在这里举报spam:
http://www.google.cn/contact/spamreport.html
http://www.google.com.tw/contact/spamreport.html

不过我还是建议用前两个。我们对Webmaster Central的垃圾报告给于更多权重。

Zac: 我们谈谈复制内容,最近很热的话题。

我在中文网站看到更多的内容复制。很多中文站长喜欢从其他网站“采集”内容,有的用软件,有的人工,然后放在自己的网站上。Google是否惩罚这种放满了四处可见的内容的网站?是否有个百分百或门槛,超过了会导致惩罚?

原创者应该怎么做才能确保原创版本被正确辨认?

Jianfei: 我们注意到了一些中文网站有很多复制内容。用户喜欢看到不同的搜索结果,所以Google尽力提供多样的结果。我们的算法已经有了一些清除复制内容的办法,我们会继续寻找改进的方法。

Zac: 有的网站使用多个域名,内容完全一样,比如说domain.com和domain.com.cn 。这样危险吗?最好的处理方法是什么?

Matt: 如果内容真的一样,我会选一个域名,另一个域名做转向到选定域名。比如,google.com 做永久转向 (301) 到 www.google.com,我们会看到并通常会选择转向指向的那个。如果内容是不同的语言(比如中文和英文),那么在两个不同的域名的内容没什么危险,但是如果内容完全一样,最好从复制域名做永久转向到一个选定域名。

没有转向的镜像网页可以产生问题。最好使用301/永久转向,因为Google也许选择删除或不显示你最喜欢的版本。

Zac: 我一直在我的博客强调好的原创内容,这个观念也被中国的SEOers很好地接受。问题是,正像很多读者问的,比如说,如果我的公司是卖“玻璃磨边机”的,这东西根本就太乏味了,我能写些什么有意思的内容呢?能不能给些这种高度专业化产品内容发展的窍门?

Matt: 别忘了创造性真的会帮很大忙。比如,有个做工业混合机的站,听起来是挺乏味的题目。但是去看看这段视频: http://www.youtube.com/watch?v=aM94aorYVS4 你会看到奇妙的东西。他们把各种物品扔进混合机来证明他们的机器有多厉害。

确实,一些重型机械或工业站点初听之下是比较无聊乏味,但从创造性的角度看的话,你经常能提高对你公司的兴趣。即使像newsletters,博客,行业信息,或其他资源也可以是别人对你的站感兴趣并连向你的原因。

Zac: 我们能找到的PR最高的中文站是PR8。就PR来说对中文站有歧视吗?如果没有,为什么没有PR9甚至PR10的站点?PR对排名还有用吗?

Matt: PageRank确实取决于互联网的链接结构,但我不会因为看不见PR9或PR10的站而灰心。 其一,中文站通常是跟其他中文站比较排名,所以比赛还是公平的。同样很重要的是Google的PageRank有更细的量度(并不是简单的1到10),所以都显示工具条PR6的两个站可能有不同的PageRank。

Google对非英文站点的权威声望度的测量有特殊处理来帮助。

Zac: 英文网站SEO和中文网站SEO有什么显著区别吗?你们的算法对不同语言处理有不同吗?

Matt: 我觉得不同国家在怎么做SEO方面确实有不同。比如,在德国,人们更可能在域名里用连词符(-)。有的国家更倾向于通过联署计划(affiliate programs)赚钱,有的国家通过手机比信用卡赚的多,因为信用卡不是在每个国家都同样常见。 但是在SEO的操作上也有很多相同点。

Jianfei: 英文网站SEO和中文网站SEO的一个主要区别是要做的搜索词。比如“viagra”是英文里垃圾最多的搜索词之一,“手机铃声”在中文里垃圾更多。另一个区别是差不多所有大中型中文站都有博客,其他语言就不是。

Zac: 其他国家的AdWords用户一般直接在Google注册。不过Google在中国采取了另一种方式,与AdWords代理合作,在某种意义上是本地化的方式,因为中国的所有其他关键词竞价(PPC)提供商都这么做。

与广告商保持直接关系已经在世界范围被证明是成功的,为什么Google在中国采取了本地化的方式?你觉得AdWords在中国成功吗?

Matt: 我不是专家,但我知道Google尝试适应每个市场,以那个国家最有效的方式呈现产品。我为AdWords组感到自豪,我认为他们在中国干的非常好。

Zac: 一些SEO相信新鲜度(freshness)在Google排名中起到很重要作用。很多人认为博客容易得到好的排名,部分得益于新鲜度。但是有的SEO认为经常修改网页不是个好主意。

你的建议是什么?经常更新还是不?

Matt: 这取决于你所在的行业。我会做对用户有益的所有事。为更新网页而更新网页可能效率不会高。但如果你有个博客,经常更新可能吸引更多用户。所以对有些人来说,不太常更新可能更适合(比如生产制造公司),对另一些人经常更新更好(比如你是个博客的话)。

Zac: SEO服务是个可靠的商业模式并值得向中国的SEOers推荐吗?我这么问是因为在中国有规模有声望的SEO公司非常非常少。很多公司声称他们提供SEO服务但实际上他们做的就是在论坛和博客发垃圾。

遵守规则的单独的SEO们正在为生存奋斗。

我相信你们知道很多成功的SEO公司。在中国,SEO行业有前途吗?我们怎么从个人成长为有信誉的SEO公司呢?

Jianfei: 我认为如果SEO按照Google的质量指南的话,他可以有很好的未来。搜索引擎结果对行业很重要,所以对守规矩的公司的市场需求会很多。

Matt: 如果你在考虑用SEO,眼光放长远非常重要。用户突然增加然后Google或其他搜索引擎发现spam并删除网站,这对网站没什么用。可以问问是否有参考客户,或者是否能有SEO提供稳定长期流量的成功故事。

http://www.google.com/support/webmasters/bin/answer.py?answer=35291&hl=cn 是个很好的帮助调查SEO的文件。不幸的是,有些SEO服务,你雇用他们的话,他们会发垃圾,应该从一开始就避免他们。

Zac: 最近很多关于被信任的域名和权威网站的讨论。如果一个站被认为是权威,它会在Google排名高,更多人找到这个站所以带来更多链接,然后它变得就更强。

普通默默无闻的站怎么克服这个情况和权威站竞争呢?除了建一个有很多有用原创内容的好的站点,有什么捷径吗?

Matt: 如果是刚建的普通小站,我不会去尝试热门关键词。把精力集中在一个小的你能被当作专家的利基市场。当你被更多人知道了,你可以从小利基市场往越来越大的领域发展。很多成功的站都是从小站开始,往大发展。而且,你越有创意,越有趣,越有帮助,这常会有助于人们注意到你。

Jianfei: 比如,你的站 http://www.seozac.com/ ,就是这样的站。一年前,这个站没人知道,但通过你的勤劳工作和创造性努力,现在它在搜索[搜索引擎优化排名]时排名很好,这令人印象深刻。

Zac: 你去过中国吗?如果你计划访问中国,这里有成千上万的粉丝想亲眼见到你。 :-)

Jianfei: 我在中国出生,去年去了中国两次。我很喜欢与Google中国的同事工作。

Matt: 很遗憾,我没去过中国。我妈妈去过中国几次,包括阳朔(桂林),我太太去过一次,并且虽然他们都是美国人,他们都会说点中文。我得努力争取去那里。我听说中国是个奇妙的国家,我很乐意有一天去访问。

我去不了今年的SES中国大会,但我很高兴Jianfei或另一个Google代表将出席SES中国大会。Jianfei是反垃圾组的顶级成员,在中文反垃圾方面比我要更专家。 :-)

Zac: 我每天都在我的博客里看见大量链接垃圾。论坛或博客里的链接垃圾会导致惩罚吗?还是被Google直接忽略因此对排名没影响?

Jianfei: 实际上,发链接垃圾可以变得危险。如果Google发现一个公司在发链接垃圾,这个公司的站可能从索引删除。除非我们再也看不到垃圾链接,Google不一定会重新收录。在大部分情况下,删除链接比加入链接还难(比如用垃圾软件发在博客和论坛的垃圾),所以还是离链接垃圾远点好。

Matt: 通常,Google会忽略链接垃圾。当我们知道一个公司确实发链接垃圾,我们可能采取适当的行动。

Zac: 另一个在SEO论坛和博客的话题是补充材料。如果一个域名有越来越多的页面进了补充材料,这是否意味着这个域名正在丧失信任?如果你是SEOer而不是Googler,你会担心补充材料吗?

Matt: 我不会担心补充材料。如果你的域名PageRank低,它可能就会进补充材料索引,但这不意味着站点被惩罚或丧失信任。通常只是意味着,如果你能因为你的站点好而得到一些高质量链接,我们会把你的站点的更多页放进主索引。

另外,补充材料更新已经更快,显示给用户的也更多了,所以站长经常看到更多到补充材料页的流量。

Zac: 百度是你们在中国市场的最大竞争者。据说百度在某些搜索技术比如中文分词上比Google更好。

另一方面,Google已经在中国招聘顶级人才。我从一些材料读到Google中国的工程师对核心排名算法还没有很多贡献。你们计划将算法本地化以更适合中文语言吗?与百度相比,你们的技术优势在什么地方?

Jianfei: 不对特定竞争对手置评是我们的政策。我们欢迎有助于向用户提供更多有用信息和选择的竞争。对我们和搜索领域的所有人来说,良好的竞争都是有益的,能使我们更努力,最终结果是,用户获得好处。

Matt: 我们不大谈论我们的排名,因为是机密,但中国分部从几方面对Google怎样排名做了贡献。实际上热榜 http://www.google.cn/rebang/home 这样的出色应用就是在中国首先出现的。这是在中国开发的全新产品。

Zac: 如果你不介意的话,Matt,你是不是如暗示的,是站长世界的GoogleGuy?Google与站长的沟通非常出色,我们很感谢。有没有可能某位Google中国的工程师能起到类似的作用,与中文站长社区积极沟通?

Matt: 我们没有确认过GoogleGuy的正式身份,这没关系,因为如果GoogleGuy需要休息一下,其他人可以进来帮助沟通。事实上我得到了比我应该得到的更多的名誉。英文的沟通其实通过很多人,Vanessa Fox,Adam Lasnik,还有很多很多其他人。

在中文,我很幸运与一组像Jianfei这样的出色团队,还有在Mountain View(美国加州)及北京的其他出色的人一起工作。我想Google将开始与中国站长更多沟通。这个联合访谈就是好的开始。

Zac: 在中国有些争论,SEO在网站总体中起到什么作用?SEO是不是网络营销和电子商务的重要部分?有的网络营销人认为SEO是小菜一碟,写写标题标签,这里那里加些关键词,诸如此类。

你觉不觉得现在的SEO已经深入一步,充当某种网站营销顾问的角色?换句话说,SEOers应该帮助客户优化线上销售流程,目标市场定位,内容发展,用户体验,病毒式营销等。 这是我在尝试推广的观念。最终,用户需要好的网站,不是好的代码。

Matt: 我同意很多时候SEO是创造一个好的网站,不仅仅是把网页设计和代码弄对。SEO包括把标签和代码写对,但那只是第一步。如果你能计划一个出色的病毒式营销活动,或者通过口碑传播让人们谈论你的站点,这也是SEO,而且是比使用垃圾软件好得多的获得链接的方式。

在很多方面,SEO是确保用户有良好体验,因为一个出色的网站会有助于在搜索引擎自然地得到好的排名。

Zac: 你预见SEO在接下来的几年会有大的变化吗?

Matt: 我认为个人化和本地化是大的趋势。如果Google对用户了解多些从而返回不同的搜索结果,那可能对用户来说是搜索质量上很大的改进。那将使SEO更困难,但关心长久价值的SEO们会对个人化很高兴,因为他们将得到更多对他们的网站感兴趣的流量,这些流量可能会转化为客户。

Jianfei: 当然,Google也将继续关注质量和SEO。假以时日,中国SEO们会发现做符合我们的质量指南的好的网站变得容易了,因为Google会继续努力扫除垃圾。

Zac: 喜欢中国食物吗?

Matt: 我爱中国食物。不过我听说美国的中国食物跟中国味道不太一样,可能以后得找机会试试真正的中国食物。比如,想试试北京烤鸭。

谢谢问这些有趣的问题。

Zac: 谢谢Matt和Jianfei。

Matt: 谢谢。我们希望大家在 https://www.google.com/webmasters/tools/spamreport?hl=zh-cn
https://www.google.com/webmasters/tools/spamreport?hl=zh-tw
举报中文垃圾并使用我们的站长工具。中国站长也可以在这里看到很多有用信息 http://www.google.cn/support/webmasters/ 。我们会继续听取中国站长的意见并试着回复。

我们很喜欢看像 http://www.seobbs.net/ , http://www.dunsh.org/ 这些站点,当然还有 http://www.seozac.com/ :-)

SEO案例诊断的逻辑,直觉和细节

SEO不是数学,大部分地方没什么精确性。SEO更靠近是门艺术,很多时候是靠着说不清道不明的直觉和经验,同时逻辑及细节也很重要。

举两个最近帮人看的网站诊断案例。

一个朋友的网站,莫名其妙的在搜索引擎中消失了。以前收录正常,不知从什么时候开始,网页越来越少直到完全消失。

我看了一下网站,就是一个简单的个人网站。逻辑告诉我,商业性网站作弊被K的可能性往往不小,个人网站作弊可能性微乎其微,没有利益驱动,根本不值得这么做。网站不被收录,除了被K,要么就是robots.txt文件禁止抓取,或服务器设置禁止蜘蛛抓取。

从现象来看,我的直觉是robots文件有问题。可是打开robots文件看了看,实在看不出什么问题,是很简单的允许所有搜索引擎抓取。Robots文件里多一个斜杠少一个斜杠,天差地别,所以我瞪大了眼睛仔细看,确实看不出什么问题。

这时细节要发挥作用了。我用线上robots文件验证工具查了一下,三个工具有两个工具显示文件最前面多出一个莫名其妙的问号,就像英文电脑没装中文字体打开中文网站时看到的那种问号。直接在浏览器打开robots文件,或者对方把文件传给我,用编辑软件打开,都看不到这个问号。

经过简单对话,发现这位朋友使用的是Windows Vista操作系统。以前就听说过Windows Vista系统有时候在处理文字时编码会有问题。不知道什么原因。不过结果是robots文件编码可能出现问题,搜索引擎抓取后产生错误理解,结果不抓取网页。

我在我的电脑里把文件重新存一遍,传给对方。对方不打开不编辑,直接上传网页空间,几天后,抓取开始正常。

另一个出现问题的是英文网站。在google.com搜关键词,排名三天两头在第一页到四五页之间跳来跳去。但是在google.cn排名稳定。因为是英文站,所以在google.cn的排名毫无意义。

逻辑告诉我,这和网站语言或服务器位置有关。看了看网站,是纯英文,没有中文字,服务器在美国。检查了一下网站的反向链接,有大量的中文网站链接。所以初步判断,这些链接被判断为有垃圾嫌疑。但是有很多英文网站其实都有大量垃圾中文链接,就算排名很差,但并不会出现这种现象。

我的直觉告诉我,虽然和大量中文网站为伍,但不至于被惩罚,而且惩罚也很少见到这种现象。

看网站页面看不出什么。突然发现一个细节。在google.com,这个网页的排名旁边写着”Translate this page” (翻译此页),这是个很奇怪的现象。我的电脑是英文系统,用的是google.com,英文网站的英文关键词排名,不应该出现翻译此页这个链接。这说明Google是把这个网页当成中文网页了,所以在google.cn中排名稳定,但是在google.com中跳来跳去。

再仔细看网站,确实没有中文。打开CSS文件发现,定义的字体中有中文字体。建议对方把中文字体删掉。过一段时间后,问题解决,google.com中排名稳定在第一页,当然google.cn的排名跑后面去了。

这两个案例都是网上的朋友在问了很多专家高手都找不出原因后,通过MSN问我。 我估计专家高手们可能想得太复杂,往作弊啦,惩罚啦等方向分析去了,却忽略了简单的逻辑和直觉。

最后提一句,请大家尽量别通过MSN或email让我看看某网站,诊断一下,出个主意之类的,问了我没回答也请见谅,因为我的时间真的很紧。紧到半年内付费咨询顾问我也一概不接,也请别问了。

2012年2月14日星期二

渡虎谷SEO大赛总结

本来想渡虎谷SEO大赛完全结束后再写篇感想。石头建议,我是大赛评委之一,点石又是主办单位,最后一期的总结和评论就由我来写。

这样也好。还真有不少感想。

精彩的地方就简略地说说,主要说不足吧。

大赛过程中几个引人注意的地方

简单列出几个大赛过程中尤其吸引我注意的点。不少已经在Robin前三期总结里提到了。

–大赛初期有人组织“儿童渡虎谷文学”,非常好的创意。下面还会谈到。

–三大搜索引擎对比赛还是友好的。我相信百度,Google,雅虎都注意到了这次大赛,没有令人意外的举动。

–10万重奖,第一次中文SEO大赛,我觉得已经很牛了。难题是,下次怎么办啊?-:)

–有人竞价关键词“渡虎谷”。SEO的目的是什么?是营销。竞价“渡虎谷”成功地在圈子里营销了自己。

–图王“站长网全力参加渡虎谷大赛”,“并准备号召数万站长齐参与”。目前看排名尚可,大概没太用力。

–九天一剑率鼎盟团队高调参赛,其主站百雅歌已不见踪影,可能用力过猛。

–龙海的渡虎谷SEO学院排名手法引起争议,尤其是站群和博客链接。

大赛组织和宣传的不足

毕竟是第一次,组织策划宣传等方面肯定有不少缺陷。

–比如是否应该限定参赛网站必须是新域名?域名年龄是不可控因素,多少会造成些不公平。

–是否应该在大赛开始前邀请并确定站长站等参加?或者至少达成给于宣传的默契?很多站长聚集的论坛会员众多,如果能邀集他们一起参与,声势会更加浩大。

–是否应该在一开始就能确定10万级的奖品?这样参赛的很可能更踊跃。无可讳言,10万和一千的吸引力差别不是一点半点。但后来才加进10万奖品使有的人感兴趣却来不及了。

–是否应该更突出为名誉而战,而不是奖品?这点对很多专业SEO很重要。SEO大赛的冠军意味着荣誉,专业地位,和订单。也许第一届影响力还小,以后就越来越是金字招牌了。

–怎样在制度设计上使大赛更公平?比如是否要适当限制原有链接资源的使用?不然跟手上有1万个站的人怎么比呢?

我觉得这第一次已经做的很好了,比我预想的要好。这是一个高起点。以后完全可以做得更细致,更有吸引力,更轰轰烈烈。

少见创意策划和营销战术使用

点石一直在强调,SEO做到后面会有瓶颈,技术上的东西就这么多,要想突破,要靠创意,策划,营销战略。

有的朋友会觉得这已经超出SEO的范围。我想强调两点:

1)策划和执行都出色的网络营销创意,往往结果之一就是搜索引擎排名的提高。这样的工作为什么不算SEO呢?

2)就算网络营销超出了SEO的范围,我们做SEO的应该当仁不让地去抢占这块地盘。没有人比SEOer更合适。

这次大赛最遗憾的是,有特色,让人眼前一亮的创意太少。大部分人似乎还是局限在“渡虎谷就是SEO比赛”的框框里。

谁规定渡虎谷就得和SEO有关系呢?

前面提到的“儿童渡虎谷文学”是个很有特点的创意。抛开SEO,抛开站长们,创意者号召家长写儿童文学,写的人完全不必知道有个SEO大赛。如果创意者有能力煽动起一批家长,并以某种形式把力量集中在一个站点上,这个站很有希望。可惜的是,这个创意没有被好好执行。

创意的范围还可以很广。

有没有人想过把渡虎谷变成政府行为?挂个牌子,虚有其表,实为个人行为的政府行为四处都是,渡虎谷为什么不行?

有没有人想过与名人合作?尤其是娱乐圈名人。与想在网络上推些什么的唱片公司,经纪人公司,杂志,大片小片,等等合作。他们要什么?要更大的名。你要什么?要一个词。大可共襄盛举。

有没有人想过恶搞?有没有人想过动漫?视频?希望工程?

“渡虎谷”这个词本来是完全开放的,可以和很多事情挂上钩。

内容写作亮点不多

有吸引力的原创内容写作是SEO必备技能。这次大赛在内容写作的创新上有可圈可点之处,也有很大改进空间。

大部分是以渡虎谷为名写正常的SEO博客,探讨SEO技术,时不时发表些对渡虎谷的看法和评论。这些属于中规中矩。

几个不太中规中矩,有些特色的包括,星建的长篇武侠小说,九天一剑的诗歌,SEOMM的爱情小说,还有几个把渡虎谷当旅游点介绍的。

我有一种感觉,没什么根据的感觉,星建的武侠小说限制了不少人的思路,让人那么容易地就想到写小说。

渡虎谷不可以是新编民歌《人说渡虎谷好风光》吗:

人说渡虎谷好风光
地肥水美五谷香
左手一指渡虎山
右手一指渡虎湾

还可以下载卡拉ok,唱一下,做成播客。

渡虎谷不可以是急于收回台湾的愤青吗?渡虎谷不可以是郁闷的现代派诗人吗?渡虎谷能不能和奥运会有点关系?

外部链接策略

喜欢也好,不喜欢也罢,外部链接还是排名最重要的因素之一。所以很多人觉得比赛到最后就是比资源,这里的资源就是指链接资源。

参赛的站外部链接策略主要有:

–自己手里掌握的站点,包括自己的和客户的
– 友情链接
– 注册多个免费博客,加链接到参赛站
– 论坛和博客留言,有些是群发
– 靠内容吸引转载

上面这些有黑帽,有白帽,都属于比较常规能想到的。

两个有特色的点子。一个是石头的奖品换链接。一个是设计blog模板供下载,当然模板里带有链接。

很可能还有其他有创意的外部链接策略我没能看到。

我想提醒朋友们以后参赛时可以注意的是,如果创意和写作内容上有突破,外部链接策略也会相应有突破。

自己能掌握的站点有多少?关注渡虎谷大赛,能交换链接和转载文章的站又有多少?

如果抛开SEO这个圈子,想想看关注两岸关系的人有多少?看徐静蕾博客的人有多少?在找MP3下载的人多少?引起这些人的注意和谈论,潜在力量有多大?

黑帽白帽及作弊

从有SEO的时候起,黑帽白帽的争论就开始了,这种争论势必会继续下去。

从国外以前的经验看,SEO比赛也都是黑帽白帽较量的战场。渡虎谷SEO大赛是国内第一次,没有意外,黑帽和作弊也出现了。堆积关键词的,群发的,隐藏文字和链接的,等等。

显然作弊的就不必讨论了。困难的是那些有争议,半黑不黑的SEO手法。有不少朋友希望大赛组织者或评委划个界限,或者就特点网站,特定手法给个说法,明确表示是否容许。

大赛组织者或评委到目前为止在这个问题上都保持沉默,未发一言。

为什么不明确给黑帽白帽划个界限呢?

模糊逻辑里有个著名的符合逻辑却莫名其妙的推论:

下面两个命题都是正确的:

1)一根头发都没有的是光头
2)比光头多一根头发还是光头

由这两个命题可以推论出:

3)满头头发的是光头

前提和逻辑都没问题,结论却显然有问题。

很多时候,命题恰恰不能表述的很清晰逻辑,模糊才能看清真相。

SEO的黑帽白帽就是这样。不能,也不必,划一条明显的界限。但拿出一个站分析一下,黑帽白帽清晰可见。就像判断一个有10万根头发的人是不是光头一样,结论板上钉钉,但不是由逻辑推出来的。

我们没必要,也没能力,定出比如关键词密度超过xx%算黑帽,群发了多少以上算作弊。拿出一个站,闻一下,也闻出个大概了。

所以不必担心评委心里的界限,我们就没什么界限。做站的,参赛的朋友只要问问自己是否担心被惩罚,被除名,如果担心了,说明帽子已经不太白了。

当然,今后在比赛制度设计上应该尽量减少模糊解读的空间,让参赛者从一开始就清楚什么可以做,什么不可以,而不是等着评委事后来裁判。

帖子开头就说了,精彩之处不多写了,主要写不足。

但其实很多参赛站,无论从模板优化,栏目规划设计,内容写作,关键词安排,坚持更新等等方面都表现得很出色。 互相吹捧意义不大,所以通通略去。

拉拉杂杂写了这么多,好像是我写过最长的帖子了。

最后,我要向参赛的所有站长表达敬意。你们的参与使这次渡虎谷SEO大赛成为中国SEO历史上必定要重重写上一笔的事件。

实时搜索及社会搜索

刚刚看到新闻,忍不住简单写几句。这可能是近一年最重要的关于搜索引擎及SEO的进展,值得关注。

整合搜索后,搜索引擎最缺乏,在业内又炒得最热的话题是实时搜索。虽然搜索引擎现在也经常在一分钟之内收录页面并进入排名,但通常只限于某种内容(如有ping机制的博客)和权重极高的网站。普通网站很难有这种待遇,无法想象所有网站都实时抓取、排名需要多庞大的资源。

目前实时搜索最好的当然就是twitterfacebook等社会化网络,尤其是twitter。

今天在web2.0 Summit大会上爆出3条有关实时搜索和社会搜索的新闻。

一是Bing已经和twitter达成合作协议,twitter提供所有feed给Bing,做成一个Bing Twitter,并且已经上线(貌似只在一部分国家可以打开),可以进行tweet的实时搜索。

二是,Google紧接着宣布几乎同样的合作协议,提供实时tweets搜索,但还没上线。据说很可能像整合搜索一样是与普通搜索结果混在一起的。也不排除单独做一个垂直搜索,和视频搜索、图片搜索一样。

三是,Google宣布将要发布社会搜索Social Search,用户可以看到自己注册过的社会化服务的内容。比如你在你的google profile页面里填写了自己的twitter帐号,facebook帐号,在Social Search里就可以看到来自twitter,facebook的相关内容。当然,这些搜索内容是受你的好友网络、好友发布的内容影响的。

searchengineland的Danny Sullivan已经看到Social Search的内测,他在twitter上开玩笑说,他看到时感动得泪流满面。

让我们拭目以待这让人泪流满面的新玩意儿吧。

疯狂SEO大会,11月北京见

11月20号我将会参加北京举行的MADcon大会:

http://www.madcon.cn/

M 代表营销(Marketing),关注搜索营销、博客营销、微博营销、社交网络营销、移动领域营销;

A 代表分析(Analyze),关注用户行为分析、广告效果分析、搜索引擎分析;

D 代表设计(Design),关注网站架构设计、用户体验设计、搜索引擎优化设计;

Con 就是会议(Conference),以经验分享及互动话题为主轴的会议,通过讲演、讨论、问答和适时的派对聚会来汇聚所有的知识,碰撞所有的观点。

Robin希望我演讲的主题八卦一点,年底让大家都轻松一些,所以我打算讲讲“我眼中的中国SEO人物”,斗胆对国内SEO行业大家耳熟能详的人物品头论足一番。

这个疯狂大会虽然是组织多次SMX和点石大小会的RobinInway策划组织,但其实已不限于搜索营销,网站分析和设计、用户体验也是重要部分,各主题演讲嘉宾都是声名显赫的人物。Google和百度工程师也会演讲和回答问题。

另外,11月21号下午1:30在中关村图书大厦办一个SEO新书的讲座(关于SEO技术的,和MADcon演讲没什么关系)和签售会,想拿到签名版的朋友欢迎去看看。现场出版社也会准备些礼物给读者。

11月3号收到的讲座详情:

11月21日免费活动  和Zac畅谈SEO话题

讲座主题:SEO难点之网站内部链接结构

SEO是什么?

虽然这些年SEO概念普及了,但在很多人眼里,SEO和作弊、欺骗是一回事儿。这是对SEO的极大误解。

SEO是个强有力的工具,能以很合理的方式进行,既照顾到用户需求,又创造出有用的、符合搜索引擎质量指南的网站。

经典畅销图书《网络营销实战密码》作者昝辉(网名zac),即将推出最新力作《SEO实战密码——60天网站流量提高20倍》。值此Zac回国之际,博文视点大讲堂特邀昝辉先生做客中关村图书大厦,与读者朋友详细讨论SEO难点之网站内部链接结构。相信无论是设计师、程序员,还是CEO或普通用户,都能通过此次交流受益良多。

主讲人简介:

昝辉,网名zac,下略。

活动主办方:电子工业出版社博文视点公司

活动时间及地点:2010年11月21日下午13:30~15:00  中关村图书大厦五层多功能厅

讲座内容:

1.SEO过程

市场及竞争研究→制定计划→网站架构优化→页面优化→外链建设→监测和改进

2.SEO三大难点

原创内容

内部链接结构

高质量外链

3.内部链接结构

良好链接结构的目的——控制权重流动,收录

标准网站树形结构

复杂链接结构问题及解决方法

怎样阻止链接权重流动

由于场地有限,还请各位有兴趣参加的朋友提前报名。凡到会参加者,均可获赠精美小礼品一份,现场还有抽奖活动!奖项设置如下:

一等奖一名:《SEO实战密码——60天网站流量提高20倍》

二等奖两名:《网络营销实战密码——策略·技巧·案例》各1

三等奖三名:职场谍战小说《监控》各1

报名方式:

1.请致电:86-010-88254369。

2.登录博文视点官方网站www.broadview.com.cn在线报名。

博客SEO指南

原文: Bloggers’ Guide To SEO by Aaron Wall

中文翻译: Zac

目录

  • 背景
  • 关于你的博客Google知道些什么
  • 为什么博客SEO和其他网站SEO是不同的
  • 域名注册和主机
  • 关键词研究
  • 和左邻右舍比一比
  • 撰写清楚有说服力的标题
  • 优化网站结构
  • 网站流量分析
  • 争论
  • 发布网站后使用推式营销
  • 理解网络效应
  • 更多了解SEO

背景信息

我们写关于SEO的书,用了300多页。写怎样给博客做SEO,只要几页就够了。为什么呢?随着搜索的进步,Google和其他搜索引擎都在收集更多信息,使他们能以其他人对这些博客有多信任为依据来推荐和对博客排名

关于你的博客Google知道些什么

Google拥有些什么

搜索引擎对博客有一系列的信任评价衡量指标,Google比你认为的更了解你的博客。Google拥有这些服务:

从用户数据推断信任度

如果一个Google用户订阅了你的博客,Google能在多大程度上把这个人对你博客的关注和订阅当作信任度的一个信号呢?他们订阅了多久?你的用户是否经常在你的网站上有互动?他们还订阅了哪些其他网站?他们还与哪些其他网站有互动?他们日常的搜索和email习惯是什么样?

如果另外一个博客链接向你,Google在多大程度上信任这个链接,把这当做有助于排名的投票呢?其他受欢迎并受信任的博客有没有链接到那个网站?有多少人订阅那个网站的RSS feed?

有一些服务,比如BloglinesMyBlogLog,能够回答上面问题的一部分。Google比其他任何公司都能更准确的回答这些问题。

除了上面这些数据外,Google还知道你的网站有多老,你内容增加是否稳定,你的链接增长是否稳定。

为什么博客不同于静态网站

博客SEO和大部分其他网站SEO都不同,主要是因为博客技术天生的社会化因素。博客SEO更多的不靠买链接,或试图操纵不成熟的搜索技术。博客SEO更多的是给人们提供一个能讨论的话题,创造一些值得人们注意的东西。

博客的社会化本质

  1. RSS和feed阅读器使得读者能很容易的订阅你的每一个帖子。当你发表时,他们就能看到。
  2. 很多阅读博客的人自己也写博客,他们中有的人可能有成百上千的阅读者,如果有几个高信任度的博客聚合你的博客,就会产生连锁效应,很多读者都会看到你的帖子。
  3. 鼓励评论的热门博客,每个帖子可能都有几十上百的评论。这些评论也增加了独特内容,使网页排名机会增加。
  4. 优化博客更多的在于吸引注意力,通过散播好点子获得信誉,而不是优化页面因素来讨好搜索相关度算法。

域名注册和博客主机

有一些服务,如TypePadBloggerWordPress.com ,可以提供服务把你的博客放在他们的子域名上。不要这么做。其中的一些服务只提供有限功能,或者不允许在你的网站上放广告。建立读者群需要数月数年的时间,与其以后再把网站搬家,不如从一开始就选择自己的域名,并且放在可靠的主机上。

你可以在GoDaddy.com用不到十块钱注册一个域名。Dreamhost是一个很好的主机服务,并且他们提供简易安装Wordpress博客系统。

关键词研究

传统关键词工具

已经有很多免费或付费的关键词研究工具。其中一些,比如Wordtracker,返回人们最近搜索的关键词。

wordtracker-chocolate.png

趋势相关关键词工具

作为一个博客,你不仅要发现哪些词曾经热门,还要知道哪些是当前的热门。你可以在TechnoratiGoogle Blog SearchGoogle News看到现在正在发生什么。Google TrendsYahoo! Buzz Index 等服务告诉你头一天哪些搜索是最热门的。

网页上什么地方使用关键词

在网页标题中使用关键词很重要,最好是靠近标题的前面。在网页内容中也使用几次关键词,相关词以及热门关键词的变化形式。不过写的自然是最重要的,要确保你的内容对读者来说读的通顺,这比蜘蛛怎么看你的内容要重要的多。如果读者喜欢你的内容,并链接过来,这比页面优化完美读起来却像机器写的要重要的多。

通常关键词研究工具都会显示热门关键词的变化形式。一些图像显示工具,比如Quintura,以图像的形式显示出排名靠前的文件中所使用的相关词。

与左邻右舍比一比

Meme Trackers

目前哪些主意传播的最快?在博客世界,谁处于对话中心?TechMemeTailRank 都突出显示最近热门的博客帖子。以话题为基础的meme trackers也有很多。World Bank发布了他们的BuzzMonitor,这是一个开源软件,任何人都可以用来创建自己的meme trackers。

Youtube

Youtube列出今天最热门视频今天被讨论最多的视频今天的最爱视频。很多这些视频都和你的网站无关,但是这些视频都能帮助你找到那些已经在社会化网络迅速传播的好点子。

社会化新闻网站

Digg, Del.icio.us热门名单StumbleUpon Buzz 都显示最近在社会化书签中热门的点子。Pligg软件可以很容易的搭建社会化新闻网站

专注竞争对手网站

为了成功,你不必跟踪了解所有东西,你只需要在你的目标市场上竞争。订阅你的目标市场上的一些博客,跟踪记录谁得到了链接,为什么其他人在谈论他们,这使你能更容易的找到好主意和创造好的,值得被谈论的内容。

使用iGoogle, Google Reader或者 Bloglines,很容易就能订阅目标市场上的竞争者博客。使用TechnoratiGoogle Blogsearch,可以查看连到竞争帖子的链接。

google-blog-search-links.gif

发现新内容点子

使用上面提到的热门列表,寻找发现为什么一些点子能迅速扩散?哪些点子以前很有用?做了这样的调查以后,可以比较容易的把这种点子和你的市场结合起来,创造出色的点子。你所看到的任何内容,包括线上阅读的,书里,图片,杂志,会议,个人经验等,都可能是创造的原动力。无论去哪儿,都带着照相机和记事本。

你可以看Darren Rowse的 ProBloggerPerformancing这两个博客,上面有最新的博客潮流。

撰写清晰有说服的标题

Cory Doctorow,热门科幻小说作者和Boing Boing博客作者,在下面的访谈中这样说标题的写作:

写标题时要设想你是一个通讯社的作者。

描述性的标题使你的内容更易懂,你的网站出现在搜索结果中时,用户也更可能点击你的网页。你也可以使你的标题更有情感吸引力,比如问一个问题或承诺解决一个问题。Brian Clark在像磁铁一样的标题这篇文章中提供了很多成功的网页标题模式。优化网站结构

突出你最好的内容

2007年9月份以前,我的首页上都是博客最新帖子。虽然这有助于推广新帖,但是对那些新手来说并不友好。你应该确保你的首页对那些行业新手来说是有吸引力的。给他们的学习过程提供导向,告诉他们从哪儿开始,并且突出你最好的内容。如果你的网站成长为一个生意,你需要投资在创建工具,增加论坛以及其他互动功能,使人们不断回到你的网站。

很多博客系统都允许你突出标志最热门帖子,把最好的内容放在最显眼的地方,用户一个点击就能看到。同时这些最好的帖子,也得到更多链接权重,使人们从你最好的帖子找到你网站的机会增大。

很多读者都是第一次来到你的网站,引用一些你的老文章,使他们能够了解你的引用方式,而不必同样的东西写了一遍又一遍。如果其他网站聚合你的内容,或其他垃圾网站盗用你的内容,引用老帖子使你更有机会得到链接,从而提高排名。

禁止抓取复制内容

Michael Gray 在下面这个视频中提供了wordpress优化窍门。

一个帖子只放一个分类

使用WP的more功能,使帖子在分类页上只显示一部分。

使用robots.txt文件,禁止抓取存档页和其他复制内容部分。

Joost de Valk在他的WP SEO指南中也提供了更多WP优化窍门。

警告。如果你使用robots.txt文件是新手,确保不要禁止抓取那些带有日期的所有文章。假设你启用post slug URL,并且使用分类。那么WP博客的robots.txt文件,应该大致像下面这种形式。

User-agent: * Disallow: /*p= Disallow: /*q= Disallow: /*trackback Disallow: /*feed Disallow: /*wp-login

分类和标签页

分类应该与行业相关关键词吻合。这样的网站结构使这些分类页能够在相关关键词搜索时排名更好。如果你的网站是关于减肥的,就创建分类如运动,节食,减肥药,减肥补充食品等。

如果你同时使用分类和标签页,尽量不要使它们重叠。比如说如果你有一个“创建链接”分类,就不要在很多帖子里使用“创建链接”做为标签。最好分类限制在十几二十个,而不要有上百个分类或标签,每个分类里面却只有几个帖子。

相关帖子

很多博客都在每一页上列出上一篇帖子和下一篇帖子,这些链接对用户很方便,同时也有助于搜索引擎深度爬行你的网站。WP也有一些插件,在文章后面列出相关帖子,帮助读者找到相关内容,尤其是如果他们从不太相关的文章来到你网站时。

修改网页标题

很多博客管理系统都在标题标签中把网站名字放在帖子名字之前。网页标题最前面出现最相关的信息是最好的。有很多WP插件可以用来修改网页标题结构。最常用的包括 all in one SEO packSEO Title Tag

流量分析:重复最初的成功

网站流量分析可以告诉你

  • 谁链接向你的网站?
  • 他们链接向哪些帖子?
  • 人们通过搜索什么词来到你的网站?

如果你能知道引用你的人的情况,以及他们为什么引用你的网站,那么创建更多他们可能喜欢的内容就比较简单了。如果你知道你的网站搜索哪些关键词时排名好,你就知道你的网站在哪些话题里是被信任的,也就知道哪些相关话题,你可以轻易的得到排名。有一些博客修改他们的高流量网页,增加一些关键词变化形式,这使得他们的网页在更多关键词中排名提高,并得到流量。

Google Analytics是免费的,我也喜欢Mint,,价格是每个网站30块注册费。PerformancingMyBlogLog 提供专门给博客使用的流量分析程序。

争论

很多人让恐惧控制他们的行为,但大多数成功的人都是以本能和直觉为导向,而不是恐惧。

  • 没有人喜欢恶霸流氓。有一些博客害怕被告或者冒犯其他人。当我被告时,我的名字,曝光度和收入一夜之间就增长了。当然这不是说你应该不计后果,但是不合法的官司能获得媒体曝光和自然信任。
  • 创造性破坏是生意的一部分。在几年之后,其他人可能会免费提供我现在在卖的信息。生意人都担心怎样保护他们的版权。但随着互联网竞争越来越厉害,我们能得到一个被抄袭的机会,都是幸运的了。

一些自称有道德的博客,在他们的营销中玩着好警察坏警察的游戏。在这个口碑营销窍门的帖子中,Michael Arrington说他感觉恶心的想吐。其实他不至于真的想吐,不然为什么要把这个视频放在他的网站上,那些浏览给他赚了不少钱。

发布网站后使用推式营销

杰出

如果你对网络营销是新手,应该读一下Seth Godin的 Purple Cow,来理解怎样创造杰出的点子。链接无非就是引用。如果你很杰出,链接自然会来。但是刚开始时,要先有一点推式营销。

信任

大部分新信息都是垃圾或者胡说八道。很多垃圾都是使用越来越复杂的工具制造出来的。读者也越来越能准确和快速的判断信息质量。

使用WP的默认模板设计,可能读者不喜欢。如果你使用一个好看的模板,或买一个专业设计,这能显示出你是认真的,你愿意在你的网站上投资。格式和设计都能提高信任度。

使别人联系你更容易些。列出你的地址,在关于页上写一段原创的深思熟虑的内容,列出你的履历,这都有助于使人相信你的网站。

链接到其他博客

我们对于与我们的偏见和兴趣匹配的营销信息更能接受。直接谈论某一个人是最相关的了。很多博客都跟踪记录谁链接向他们,并且看这些帖子。

链接向其他有用的相关网站是最便宜的营销手法之一。不要只是连到另外一个博客,你应该增加价值,解释一下为什么你觉得他们对或者错。或者可以考虑请你尊重的什么人提供反馈意见,或者问他们愿不愿意做一个访谈。

建立链接

搜索引擎把链接做为信任的信号。如果你能负担的起,我建议把你的博客提交到有权威度的综合目录,利基市场目录和博客目录。这篇文章里有更多提交综合目录的信息。Loren Baker最近也发了一篇最好的博客目录帖子。

给网站做广告

曝光越多越好。今天花在广告上的几块钱,可能意味着几个月以后,你的博客能变成热门。

  • PPC广告使你能从搜索引擎买到相关流量。
  • Adwords有一个庞大的广告网络Adsense。使用Adsense买特定网站的广告,以及Blog Ads都能使你在特定相关内容网站上买到广告。
  • ReviewMe等评论网络,使你能够从相关的热门博客买到付费评论。
  • StumbleUpon ads,你能用几分钱就买到流量到你的文章。

理解网络效应

累计优势

2007年4月15号,社会学家Duncan J. Watts在纽约时报发表了一篇文章,Justine Timberlake是不是累计优势的产品?在这篇文章里,Duncan解释了我们做决定时的社会化本性。

人们几乎从来不独立做决定。部分是因为这个世界充满着选择,我们靠自己发现自己要什么几乎没什么希望。部分是因为我们也不知道自己想要什么。部分是因为我们自己经常想要的东西,并不是想体验最好的,而是想体验其他人也要的,所以也能够体验分享的好处。

由于这种做决定时的群体思考本性,很多东西之所以继续热门,仅仅是因为它们已经是热门。

分享社会化证据

  • 评论。如果你的网站已经有很多评论,人们就更加可能参与到讨论中。你可以把“留下评论”加粗,或者在侧导航栏中列出最新评论,来鼓励人们留下更多评论。回复评论也使其他人更可能留下更多留言。有一些博客组织起来,互相在对方的帖子留评论,使双方的博客看起来都更活跃。
  • 订阅者统计。如果你有成百上千的订阅者,你可以把这些统计显示出来。
  • 借用权威。在项目发布之前,向你行业中的有权威的人询问反馈意见。如果他们对这个项目产生了某种归属感,他们可能不仅能借给你信任度广,而且帮助你免费推广。
  • 发布你的公关信息。如果你或者你的博客被主流媒体报道了,在你的网站上显示这些报道,能增强你的权威度。

增加互动

用户读博客是因为他们宁愿读帖子,而不是读一本书。在帖子中增加照片和视频,使用列表,这些都能使你的网站更容易浏览。

举办互动式的竞赛或者发布一些奖励,是最容易让其他人谈论你网站的方法之一。对话是日后盈利的关键。Cory Doctorow这样写媒体的未来:

今天互联网带来了选择的爆炸性增长,所有的娱乐都差不多是一个点击的距离就能达到。找到和你作品一样有趣的音乐,图书和电影的搜索成本已经大大降低。这归功于推荐系统,搜索引擎,无数诸如博客,MySpaces之类的粉丝推荐网站。你的爱好和某个地方的某人是一样的。如果你想和他竞争,你所需要的就不仅仅是个人魅力和爱好。你需要对话。实际上在每个艺术领域,我们都看到与自己的观众对话的艺术家是最成功的。JMS参与粉丝新闻组,以使Babylon 5保持活跃。Neil Gaiman’的博客几乎完全建立在同时与上千读者对话的基础上。在互联网上通过留言板,邮件列表成功的所有独立乐队。像Jason Scott这样的独立纪录片作者,像Warren Ellis这样的漫画作者等等。

参与热门渠道,建立信任和曝光

  • 社区论坛通常都有大量流量,参与这些热门的论坛,能帮助你建立名声。社区论坛也是寻找内容点子的好地方。如果论坛里经常有人问某个问题,同样的问题在搜索引擎中也会被经常搜索。
  • 给其他热门网站写客座文章,使你能借用他们的品牌价值,用户信任以及流量。
  • 有一些博客举办博客嘉年华会,来建立曝光和链接。
  • 在其他相关博客,留下有用的相关的评论,可能使得对方也订阅你的博客,也会有人点击来到你的网站。

显示你的倾向

坚持自己的倾向和想法,使得其他和你有同样观点的人,更容易信任你,帮你传播信息。大部分,如果不是所有,热门政治博客都是高度倾向性的。

暂缓盈利

如果你的网站一开始就放上Adsense广告,那么建立动力,从其他行业领先者手中夺取市场份额的机会是很小的。

设置安全网

如果很多人阅览和信任你的网站,那么Google对你的依赖就超过你对他们的依赖。这将使得Google难以惩罚你的网站,因为那样做将会带来更多负面影响。

Aaron最近在Blogworld做的SEO演示

这个演示解释了为什么获得注意对一个博客的增长是很重要的。

更多SEO知识

SEO基本知识已经在很多对方谈了很多次了。4个开始学习SEO的地方包括Work.com: Learning SEOBlogoscoped: The Basics of Search Engine OptimizationSEOMoz: The Beginner’s Guide to SEODan Thies’ SEO Fast Start

如果你不介意付费,参加我们的SEO培训计划,你可以在一个互动环境中学习的更多,也可以直接向我们提问。

我们写关于SEO和网络营销的博客。Lee Odden有一个列表,列出了400多个关于搜索的博客。请订阅我们的博客,得到最新关于搜索引擎的消息。

URL静态化还是不静态化?

数据库驱动的网站需要将URL静态化,一直以来都是SEO最基本的要求,可以算是个常识性的东西。近几年SEOer一致认为,URL中带2-3个问号也不是问题,搜索引擎通常都能收录,尤其是权重高点的域名,更多几个问号也不是问题。但无论如何一般还是建议URL静态化

9月份,Google站长博客发表了一篇讨论动态网址还是静态网址的帖子,却颠覆了这个说法。在这篇帖子里,Google明确建议不要将动态URL静态化,而是保留那种长长的,带问号参数的动态URL。Google黑板报中文网站管理员博客都做了翻译和转载,大家可以查看。

从留言和我看到的博客来看,有不少人还真觉得有道理,准备按照Google说的做了。

这是比较少见的,我十分不以为然的,Google给的SEO建议。

Google的帖子有几个要点。

一是Google完全有能力抓取动态网址,多少个问号也不是问题。这一点基本靠谱。

第二,动态网址更有助于Google蜘蛛读懂URL含义,并进行鉴别,因为网址中的参数有提示性。比如Google举了这个例子:

www.example.com/article/bin/answer.foo?language=en&answer=3&sid=98971298178906&query=URL

URL里的参数都有助于Google理解URL及网页内容。比如language后面跟的参数是提示语言,answer后面跟的是文章编号,sid后面的肯定是session ID。其他常用的包括color后面跟的参数指的是颜色,size后面跟的参数是尺寸等。有了这些参数的帮助,Google更容易理解网页。

而将网址静态化后,这些参数的意义通常就变得不明显了。比如这个URL:

www.example.com/shoes/red/7/12/men/index.html

就可能使Google不知道哪个是产品序列号,哪个是尺寸等。

第三,网址静态化很容易弄错,那就更得不偿失了。比如通常动态网址的参数调换顺序,所得到的页面其实是相同的,比如这两个网址很可能就是同一个页面:

www.example.com/article/bin/answer.foo?language=en&answer=3

www.example.com/article/bin/answer.foo?answer=3&language=en

保留动态网址,Google还比较容易明白这是一样的网页。而经过静态化后,这样两个网址Google就不容易判断是不是同一个页面,从而可能引起复制内容:

www.example.com/shoes/men/7/red/index.html

www.example.com/shoes/red/7/men/index.html

再一个容易搞错的是session ID,也可能被静态化进URL:

www.example.com/article/bin/answer.foo/en/3/98971298178906/URL

这样网站将产生大量URL不同,但其实内容相同的页面。

所以,Google建议不要静态化URL。

但是我还是建议要静态化。原因是:

首先,Google给的建议是从Google自己出发,而没有考虑其他搜索引擎。Google抓取动态网址没问题,并不意味着雅虎,百度,微软等等就都没问题。尤其是中文网站,Google不是老大。

第二,Google所说静态化的坏处,是基于静态化做得不正确的假设上。问题是要做静态化就得做正确,假设会做错是没有什么道理的。有几个人会静态化网址时还把session ID放进去呢?

第三,Google的建议是典型的有利于自己,而不利于用户。带有问号参数的URL可能有助于Google读懂内容,但是显然非常不利于用户在一撇之下理解网站结构及大致内容。看看这两个网址哪个更清晰,更容易读懂,更有可能被点击呢?

www.example.com/product/bin/answer.foo?language=en&productID=3&sid=98971298178906&cat=6198&&query=URL

www.example.com/product/men/shoes/index.html

显然是第二个。

而且长的动态网址,也不利于记忆,不利于在邮件、社会化网站等地方抄给别人。

总之,虽然Google这么明确的建议保留动态网址,我还是建议大家正相反,尽量将URL静态化。

行业和竞争对手调查

无论是做自己的网站还是给别人提供SEO服务,在开始做站或签订合同之前,都要做一个行业和竞争对手情况调查,大致了解优化的难度,要投入的时间精力,不要明知不可为而为之。

举个极端的例子,不要想做个新闻网站,把”新闻”这个词排上去。你再怎么弄,也赢不了新浪搜狐。

对行业和竞争对手的调查可以从竞争程度开始,一般我会看两个方面。

一是在Google,雅虎,百度里目标关键词所返回的搜索结果数目。如果是几十万搜索结果,算是没什么太大竞争。如果达到一百万,就有些竞争了。达到三五百万,就要费一番时间精力,才能优化好。如果达到千万以上结果,竞争就比较激烈了。

不过这个搜索结果数目,有时候也不一定说明真实的竞争情况。所以还要看在Google,雅虎,百度中竞价排名广告的数目及价钱。这个竞价排名的情况,有时候更能说明竞争情况,因为这些是竞争对手愿意出实实在在的银子来和你争的。

如果不出意外的话,竞争对手也都做过了自己的调研。

然后看一下目标关键词在主要搜索引擎排名第一页和第十页这些网站的具体情况,最好把一些数字列成表格,一目了然。

比如调查一下:

这些网站规模有多大?网站本身有多少页?
收录了多少页?
这些网站的栏目设置?
内容是原创为主,还是采集的?
网站PR值?
域名注册时间?
网页关键词密度?
关键词出现的位置?
有没有一定的规律可以学习?
在雅虎查一下这些网站的外部链接有多少?
外部链接来自于什么地方?
是大量的友情链接,垃圾链接?还是来自新闻门户?

如果链接主要来自留言本,博客评论等,战胜他们的希望就比较大。如果有大量的链接来自于其他网站的新闻报道,恐怕局限于SEO技巧就不一定能达到目标,可能要考虑制造新闻话题,公共关系等。

只有把所有这些情况都调查清楚,列出来,你才能大概了解要花多少时间精力来优化一个网站。如果是给别人做SEO服务,要收取的费用也就容易计算了。

绝对路径和相对路径与SEO

(6月18号注: 昨天很多读者大概没看到这篇帖子,而且整天忙着处理不可抗力造成的问题很累,今天就不更新了。)

经常看到有人在论坛里问URL的绝对路径和相对路径问题,在网站中应该使用哪种?对SEO有什么影响?这实际上没有绝对的答案,两者各有优缺点。Google员工JohnMu前几天在Google Groups中做了一个挺全面的总结。下面半翻译半解释评论。

绝对路径URL优点是:

+)如果有人抄袭采集你的内容,里面的链接还会指向你的网站。有些抄袭的比较懒,连里面的链接一起抄了过去。

+)如果站长不能做301转向,因而有网址规范化的问题,使用绝对路径有助于链接指向选定的URL版本。假设站长不能从URL

http://domain.com

做301到

http://www.domain.com

站长希望被收录的版本是第二个,带www的。所有网页中的链接直接使用绝对路径如:

http://www.domain.com/article.html

http://www.domain.com

链接URL硬编码入HTML文件。这样就算有蜘蛛或用户进入了 http://domain.com 版本,如:

http://domain.com/article.html

这个页面上的链接使用绝对路径的话就会链接向:

http://www.domain.com/article.html

http://www.domain.com

用户点击这些已经硬编码的链接后,还是会回到带有www的版本。这也有助于搜索引擎蜘蛛识别到底哪个版本是你想要的。

+)就算你把网页移动位置,里面的链接还是指向正确的URL。

-)缺点是,除非链接是动态插入的,不然没办法在测试服务器上进行测试。因为里面的链接将直接指向真正的域名URL,而不是测试服务器中的URL。

-)除非链接是动态插入的,不然移动内容页面将很困难。因为内容页面位置发生变化,在其他页面上的链接却可能无法跟着变化,还指向原来的已经硬编码的绝对路径。

相对路径优缺点正好相反。优点是:

+)移动内容比较容易。

+)在测试服务器上进行测试也比较容易。

-)缺点,内容页面换了位置时,链接容易失效。

-)更容易被抄袭和采集。

不过很多采集软件其实是可以自动鉴别绝对路径和相对路径。所以使用绝对路径有助于把自己的链接也被抄到采集网站上,只在某些情况下是有效的。

所以通常我是建议,除非不能做301转向,因而产生了严重的网址规范化问题时,还是使用相对路径比较简单。在正常情况下,相对路径不会对网站SEO有什么副作用,绝对路径也不会有多少特殊好处。而出错的可能性,比如搜索引擎错误判断URL,是非常非常低的。

2012年2月13日星期一

站群SEO优化

建设站群一直是一个搜索引擎优化领域比较带有点危险性又很有效的方法。

我自己没有做过站群,不过这两三年持续观察几个英文网站站群。无一例外,这些站群从两三年前的垄断关键词前十名中的几位,到现在在Google和雅虎中最好的也只是有一个网站排在前20名,其他的都找不到了。

分析这几个站群,有这样几个站群SEO优化要注意的地方。

尽量隐蔽站群

我发现搜索引擎在大部分情况下,不会把同一个人或同一个公司的多个网站,在同一个关键词下给几个好的排名。

如果搜索引擎发现很多站属于同一个人或公司,就算优化的都不错,也只给一个网站好的排名。如果站群做的太过分,可能这一个都不能幸免。

所以要想办法隐藏站群之间的关系。域名Whois信息使用不同的名字,不同的地址,不同的电子邮件,网站放在不同的服务器上,使用不同的IP地址,尽量不要在网站上放相同的联系地址,电话。尽量不要使用工具条,也别把这些网站都放在同一个Google Sitemaps帐号中。

站群之间不要交叉链接

做站群的时候很容易就把这些网站全部链接起来,希望这些站都得到好的排名,PR能在各个站之间传递。

不过这很容易暴露站群的所有人,而且容易被判定为链接工厂。

应该选择一个网站做为主网站,其他网站链接向这个主网站,但其他次要网站之间不要链接,把这些网站的能量都集中在主网站身上。

网站内容要有所不同

我发现很多人喜欢用完全一样的网站内容放在多个域名上,这是很不恰当的做法。

建议选择一个做主网站,其他网站都做301转向到主网站。这种情况不会被当作站群,也没有站群的效果,不过可以起到保护相关域名的作用。

如果要把这些域名做成站群,在内容上要有所区别。比如说主网站是关于汽车的,那么可以做一系列站群,一个写轮胎,一个写发动机,一个写配件。这些具有相关内容的站群,在适当的地方链接向主网站。

因为内容不同,不会被当作复制内容。而且来自同一个网站的多个链接效果没有来自不同域名的链接效果好。这些内容相关但不同域名的网站,对主网站可以起到一个很好的支持作用。

虽然我个人不倾向于用做站群的方式,不过站群如果做的好的话,现在还可以有不错的效果。

SEO谬误:搜索引擎优化软件

2005年11月27号翻译自Matt Cutts的博客:

当你开始做搜索引擎排名优化时,如果遇到某些声称保证优化排名结果的软件(或服务),你可得考虑清楚。为什么呢?

1)当你自己制作网页的时候,如果你犯错的话,你也只能犯错在有限的网页上。如果你使用软件的话,这个错误所造成的损害,就会被放大1000倍。

2)你应该真正了解这个软件到底是干什么的。如果你买了一个软件,而这个软件会生成成百上千的桥页,并使用恶意的JavaScript重定向。 那么在搜索引擎的眼里,你的网站就会亮起了小红旗了。你不能辩解说,我是从别人那儿买的,我也不知道它的害处。因为你的域名上的错误,最终要负责的还是你自己。

3)如果你买了一个搜索引擎优化软件,很可能其他人也买了,而且正在使用。越多人使用同一个软件,就越大可能性所有使用这些软件的网站都会被怀疑。

最后的原因是,很多SEO软件并不是很有效(它们有效过吗?)。

我最近看到一个正在卖的软件,这个软件会生成博客链接。就我个人来说,你买了这个软件以后,又可以转卖给别人,这就更可疑了。很快的,每个人可能都在卖同一个软件,连卖软件的网页模板都一样。你只是需要填写上你的名字和一些其他信息。下面是一个拍卖的拷屏:

seo-software.gif

注意到粉色的文字了吗?那是你本该填上你自己名字的地方。在上面的这个例子里,卖软件的人都懒得去把自己的名字填上去。如果人们买了这个搜索引擎优化软件,转过头来连模板都不改一下的话,你觉得这个软件会怎么样呢?

糟糕的是,上面的这个模板还有拼写错误。也许这个软件有些用处,我可能花4块8毛9买来试一下。不过,我还是坚持最好的建议:由于我上面所说的所有原因,在你决定买任何SEO软件以前,要认真考虑清楚。

我的评论:在Google的网站管理员指南上Google明确写着,他们反对使用软件来查询搜索结果,并且列出了一个非常著名的搜索引擎优化工具软件WebPosition Gold。一般来说,Google对所有人和所有公司都很友好。在他们的官方网站上单独列出他们反对使用某一个特定软件,这足以说明他们对这个软件的反感已经到了极点了。

这个软件是相当著名的。从Matt Cutts的话里,我们可以感受到的暗示是:不要使用任何搜索引擎优化软件。

SEO难学的那部分

SEO说好学也好学,说难学也难学。

说它好学,是因为95%的内容你可以在网上学到,只要你肯花时间。这个时间也并不是上四年大学那么长,最多几个月就能掌握SEO基本技术

说它难学,是因为剩下的5%就没地方学。不管是哪种书还是论坛或是培训,你都学不到那5%。只有自己亲手实践,再实践,再加上自己的一点儿天份。

想入门的朋友可以在下面这三个地方学到95%的SEO技术。

1)胡宝介的免费电子书。到目前为止,这是我看到最合适的SEO入门书。

前几天有朋友问,印刷出版的SEO书有哪些?大家可以去当当或卓越网搜一下,“解密SEO”,“搜索引擎营销-网站流量大提速”,以及“搜索引擎原理实践与应用”。这几本书都是最近出版的,我还都没看到,不过网上评论不错。

2)自卖自夸一下,通读点石博客及我的博客。

不要蜻蜓点水的随便看看,要真的通读,而且读懂。还有不少很优秀的SEO博客值得读,请参考我的blogroll。

3)有具体问题,到点石论坛问一下。

别问太宽泛的问题,诸如某某站我该怎么优化?这种问题让人没办法下嘴。

在这三个地方混久了,你可以掌握SEO知识的95%。

剩下的5%是没地方学的,在我看来包括经验,创意和人脉

有的人看了不少书,论坛博客也都看了不少,但还是不知道怎么具体着手做优化。对有这种疑惑的朋友,我只能说,你必须亲手实践,没有其他捷径。多做几个网站,多观察其他网站的排名,多看点石及我的博客,你自然会对网站及SEO产生某种程度上的本能

这是经验的积累,别人也没法教,你也没地学。做过一段时间后,看到某个网站,不用看源码,有时候也能感觉它会不会作弊,甚至能感觉到这是哪国人做的网站。中国人,印度人,俄罗斯人,罗马尼亚人,美国人做的网站风格都不同,SEO手法也不同。

SEO经验没有秘诀,就是花时间,实践。

第二个学不到的是创意。说到底这和SEO技术已经没有太大关系,但应用在SEO上,却有绝好的效果。无论是内容写作,还是网络营销策略,还是链接诱饵,归根结底其实就一件事,创意。我最喜欢的例子:SEO的求婚创意

这种与SEO技术没太大关系的创意,是没办法学的。你必须自己改变自己的思维方式,从技术层面跳脱出来。

第三个不能学的是人脉。这点就和技术更没关系了,也更没法学。甚至这和你的人品有关,而不是能教和能学到的东西。

不管是提供SEO服务,还是把SEO与传统行业相结合,在那个行业混久了,必然会积累下别人不具备的人脉。当你需要帮忙的时候,同行业的朋友所能带给你的,往往会超乎你的想象。

人脉的好处也可以体现在非常细小的地方。比如,如果我不认识的人,或没听说过的人在MSN上问问题,要是刚好我有时间,我也乐于回答。但如果没时间,或者对方问的是针对某个特定网站的问题,我还得花时间去研究,那么很多时候我只能说抱歉。

但如果是很熟的朋友,虽然在这个行业中,我只见过一两个人,但通过博客和点石论坛,和很多人觉得已经很熟了。这些熟悉的朋友问问题,就算当时我没在线,等我看到信息,也会想办法回答。

对初学者来说,参考上面提到的三个渠道,学会了这95%以后,就要把时间花在5%难学,甚至不能学的地方。胜负往往就在这5%。

上了SEO毒瘾的症状

Matt McGee写了一篇你需要离开SEO一会儿的二十一个症状,里面很多是利用英文的双关语和谐音,恐怕大多数对英文不熟的人不一定能理解,我来改写一下再加上一些自己的诊断。

1)你的键盘上S,E和O这三个键已经敲坏了。

2)3,0,1这三个键字也看不清了。

3)当你儿子说他要去沙盒里玩一会儿,你告诉他沙盒不存在。

4)或者你儿子告诉你他要在沙盒里玩一会儿,你担心8个月看不见他了。

5)这几天想上深州逛一圈。

6)你竟然知道Matt Cutts是谁

7)你还知道一个叫Zac的人的太太怀孕了。

8)听到robin这个名字,没想到李彦宏,却想到了这个robin

9)中秋节快到了,你想的不是买什么月饼,却琢磨着怎么参加月饼大赛

10)去现场看足球的时候,奇怪为什么场边的看板上没有Google Adsense广告

11)在体育场外面卖礼品的摊位上,你奇怪怎么只有卖黑帽子的。

12)你知道一堆奇怪的名字和人,石头小鹏keso幻灭樂思蜀

13)开始写博客。

14)你每天琢磨该给你的网站加些什么内容

15)认识了一个新女朋友,第一个想法是检查一下她的反向链接

16)你每天看Zac的博客。

17)每两小时去点石论坛看看有什么新帖。

18)你的电脑装了一堆工具条,Google,雅虎,Alexa

19)每天去Google和百度搜一下搜索引擎优化看前二十名有什么变化,虽然这个词除了同样得病的没什么人搜。

20)听到PR绝想不起是说公关。

21)孩子要买补充材料,你坚决不同意。

22)你正在会心地笑。

二级域名还是一级目录?

无法查看这则摘要。请 点击此处查看博文。

nofollow标签的使用与外部链接

读者”睡不着”在Google的数据中心们这篇帖子里留了评论,

ZAC解释一下,我在你的帖子回复里面看到说在你的博客里回复帖子签名的链接可以算外部链接的,刚刚仔细看了一下,你的代码
a xhref=’http://www.itqy.net’ rel=’external nofollow’
这样子,根本就不能算外部链接的了,这样子做是不是不太厚道啊!希望ZAC出来解释一下!

要解释这个问题不是一句两句能说清的,而且讲讲nofollow标签属性可能对很多站长也有帮助,所以就写一个单独的帖子来回答一下。

nofollow是一年多前(好象)由Google领头新创的一个标签,目的是尽量减少垃圾链接对搜索引擎的影响。

Matt Cutts说过,这个标签的意义是告诉搜索引擎这个链接不是经过作者自己编辑的,所以这个链接不是一个信任票。搜索引擎看到这个标签就可能减少或完全取消链接的投票权重。

这个标签通常是用在博客的评论或论坛帖子中,因为这些地方是最多垃圾链接出现的地方。现在主流的博客和论坛软件都自动在评论和帖子的链接中加上了这个标签。”睡不着”不会以为这个标签是我自己加的,或者我的博客系统(WordPress)是我自己写的吧?

另外一个作用是,如果你在网站上卖广告,可以使用这个标签。因为买卖网页广告的初衷应该是流量,而不是PR值或试图影响搜索引擎排名。加上这个标签完全不会影响流量,但是有可能减少对搜索引擎排名的影响。

那么加了这个标签真的对链接投票权重和PR值有影响吗?这一点是存有疑问的。如果我记的不错的话,Google,Yahoo,MSN表示支持这个标签。但是他们真的把这些链接的投票权重降为零吗?并没有肯定。

其他搜索引擎不一定支持这个标签,比如百度。就我观察的情况看,百度很可能不考虑这个标签,因为垃圾链接在百度还是很起作用的。

加了这个标签的链接就不算外部链接了吗?当然不能这么说。这样的链接一样还是外部链接。

我想”睡不着”的潜台词是,搜索引擎认为有权重的才算外部链接(我们姑且假设一些搜索引擎会把这些链接权重降为零),实际上这种想法和潜意识就犯了搜索引擎优化的大忌。

我在其他的帖子里多次说过,从用户出发而不是从搜索引擎出发。对用户来说,点击这个链接你就来到了另外一个网站,没有用脚本做转向,只是一个html链接,这不是外部链接是什么呢?

如果你真的认为搜索引擎会把这些链接的投票权重降为零,那么想象一下,如果一个网站的导出链接都使用了nofollow标签,这显得自然吗?你向读者介绍一些网站,却告诉搜索引擎你不推荐这些网站?不可疑吗?受伤害的是其他人的网站,还是使用这个标签的网站呢?

以前也说过,害怕链接到其他网站是很多站长的一个误区,实际上链接到其他相关网站在很多时候会帮助你本身网站的排名。

但在博客评论和论坛帖子里面的链接就不一样了,这些链接是用户和读者自己加的,而不是网站拥有人或作者加的。在很多情况下,作者也不会去看这些链接去了什么网站。所以对这些网站的质量当然是不知道,并且不应该背书的。

最后回到前面的评论,加不加这个标签和厚不厚道实在是没什么关系。我从来没有说从我的网站连出去的评论链接很重要,然后收钱让大家加链接,或者要求读者链接回来。

相反的我多次说过,博客评论里的链接虽然是外部链接(还是有助收录的),但对搜索引擎排名和PR值来说没什么用(并不仅仅因为nofollow的使用)。

读者如果有感而发,欢迎留评论,也欢迎留下签名链接。但是如果是想留个链接而留评论,那就不必了。

做SEO的很需要麦当劳外卖

写SEO书做些调查时看到一个有意思的GoogleAdwords广告,跟大家分享轻松一下。

我在Google搜索“keyword”这个词时,结果中居然出现麦当劳外卖网站的广告,广告的标题是“keywords”:

keyword-mcdelivery

比较可能的两个原因是,第一,新加坡麦当劳负责PPC或SEM的老兄把模板或试验广告一直开通使用着,或者别的什么失误,导致一直在竞价“keyword”这个词。

第二,人家认为搜索“keyword”的应该以做SEO的居多,做SEO的都是长时间坐在电脑前,没工夫出去吃饭,所以很需要送外卖的。上面抓图里的第二个就是个关键词研究工具广告。

但从做SEO到需要外卖,这弯子转的是不是太大了点了?所以估计还是失误可能性更大点,尤其是帐号比较大的话,看不过来。

最权威的Google排名算法解密

说它最权威是因为是Google工程副总裁,负责排名算法的Udi Manber,发表在Google官方博客的一个帖子。下面捡主要内容翻译一下,想看完整原文的请参考Google官方博客Google 搜索质量简介

搜索质量组是Google内部负责搜索结果排名的。每天Google处理无数查询,Google需要在不到一秒的时间内从数以亿计的网页中选择出应该返回哪些,以及以哪样的顺序显示。

Google对排名算法一直都比较保密,主要原因有两条:竞争及防止被滥用。

Google排名算法的细节是Google皇冠上的珍珠,我们以它为傲,并且非常注意保护。但是完全保密有时候也不是理想状况,所以Udi Manber等人决定与站长多沟通,谈一谈有什么新鲜事,解释一些老的内容,给点建议,参与对话等。这篇帖子是第一篇,以后还会有其他内容。

这个部门的心脏是核心排名小组。排名是相当困难的,比大部分人所想象的更困难。其中一个原因是语言都是模棱两可的,文件也没有任何规则,怎样理解信息没有标准。所以我们需要理解任何人,因为任何原因所写的任何网页。这只是一部分。我们还需要理解用户的查询,再将查询投射到我们所理解的文件上。更不要说不同的人有不同的需求。而且我们需要在几毫秒之内完成这一切。

Google排名算法最出名的部分就是PageRank。PR现在还在使用中,不过已经是一个更大的一系统中的一部分。其他部分还包括语言模块(处理短语,同义词,方言,拼写错误等的能力),查询模块(不仅仅是语言,还包括人们怎样使用语言),时间模块(有的查询返回一个30分钟前刚创作的网页最合适,有的时候返回已经存在很长时间的网页更合适),个性化模块(不是每个人都需要相同的东西)。

另外一个组负责评估我们做的怎样。目标是改善用户体验,这不是主要目标,而是唯一的目标。有每分钟进行的自动评估,阶段性整体质量评估,更重要的还有个别算法调整的评估。当某个工程师有个好主意,开发一个新算法后,我们对这个主意进行测试。一组统计学家会检查数据,确定这个新主意的价值。

2007年,我们做了450次以上的调整,差不多每个星期9次。比如今年1月份,我们对PR算法做了大幅调整。大多数时间我们都是寻找相关性改善的方法,有时我们也致力于简化算法,简单就是好的。(Zac的注释:关于简化算法这句话,是紧接着PR算法调整之后说的,不确认他是讲简化了PR算法,还是说笼统的对算法的简化。我的感觉是PR算法确实有了很大的改变。给我的感觉是,基本上给我们看的工具条PR是不准的,尤其很多该有PR值得内页显示PR为零。也许这就是Udi Manber所说的算法简化造成的。)

在过去两年中,国际搜索是我们的主要焦点之一,包括所有的语言,而不仅限于主要语言。

另外一个小组专门负责新功能和用户界面。Google的用户搜索界面相当简单,当我们增加新功能时,尽量确保对用户来说是简单易用的。在过去一年中,主要的改变包括通用搜索Google Notebooks自定义搜索引擎以及iGoogle的改进。用户界面小组有一组易用性专家,在辅助研究用户及评估新功能。

还有一个小组专注于反垃圾和其他各种被滥用的技巧,这也就是Matt Cutts所负责的小组。这个组识别新的垃圾技术,并且以可扩展的方式克服这些垃圾。和其他组一样,这个组也是要处理国际多语种。反垃圾组与Google站长工具组紧密配合。

还有其他专门的项目组。整体来说我们的组织结构相当非正式,人员调动频繁,新项目也随时开始。

关于nofollow的争论

6号写的帖子里唠唠叨叨写了好几件之间没什么关联的事,其中一句是:

利用nofollow控制PR流动已经不管用了,从一年前就不管用了。Matt Cutts前不久在SMX大会上透露了这点。更不妙的是,nofollow会浪费PR和权重。也许以后博客都要关闭评论了。不过先不必轻举妄动。

没想到引起一些争论,特此澄清一下。

7号就看到阿里巴巴SEO国平的这篇博客帖子,以及他在我博客的留言,他认为我误解了Matt Cutts的意思,并误导了其他人。本来也没想回应,因为属于正常的各家之言。9号有朋友告诉我,国平同志在点石论坛也发了帖子,貌似引起了一些争论。为了不至于引起国平所说的误导,我想还是简单回应一下。

首先,我说的是“利用nofollow控制PR流动已经不管用了”,不是nofollow不管用了。nofollow没废止,当然还是起着它原来的作用,那就是告诉搜索引擎这个链接不要follow,这自然会对收录和SEO有影响。对这一点,应该没有不同意见。除非硬要误解我的话。

第二点,也是国平帖子的重点,针对我说的“nofollow会浪费PR和权重”,他认为不对。

引用他博客帖子一段,解释Matt Cutts的话:

意思就是说:你原来有一个页面PR值有10点,这个页面中有10个链接。nofollow之前每个链接分到1点的PR值。如果你nofollow掉其中5个链接,你以为剩下的5个链接每个链接能分到2点的PR值,但是实际上,每个链接还是只能分到1点PR值。

解释得很正确。Matt Cutts这次透露的主要就是这个意思。建议再读一遍上面这句话。

我的问题是,这句话不就是在说“nofollow会浪费PR和权重”吗?

你有10票可以投出去,如果有10个链接,一个链接一票。现在把5个链接加nofollow,剩下的5个链接并不是各得两票,而是还是得1票,所以一共投出去5票。

那剩下的那5票呢?别忘了,这个页面是有10票的啊。这不就是浪费了5票吗?或者换个说法,那5票,没了,消失了,蒸发了,不见了… 就我对中文的理解,我觉得说那5票浪费了,完全是一个意思。

换个角度,如果那5个nofollow链接不是nofollow链接,可以有两种情况:

1)那5处就不是链接。那么这10票将投给剩下5个链接,各2票。

2)那5处是普通链接。那么回归正常,10个链接,各得1票。这10票要么增加本站其他页面的PR和权重,进入正向循环,要么增加其他网站页面PR和权重。总之,有10票,投出去10票。

本来有10票,只能投出去5票,另5票消失了,我想来想去还是觉得只能用浪费形容。说实话,我没看懂国平从“nofollow有用”得出“nofollow不会浪费PR和权重”的逻辑是什么。

国平在点石论坛的帖子里也提到:

“也许以后博客都要关闭评论了” 也是错的

这只是我的一句感慨,没有建议或预言大家关闭评论的意思,谈不上对错。

最后,我的原话最后一句是“不过先不必轻举妄动”,为什么呢?因为我压根不相信nofollow的作用和PR及权重的流动是Google自己所公开说、我们一般理解的那样。

不管怎样,欢迎这种争论,对个人,对读者,对行业都有好处。中文SEO行业就是比较缺少沟通和争论。两年前,大家对写SEO博客比较热衷,现在已经没什么人写了。我自己也从每天一贴变成每月一两贴了。我自己争取明年恢复。

这个星期纵贯线来新加坡演出。我忽然想,MJ和邓丽君、梅艳芳、张国荣可以在另一个世界组个团了,都是英年早逝,都是天王巨星。

2012年2月12日星期日

Google搜索结果中的类似网页是什么意思?

当你在Google中做任何一个关键词搜索后,在Google给出的搜索结果当中,你还会看到“网页快照”(Cached)和“类似网页”(Similar pages)两个选择。

网页快照就是存在Google数据库中的所列网页的文字内容,也就是上一次Google蜘蛛所抓取的网页内容。

类似网页指的是什么呢?到目前为止,Google并没有解释类似网页是怎么得到的。有很多人做了一定的研究发现,类似网页通常和链接及网站主题有关。

如果你点击类似网页的话,你会发现列出的所谓类似网页,有的时候没有很明显的规律。比如说大部分认为,类似网页是会列出你链接出去的其他网页,或者链接到你的其他网页。

但是有的时候,在类似网页当中所列出的网页或者网站,既没有链接到你的网站,你也没有链接到那个网站。两者之间没有直接的关系,也不属于同一个企业,有的时候甚至不是同一个行业。在一些极端的情况下,两个网站可能一点都不类似。

那么,类似网页是根据什么条件或算法所得出的呢?进一步的观察会发现,类似网页当中所列出的这些网址,往往是和你自己的网站被第三者所共同引用的其他网站。

举例来说,你自己的网站是A,有一个第三方网站B,在他的网站B上提到了你的网站A,在同一个网页B上也提到了另一个网站C,那么对Google来说,你的网站A和网站C也构成了相关性。虽然A和C之间没有直接的联系。

那么这对你的搜索引擎优化有什么影响呢?最重要的是,当你寻求链接或者买链接的时候,要注意你所要得到的链接网站B,除了连向你以外,还连向哪些其他网站。这些网站构成了在你的网站周围的一个社区,这些社区会形成一个共同的主题,你的网站也就属于这个共同主题。

比 如说,如果你的网站是关于计算机,那么你从某一个大型网站上买链接,而这个大型网站还卖链接给某食品批发网站。那么对Google来说,你的网站主题就会 偏离你实际上的主题,也就是计算机。如果这种链接很多的话,就有可能影响你的以计算机为关键词的搜索引擎结果。这是你所能控制的部分,也就是在寻找或者购 买链接的时候。

那么有一部分是你不能控制的,比如说其他网站因为喜欢你的网站而链接向你。这是你没办法控制的,实际上是你应该高兴的。但是如果这位站长也连向和你的网站完全不相关的网站,怎么办呢?

从逻辑上来说,如果这种链接太多的话,也会影响你的排名。但从另外一个角度看,很难想象这种链接大量存在。因为一般的站长也不会毫无逻辑的在他的网页上放一大堆无用的链接。

这种杂乱无章的没有主题的链接,通常只会在买链接的时候才会出现。

Google知道你是谁

由于Google所掌握的庞大的数据量,Google了解每一个网上活动频繁的人的详细资料,Google知道你是谁,这是不是有点夸张呢?至少对很多网站管理员来说,这一点都不夸张。

拿我自己来举例吧,因为我使用Gmail,所以Google知道我和朋友同事平常都交流什么,Google根据这个信息还在Gmail邮件里面放广告呢。Google也知道我都和谁常联系。

因为我使用Gtalk,Google也知道我和谁聊天,都聊些什么。还好,估计Google现在还没有能正确分析语音的软件,不然连我语音聊天的内容都了解了。

我使用Google Adwords, Google知道我的信用卡号,我的信用卡上登记的姓名,地址。

因为我用Google Adsense,所以Google也知道我的真实姓名,最新的完整地址。等什么时候Google能通过银行转帐向新加坡Adsense用户付款,Google也就将知道我的银行帐号。

我经常用Google搜索,Google的cookie的有效期竟然长达几十年,所以Google知道我通常搜英文的东西,对网站服务器,网站设计,SEO比较感兴趣。最近也经常搜索中文,从2006年6月开始,还对怀孕生孩子的事情比较感兴趣。

甭管我用什么Google服务,我的IP地址会告诉Google,我大部分时间住在新加坡,偶尔会在中国几个星期。

我使用Google Sitemaps,所以Google知道我所管理的大部分网站。

Google是域名注册服务商,所以Google知道我都拥有哪些域名,哪些已经运行,哪些只是被保存着。

我使用Google工具条,很可能我电脑的操作系统,浏览器,品牌等,Google也都知道。

Google知道我使用几台电脑,这几台电脑都是从Dell买的。我太太也使用Gmail,所以Google知道我和一个叫Tina的女同志关系比较密切,经常混用几架电脑。

……

掌握这些信息和搜索引擎优化有什么关系呢?明天再谈。

补充材料再思考

自从Google取消补充材料标记后,关于补充材料的讨论沉寂下来了。Google只是取消了在搜索结果中标注补充材料,补充材料以及补充索引还是存在的,只不过我们不能直接看出来了。

在经过一段时间的思考后,今天谈谈对补充材料的更进一步认识。

以前我曾经觉得补充材料和补充索引的引入,很有可能是因为想节省带宽。但Google最近表明,补充索引中的网页抓取和更新频率加快,补充索引中的网页出现在搜索结果中的机会也提高,说明不是为了节省带宽。

结合一些其他方面的观察,我现在觉得补充索引是为了提高搜索速度。在搜索某些关键词时,Google可能只搜索主索引,忽略补充索引里的结果,这样能大大提高速度。搜索所有关键词都在抓取的所有页面索引中寻找结果的话,那计算量必然使返回结果的速度减慢。

挑出一部分权重高的网页进入主索引,把其他权重低的归入补充索引,可以大大提高计算速度。有的时候主索引中结果不足,才去补充索引中寻找结果。至于在什么情况下才会触发去补充索引中寻找网页不得而知。

以前补充材料被关注的时候,就有朋友认为补充材料并不可怕,因为不少关键词搜索结果中,列在前面的也包含很多补充材料。我想这种观察是错误的。

举一个例子。现在无法准确判断哪些页面是在补充索引中,所以我拿以前谈补充材料时一个帖子的抓图来看点石论坛的一个页面。

dunsh-2.gif

这个页面

http://www.dunsh.org/forums/thread-6462-1-1.html

当时是在补充索引中的,我判断现在也还在补充索引中。

首先这个网页肯定存在于Google的索引库中,我们可以从Google快照中证实这一点。

6462-cache.gif

如果我们在点石域名内搜索网页标题+发帖人史安牛的名字,可以发现Google返回结果中包含这个网页,排在第二位。

6462-search-1.gif

但是如果我们搜索帖子中的第一句话+史安牛,Google显示没有相匹配的文件。

6462-search-2.gif

要注意,实际上在Google数据库中,确实存在相匹配的文件,从上面的快照和搜索中可以看出。

如果我们不限定在点石的网站内搜索帖子的第一句话+史安牛,也可以看到这个页面不被返回。

6462-search-3.gif

但是如果我们搜索帖子中的第二段的一句话+史安牛,又会发现这个网页可以被返回。

6462-search-4.gif

结论是Google确实有两个索引,主索引和补充索引。在补充索引中的网页有时候在某些关键词下,根本不参与排名。就算已经被收录,网页中有这个关键词,而且没有其他匹配文件的时候,这个网页因为是存在于补充索引中,所以根本不会被返回。

HighDiy有一篇关于检查补充索引替代方法的帖子,很全面深入,但其中一句话恐怕不太正确。他提到“Google给出网页进入补充索引的原因包括网页“not fully indexed”,那么,反过来,如果发现某个网页的缓存并不完整,即不包涵网页的全部内容,那么,也基本上可以判定该页位于补充索引了。”我觉得这里的not fully indexed指的不是缓存不包含全部网页内容(没见过这样的缓存),而是指网页虽然被完整收录,但并不参与排名。

所以大量网页进入补充索引,在很大程度上说明了网站的健康情况。补充索引中的网页,能排到前面的几率还是大大降低。

根据Google的说法,进入补充索引最大的原因是PR值过低。顺便做个实验,我这个帖子有链接到点石的那个网页,过一段时间看看是不是还在补充索引中。按Google的说法,有了外部链接,应该从补充索引中出来。

号外:Google PR继续地震

网络营销十技中间加个号外:Google Toolbar PR目前正在地震。

十月初已经有一次不完全PR更新,主要是下降的,一般认为是在惩罚卖链接的网站。Danny Sullivan从Google得到确认,出售链接可以导致惩罚,包括降低PR,而且可能是人工处理。

highdiy的博客可能就是那一批挨刀者之一

几小时前,Google又开始了新一轮惩罚性PR更新。被降PR的包括:

washingtonpost.com/ PR7 to PR5
forbes.com/ PR7 to PR5
suntimes.com/ PR7 to PR5
sfgate.com/ PR7 to PR5
statcounter.com/ PR10 to PR6
masternewmedia.org/ PR7 to PR4
autoblog.com/ PR6 to PR4
engadget.com/ PR7 to PR5
problogger.net/ PR6 to PR4
copyblogger.com/ PR6 to PR4
joystiq.com/ PR6 to PR4
tuaw.com/ PR6 to PR4
searchengineguide.com/ PR7 to PR4
searchenginejournal.com/ PR7 to PR4
johnchow.com/ PR6 to PR4
quickonlinetips.com/ PR6 to PR3
weblogtoolscollection.com/ PR6 to PR4
andybeard.eu/ PR5 to PR3
seroundtable.com/ PR7 to PR4
blogherald.com/ PR6 to PR4

看看这些大名鼎鼎的站,highdiy你心理平衡多了吧? :-)

买卖链接的同志们,真的要小心了。

更新:叫作惩罚可能不太准确。目前大部分站(不是全部,但大部分)只是工具条PR降低,没有迹象显示排名和流量受影响。所以这些站本身的排名能力没影响,收影响的是靠PR卖链接的能力。感觉是Google的一种姿态,意图迫使站长买卖链接时心存恐惧。

Google新闻和心得三则

1)大概一个星期前接到Google Adwords部门发给所有Adwords广告商的一封电子邮件,介绍Google被控告欺骗性点击造成广告商损失的集体诉讼,Google将拿出9000万美元赔给广告商。

在2002年1月之后在Google投放广告的公司和人都有权力加入这一集体诉讼,分到一些赔偿。赔偿数额按给广告商造成的损失占损失总量的比例计算。具体信息可以在这个网站看到。法律文件都已经转换成PDF格式,其中有中文版

正在考虑要不要加入呢?

注意到Google的Email并不是直接链接到和解信息网站,而是通过一个ID跟踪链接再转向。Google什么都想知道啊

2)这两天发现Google Co-opNotebook页面都会被收录在Google数据库中,而且速度很快。这意味着大家可以轻易的从Google域名得到反向链接,只要把你自己的网页加入Notebook就可以了。

可以肯定的是,Google自己的域名是可以被信任的域名,那么这些反向链接对排名有什么影响呢?值得仔细观察。

不过,Google里面都是天才,应该在发布这些产品之前就先把漏洞补上了吧。

3)Google的中文博客,Google黑板报,时不时会发表Google研究员吴军的一些文章,总体来说比较学术化。我在大学里是学理工的,但说实话很多大学学过的东西,比如熵之类的概念,要不是吴军在他的博客里提到,我可能这辈子都不会再想起来了。

硬着头皮看了他这些文章,却发现会透露出一些很有用的信息。比如他在25号写的“信息论在信息处理中的应用”提到,互信息是解决关键词相关性的重要方法之一,有兴趣的读者可以去看一下

我感觉他所说的这个方法,也就是搜索引擎优化圈子里说的语义分析。有时间再给大家介绍,当然我不会用那些学术名词来介绍。

看吴军写帖子的进度,下一篇就应该介绍怎样度量文件对关键词的相关性了,非常期待,也建议读者关注。

Google搜索新功能

在昨天的Google搜索技术发布会上,Google又正式宣布了三项搜索新功能,包括搜索选项 – Search Options,富摘要 – Rich Snippets及Google Squared(不好翻译,等谷歌黑板报给正式中文名称吧)。

两年前的第一次搜索技术发布会上,Google发布的是对SEO已经影响深远,可能以后影响更大的整合搜索。这次发布的几项新技术,貌似没有整合搜索那么重要,不过也很好玩,值得关注一下。

主要说说搜索选项 – Search Options。目前似乎只在英文Google有这个功能。其实搜索选项中显示的大部分内容,以前Google都有零零碎碎的试验或提供过。比如显示过去一星期或24小时之内的页面,早就可以在高级搜索选项中实现,现在Google通过Search Options把这些选择聚合在一起。

现在搜索一个关键词,页面左上角会出现Show Options链接。点击之后左侧菜单会列出一些选项,包括搜索结果类型(选项有显示全部内容,显示视频,论坛或评论内容),显示某一段时间的页面(全部,最近结果,过去24小时,过去一星期,过去一年),显示图片或更多文字,按相关度排序或按时间排序,显示相关搜索,Wonder Wheel(奇迹轮?),时间表 – timeline功能等。

其中显示视频、论坛、评论结果不需解释。

显示某一个时间段的页面有很多可以玩的东西,比如你可以通过这个功能加上site:指令,轻易搜索出自己网站在过去24小时、过去一个星期收录的新页面,对收录有问题需要解决、监控的网站很有用。

如下图所示,在过去24小时,我的博客新收录了一个页面,很准确。gg-24hours

在过去一个星期,收录6个新页面,也正确。

过去一星期Google收录页面

也可以查自己网站最新收录的外部链接,比如SEO每天一贴在过去一个星期,只有可怜的4个新链接进来。

过去24小时收录的链接

而过去一年,只有164个链接。

过去一年收录的链接

这个结果差点令我晕倒,好在link:指令一直是不准的。

还可以按时间排序,而不是按相关度排序。搜索“网络营销”,如下图所示。

搜索结果按时间排序

在过去24小时之内的页面,按时间排序最新收录的页面就显示在最上面,可以看到一分钟前才收录。

点击相关搜索,可以看到列出很多相关的搜索词,列出的比原来在页面底部的更多,有利于SEO们扩展关键词。

相关搜索

点击Wonder Wheel,Google显示与所搜索关键词语义相关的其他词,如下图。

Google Wheel

再点击其中的一个链接,比如keywords,这些语义相关词将跟着扩展。

Google Wheel keywords

当然这种相关判断也有不靠谱的时候,比如搜索ZAC SEO,不知道为什么相关词里有高等数学和厨艺:

语义相关

这个功能对中文支持还不大好,我搜索中文词时都不显示。

点击时间表功能,页面以图表形式显示出某一时间段的搜索结果,用户可以用鼠标在年份及月份上选择,下面的搜索结果将跟着变化:

google timeline

富摘要指的是在搜索结果中列出更多从页面提取的信息,比如价格,评论数:

Rich Snippets 富摘要

这些新功能将怎样影响SEO还有待思考。