多个绑定多域名的PHP代码

该日志由 Kevin 发表于 2006, May 18, 2:03 AM

  这是一段很有用的代码,和绑定多域名的ASP代码类似,如果你只有一个PHP空间,而你又想放置多个多个站点,下面这些代码可以帮到你。

  第一个:

if($HTTP_HOST=="www.bluefeel.com"){
Header("Location: bluefeel.htm");
}
elseif($HTTP_HOST=="www.99th.cn"){
Header("Location: 99th.htm");
}
else{
Header("Location: other.htm");
}

        第二个:

if($HTTP_HOST=="www.bluefeel.com"){
require "bluefeel.htm";
}
elseif($HTTP_HOST=="www.99th.cn"){
require "99th.htm";
}
else{
require "other.htm";
}

让广告代码不再影响你的网页加载速度

该日志由 Kevin 发表于 2006, May 18, 1:59 AM

  做一些联盟广告时,由于联盟广告的加载慢,整体页面的显示速度也会变慢,如果加入下面的代码就可以有效地解决这个问题。

  第一步:把这段代码放在你要放广告的网页位置:

<span id="myads">广告载入中...</span>

  第二步:把这段代码放到页底:

<span id="span_myads">
这里放广告的JS代码或其他加载速度比较慢的内容都可以.
</span>

<script type="text/javascript">
myads.innerHTML=span_myads.innerHTML;
span_myads.innerHTML="";
</script>

屏蔽百度快照的方法

该日志由 Kevin 发表于 2006, May 18, 1:58 AM

  有时候,因为内容的更改或者隐私问题,我们往往不希望别人通过“百度快照”的方法查看自己网站的某一些网页,这里提供了一段让百度快照失效的代码。

  原理很简单,百度快照里面只有抓取了当前页面的文字信息,而图片和JAVASCRIPT代码还是调用远端服务器上的代码,如果你的网页里有通过.js文件的方式嵌入javascript代码,那么修改这个.js文件,在文件中加入以下代码,即可阻止别人通过百度快照查看你当前页面:

var page_url = window.location.href;
if ( page_url.indexOf("cache.baidu.com") != -1) {
top.location=http://www.bluefeel.com;  //此处地址修改为你希望转向的地址
}

Google和百度收录网站页面的比较

该日志由 Kevin 发表于 2006, May 18, 1:27 AM

  Google和Baidu收录网站页面的标准是不同的。

  我用一句话来形容,就是Google更乐于收录大站的页面,百度则乐于收录新站的页面。

  为此我做一个实验:先申请了一个新域名,在上面放一个网站,然后不在其他任何网站做链接,而直接往百度和Google搜索引擎的提交页面进行提交。一个月过去了,百度收录的网页是24,900篇,Google收录的网页是0,这证实了我以前的猜测。

  这说明了什么呢?说明百度比Google好吗?绝对不是的。因为Baidu和Google收录页面的标准是完全不同的。

  Google是按照网页级别(PageRank)来收录的,只要网站有一定的网页级别,Google会快速收录的,而没有网页级别的网站,Google则坚决不去收录。Baidu则很夸张,采用的是来者不拒,多多益善的原则,无休止的进行收录。Baidu的这种不按网页级别的收录方式其实有很大的恶果,最主要的恶果是造成大量的垃圾网站流行,因为只要做一个垃圾站,Baidu就会立刻收录(25000页以内),这等于变相的鼓励大家去做垃圾站,去盲目采集。当垃圾站横行的时候,Baidu再通过人工的方式封站,对于大流量的网站再威胁其站长办理百度竞价排名。因此Baidu和大量的个人站长都结有恩怨。

  这两种收录方式哪种更好呢?我个人认为Google的这种收录方式是比较科学的。因为互联网上的页面是个天文数字,收录应该是有选择的收录,好的网站则多收录,新站则应该少收录,等其慢慢知名了以后再多收录,这样也提高了效率,让用户搜索到更好的页面而不是更多的页面。如果对于新站不做分析就快速收录,那么会使得从技术上对抗恶意网站作弊(SEO)变得非常困难,Google通过给予新站给出一定的“考察期”来分析这个新站是否是作弊的垃圾站,而百度就只能依靠人工方式手动地删除垃圾站。对于收录网站的具体操作上,Google的爬虫显得较为“体贴”站长-Google爬虫占用服务器的资源非常少,通常是先用head来查看网页是否更新,如果更新了再抓取整个页面,这种方法耗费流量较少。而百度则不管三七二十一上来就抓整个站,有时甚至不遵守robots规则,而且其爬虫数量非常庞大,对于页面较多的网站通常会耗费惊人的流量,并且常常造成恶劣的后果。

  当然,百度这种“贪婪”爬虫抓取方法,虽然会让用户能够在百度搜索出一些Google里搜索不到的页面,但这实在是损人利己。其带给网站站长不少负面效果:服务器和带宽资源过度消耗,垃圾站被变相鼓励了,原创的有特色的网站则被边缘化,MP3音乐网站则更苦不堪言-自己的MP3被百度盗链后带来大量文件下载却没有带来页面访问。

  因此,中国的网民也出现了很奇怪的现象:大量的新网民和菜鸟新手喜欢用百度搜索,因为百度往往搜索到很多别处搜索不到的页面,但内容的匹配度则令人质疑,而专业人士和老鸟则更喜欢用Google,个人站长则普遍和百度有“个人恩怨”。因此百度在业界的Blog以及社区中口碑都不太好,但在普通的低层次的网民心中却不错,这些大量的普通网民给百度带来了大量流量。

  其实百度也发现这样所带来的问题。网络新手和普通网民的影响力微不足道,被流氓网站修改了浏览器,也不会反抗,用时间长了反而会依赖和喜欢上这样的流氓网站。而IT专业人士则不同,他们建网站、写博客、开论坛,他们可以影响一大批普通用户,如果百度长期依靠低端用户而和大量站长结怨的话,其发展前景也是令人质疑的。

百度七宗罪

该日志由 Kevin 发表于 2006, May 18, 1:25 AM

原文:http://www.williamlong.info/archives/492.html

  百度,这个自称是全球最大的中文搜索引擎,经过这几年来的发展,在中国的市场占有率已经超过了Google,独占国内搜索流量的第一名。作为中国最大的搜索引擎的百度,目前的确非常风光,在业界被千万光环所笼罩,但是它真的值得用户信赖和尊敬吗?百度是如何对待自己的产品,如何对待自己的用户呢?让我们一起来看一个真实的百度。
 

  抄袭,永无止境

  从百度成立的第一天起,百度就和抄袭结下了不解之缘,百度抄袭最多的产品当然是Google搜索引擎,从外观上看,百度整个网站的风格和Google如出一辙。当然,百度的抄袭不仅仅是界面这种低级的抄袭,更高级的抄袭是在搜索引擎的底层技术进行抄袭。Google搜索的技术核心是PageRank专利技术,通过对网页的链接进行计算而对网页的重要性做出客观的评价,而百度核心技术竟然和Google类似,也是通过超链分析产生不同的搜索结果。当然,对于这个问题百度也有自己的说法,百度总裁李彦宏就曾经在接受Forbes采访时宣称Google始创于1998年的PageRank技术专利为其持有,Google抄袭了百度的PageRank技术云云。

  当然,百度的抄袭绝不仅仅如此,百度的发展史简直就是一部抄袭的历史,几乎所有Google的产品,只要百度有能力抄袭的产品,它就会不遗余力地进行抄袭。Google出了“地图服务”后,Baidu也推出“百度地图”,Google推出“桌面搜索”,Baidu就出“百度硬盘搜索”,Google出“工具栏”,Baidu也出“搜霸工具栏”,Google推出“新闻快讯订阅”,百度也出“邮件新闻订阅”,Google推出“Google Answers”,百度也出“百度知道”,Google推出“AdSense”,百度就出“百度主题推广”。当然,百度也有自己的说法,百度声称自己并不是简单模仿Google的所作所为,对于Google的一些奇怪的产品,百度是不会模仿的。

  Google的精髓在于创新,每推出一个新产品都在市场、客户的前期需求方面做了大量调查工作,百度这种“拿来主义”的工作方式,的确为自己节省了大量的市场调研费用。但是令人质疑的是,一个企业如果自己产品的大部分功能都只能抄袭自竞争对手,那么它是否会有自己的发展前途呢?

  竞价排名

  竞价排名是百度模仿Google AdWords做的一种按效果付费的网络推广方式,是百度的主要盈利方式,但是其显示方式和Google AdWords有很大不同。用户在Google中搜索出来的结果中,赞助商链接位于页面顶部和右侧,用户们可以清楚地区分哪些是正常的搜索结果,哪些是赞助商们花钱买的位置。百度不仅仅在搜索结果的右侧有赞助商链接,在正常搜索结果的左侧链接也有赞助商广告,这些广告链接和真实搜索结果混杂在一起,很难区分,如果一个广告用户出的钱足够高,那么其广告链接会排在搜索结果的第一名,这样的处理,使得用户的搜索体验非常糟糕。由于遭到广泛的批评,百度搜索内容的广告最近有所减少,但是搜索结果第一页经常大部分或者全部是广告。

  流氓软件

  百度为了获得更大的流量,开发了一个颇有争议的流氓软件-百度超级搜霸,百度公司称其能使用户的搜索更加方便,并且远离网页广告困扰。但有大量用户投诉百度超级搜霸强制安装、难以卸载,在不少论坛中,如何卸载百度超级搜霸插件经常成为热门话题,在2005年北京网络行业协会设立的“流氓软件”网络调查中,百度超级搜霸成为“流氓软件”排行榜前十名,并被限令整改。然而可笑的是,2006年的3月15日,百度居然贼喊捉贼,自己开通超级搜霸315举报网站

  侵犯版权

  百度对于知识产权的保护是比较漠视的,百度自身的很多服务在国际公认的法律中是违法的。例如颇受争议的百度MP3搜索提供在线播放和下载音乐MP3服务,一些唱片公司认为百度的这种服务侵犯了唱片公司信息网络传播权,给唱片公司造成了经济损失,为盗版提供了便利。早期曾有多家唱片公司在北京的法院起诉百度,虽然百度无一胜诉,但是法院裁决百度赔偿的金额却非常少,实际上起到了纵容百度继续侵权的效果。国际上公认提供MP3下载是非法的,典型的案例是在台湾提供音乐下载的Kuro网站负责人被判入狱三年并罚款,Google等搜索引擎在各国皆不提供有争议的MP3搜索。

  百度最近开通的另一项服务-百度百科更集中了百度的两大看家法宝-“抄袭”和“侵权”于一身,肆无忌惮地进行大规模地侵犯知识产权的行为,在百度百科上找到一条原创的条目如大海捞针般的困难,百度百科开通才两个星期,其条目数就超过了中文维基百科几年来的条目总和。而目前我们国家在著作权等法律上的漏洞,以及早先在音乐侵权案件上的低额罚款,使得百度在侵权方面有了更足的底气,在侵权的力度上也更加肆无忌惮(不过某些针对国外的服务有特殊处理)。

  技术落后

  在技术层面,做为搜索引擎最基本的技术-收录页面的技术,我们发现百度收录网站页面的技术相比Google来说是有很大缺陷的,这在我另外一篇文章:《Google和百度收录网站页面的比较》中有很详细的说明。百度的收录网页的机制使得作弊的垃圾网站更容易被收录,客观上使得原创的有特色的网站被边缘化,当垃圾站横行的时候,百度必需投入巨大的精力来封杀作弊的垃圾网站,误封正常网站的情况比比皆是,对于被封的大流量网站,一些百度的业务员威胁网站站长办理百度竞价排名,导致百度和大量站长都结有恩怨,越来越多的人开始咒骂百度

  冒充民族企业

  百度在对外宣传上,张口闭口都说自己是所谓的“民族企业”,比Google等国外公司“更懂中文”,并打着所谓“爱国”的旗号,说反百度就是反对中国的民族产业,支持Google就是卖国云云

  然而,百度真的是中国公司吗?事实是:百度公司注册于英属开曼群岛,百度的创始人李彦宏持有美国绿卡,百度启动的资金是美国的风险投资,现在美资在百度中占有51%以上的份额,百度在中国注册全资子公司的目的可能是为了规避中国政府的关于外资不能进入新闻广告等领域的法规。因此,百度准确的说应该是一家由华人创办的、专注于在华业务的美资搜索引擎技术公司。

  同行恶意竞争

  百度对于同行的恶意竞争的手段可谓层出不穷。在百度赶超Google的过程中,在2002年9月发生了一起中国封杀Google的事件,导致中国大陆地区无法访问Google网站,后来因为各地用户强烈反对,Google又被解封,但Google的网页快照功能至今都无法正常使用,据传闻称封杀限制Google前后均由百度在幕后操作。

  另外一起著名的事件是8848被百度攻击案,8848网站是中国一家从事电子商务的网站,在2005年1月21日,8848网站发现百度采用分布式拒绝服务攻击(DDOS攻击)的手段,借助几千家百度搜索联盟网站的巨大访问量集中攻击8848的服务器,使8848网站无法被正常访问至少长达26小时,导致网上商城的商户无法正常销售、支付和结算收款。然而,由于8848网站提交给法院的证据不足,法院判定8848败诉。

  在2006年初,Google的CN中文域名在正式运作之际,尽管Google.cn的服务器是放在美国的加利佛尼亚州而不是在中国,但依旧有神密人物暗中举报给信息产业部,诬陷说Google.cn“涉嫌无照经营”,没有获取ICP认证,应当禁止运行。

  以上是我总结出的百度在这些年出现的种种问题,这些问题也许还是中国IT行业中不少公司所面临的通病,急功近利、唯利是图、丧失诚信、同行之间恶意竞争等等,我们衷心地希望百度公司能够正确地面对自己的错误,勇敢地进行改正,而不是百般狡辩、抵赖、回避。如果百度还是执迷不悟,依旧这样对待自己的用户,那么最终百度必定会被自己地用户所唾弃。

  注:我写本文的直接原因,是因为前几天看到有人在为百度摇旗呐喊地攻击Google

  更新:关于PageRank的专利到底属于谁,KESO在美国专利和商标局网站上查询到,Lawrence Page(即Larry Page)共有两项专利被批准,其中于1998年1月9日提交的PageRank的专利申请(PDF文件下载),于2001年9月4日被批准,美国专利号6,285,999。Li Yanhong有也有相关专利,美国专利号:5,920,859。专利提交日期为1997年2月5日,批准日期为1999年7月6日。这项专利是关于超文本文档检索系统和方法(Hypertext document retrieval system and method)。相关专家可以来分析两个专利的相似性。

百度和Google谁更能搜索色情信息

该日志由 Kevin 发表于 2006, May 18, 1:24 AM

转自月光博客   本文主要针对百度和Google搜索引擎的关键字过滤功能进行比较和分析。   最近部分国内媒体刊登了一系列文章,包括“Google可搜大量色情链接 过滤可能损失流量”,“Google搜索不良条目量攀升 社会责任遭考验”,以大量篇幅论证Google包含色情违法信息,甚至有一种倾向,即将色情、违法信息泛滥的罪责推向了Google,似乎封杀了Google或搞定了Google关键词过滤,网络世界从此就会如同真空一样纯净。   虽然Google推出了专门针对中国国情的“谷歌”(Google.cn),并使用了颇受争议的信息过滤技术,然而即使如此依旧无法摆脱被恶意攻击和诽谤的命运。   该文章攻击道:“最常用的信息过滤、屏蔽技术被称为‘关键字过滤’,这项技术为广大搜索引擎企业所掌握”。并声称“这项‘信息过滤’技术不算是特别复杂的技术”。   据我所知,Google.cn(以后简称Google)和百度目前都对色情违法信息进行了过滤技术,不同的是,百度还增加了一项关键词屏蔽技术,就是对于一批敏感关键词,当服务器接收到用户提交的搜索词后,先将搜索词和上述“过滤词汇表”进行匹配对比;一旦匹配成功,服务器即返回“您输入的关键词可能涉及不符合相关法律法规的内容”,然后结束搜索。比如在百度搜索“色情”等词语后显示的效果。   然而,从技术上讲,这种“过滤词汇表”实际上有很大缺陷和漏洞,对于稍懂一点电脑知识的人来说形同虚设,例如在百度搜索“色情”的确不让搜索,但是搜索“"色情"”(带引号的色情)即可返回18,300,000万条搜索记录,远远多于Google搜索出的记录(另外提一下,我用Google搜索“色情”返回的结果是“该页无法显示”,不知道这个记者用什么线路上网的,莫非是百度提供的专线?)。推而广之,所有百度通过“过滤词汇表”屏蔽的词汇,大部分只要加上个引号就全都可以搜索,另外,将多个屏蔽关键字组合在一起也可以搜索出结果,更可笑的是,在百度不可以搜索“色情”,但却可以搜索出“色情图片”70万条记录,“色情电影”51万条记录,“色情小说”23万条记录,“色情网站”79万条记录,可见这种屏蔽的方法实在是用来忽悠媒体的,实际作用非常有限。   其次,对于使用具体过滤技术来看,Google和百度都通过内容的相关性过滤掉色情违法网站,Google过滤是会在页面底部显示“据当地法律法规和政策,部分搜索结果未予显示”。两者的过滤效果来看,搜索几个关键字即可感觉出来。   百度搜索“色情图片”,第一页的大多数是论坛上的文章,并有4、5条包含色情信息,而在Google搜索“色情图片”,则第一页没有一篇是色情信息。搜索其他的信息进行对比也可以发现Google的确在信息过滤上做了不少工作,而百度则过滤的信息远不如Google,更进一步,用百度和Google搜索英文,我们发现百度对于英文网站的过滤效果更差,用百度搜索“hardcore”,结果出现了170万条数据,可以打开查看到非常多的色情网站,而在Google中搜索“hardcore ”只能搜索到288条结果,这个夸张的对比可以看出两者在过滤功能上所做的工作实在差距太大,所以,如果百度在这方面对Google进行指责攻击,那实在是颠倒黑白,指鹿为马。   当然,这也反映出一个问题,就是Google和百度不同,Google根本不了解中国的国情,中国的国情就是人治,说明白点就是某些人凭自己的主观意志决定一切,你其实什么都不用做,但你其实什么都做了, 以前有个对联是“说你行,你就行,不行也行;说不行,就不行,行也不行”, 横批是“不服不行”。要深刻理解这种国情,必须知道这里谁说了算,谁能决定你企业的命运呢?当然是有权的人,只有他们才是主人,要想成功就需要积极向他们靠拢,争取进入他们的利益集团,形成共同利益,这才是在中国立于不败之地的方法。在中国做成功的企业要完全放弃自己的道德、良心和价值观,百度是“只说不做”,而Google是“只做不说”,Google还天真的以为配合中国进行信息过滤就可以顺利进入中国市场,其实百度在过滤上做的工作可能还不如Google的十分之一,但是百度却能让别人以为百度比Google做的多十倍。   当然,Google是个很值得敬佩的企业,在企业的价值观、道德观方面,Google坚持“你可以挣钱而不必做怀事”,在公司内部,每个人都努力成为“极具创新精神、值得信赖、行事正直,而且极大地改变了这个世界的人”。Google无论在管理领域还是在服务领域都顺应个人化、大众化、社会化的趋势,坚持“做正确的事情”。可能正是因为这一点,才使得目前Google在和百度的竞争中处于劣势。

顶级CEO高效工作的6大秘诀

该日志由 Kevin 发表于 2006, May 18, 12:15 AM

  坐拥半壁江山的明星CEO们和我们一样,一天只有24个小时,每天被会议、项目追着跑,电话、E-mail没有停过,但他们却有办法气定神闲地回家吃晚饭、陪家人,常常绕着地球飞也一样神采奕奕,日理万机之余还能讲求身心的平衡自在。
秘诀1:一日之计在于晨
  高效CEO几乎都有早起的好习惯。星巴克总裁舒尔茨、法国雷诺与日本日产汽车的CEO戈恩、宝洁CEO雷富礼都是5点多就起床,思考、看报、听各地的业务简报,然后在电话蜂拥而来之前进入办公室处理业务,因为这样不受打扰,思考与工作都能事半功倍。太平洋投资管理公司的投资长葛洛斯甚至每天4点半就起床,不到6点就进办公室,这样,身处美国西岸的他才能及早接收当天东岸上午8点半(西岸5点半)宣布的种种经济指标,早一步拟定投资策略。正因为他们早起,更早开始、更有效率地工作,所以多半可以在七八点就回家休息。
  清晨的黄金时光除了掌握工作先机,也要摄取高纤维食物。雷富礼就特别强调饮食对工作绩效的重要,他的早餐包括一杯蔬果汁、半个培果面包以及一杯优格。有异曲同工之妙的是刚卸下美联储主席重任的格林斯潘,他的早餐是一碗燕麦粥和一杯无糖咖啡。
秘诀2:动静相宜
  跟多数忙碌的上班族不同,明星CEO们再忙也会抽时间运动,且静下来可以独处。
  每天上午8点半到10点,葛洛斯都抛下紧迫逼人的数字与投资,到办公室对街的健康俱乐部做瑜珈。这是他的“天堂”,远离噪音、办公室、交易以及布隆伯格信息网上的种种数字,“脑中一些重要的灯泡会突然亮起来,这是我一天中最珍贵的时光。”有许多好点子就是在这个天堂时间、葛洛斯的倒立瑜珈动作间浮现。只要有心,随时随地都可以运动。高盛证券的总裁鲍尔森到中国出差时,就选择了6点钟可以抵达的班机,到饭店后,直奔健身房,运动完再开始工作。第2天早晨,一样先到健身房报到。
  除了动,CEO们也讲求独处、思考的时间。法国雷诺与日本日产汽车的CEO戈恩要求秘书不要在8点以前排会议,好让他静下来独处。
秘诀3:一定要休息
  有趣的是,许多上班族被工作逼得加班不停、无法休假,这些高级主管却强调,一定要挪出时间休息,做点有趣的事。
  即使是在高竞争压力的汽车业工作,戈恩也不把工作带回家。回家就是休息充电,跟孩子们玩,周末也不例外。而且他发现,藉此可以跟工作上面临的问题有一点距离,星期一回去上班后,反而把问题看得更清楚,更能迎刃而解。Google的副总裁梅尔每周五都是6点就下班,然后到旧金山玩耍,每4个月更要大休一次。星巴克咖啡的舒尔茨每7个星期就旅行一趟,尽情吸收不同世界的精华。
秘诀4:分秒必较
  惬意地休息,有效率地管理时间。
  星巴克咖啡在全球每5个小时就开一家分店,舒尔茨用全球时区来做时间管理区隔:清早与上午,他专注欧洲的事务;接下来的时间留给美国业务;晚上就和亚洲通讯联系。戈恩每个月都要飞日本与法国一次,每个月的第一周在巴黎、第三周在日本。因为时间有限,他规定每个会议都不能超过一个半小时,一半时间报告、一半时间讨论。高盛的鲍尔森也以掌握时间精准而闻名。如果晚上有应酬,要在6点半开始,8点半以前结束。这样他才能10点就上床睡觉,第二天早上5点半起床运动。
秘诀5:不照单全收电子产品
  他们的生活这么忙碌,企业要与时精进,一定也大量使用电子产品才能掌握信息、跟得上时代吧?但事实并非如此。许多CEO只选择性地使用大家几乎不离手的电话、手机与电子邮件。在分秒必争的金融业,鲍尔森没用过电子邮件。葛洛斯不太读电子邮件,也没有手机,而且除了妻子打来的电话以外,一天只接3~4个电话,“我的座右铭就是,我不想被连结,想跟大家断线。”DLA律师事务所合伙人舒曼从不开手机,因为她不是在开会就是在和客户面谈,不想被干扰。
  但是多数人有他们依赖的电子配备。旅遍全球,舒尔茨的PDA手机则使用几乎在世界各地都可以通用的GoodLink收信与安排、记录各种行程。至于北美流行、容易收发邮件的智能型手机黑莓,则是雷富礼的必备之物。
秘诀6:始终要回归人性
  不论这些企业精英们的生活再怎么有效率、再怎么讲求秩序、科技再怎么进步,他们还是强调,一切要以人为本,讲求人性。
  雷富礼在办公室摆了造型奇特有趣、甚至是粉红色、黄绿色的座椅,希望人们愿意进来多走走聊聊,不要觉得那么不可亲近。舒尔茨跟各国分公司联系时,除了问业绩,也记得恭喜对方,因为这些人际间的对话是很重要的。高盛的鲍尔森则亲自打电话给60来个CEO朋友贺年,虽然煞费多时,“但是感觉棒极了!”

专门收集404页面的网站

该日志由 Kevin 发表于 2006, May 17, 10:00 PM