忙碌是偷懒的一种,比如懒得去思考我们为什么这样碌碌无为!
该日志由 Kevin 发表于 2006, May 18, 2:03 AM
第一个:
if($HTTP_HOST=="www.bluefeel.com"){
Header("Location: bluefeel.htm");
}
elseif($HTTP_HOST=="www.99th.cn"){
Header("Location: 99th.htm");
}
else{
Header("Location: other.htm");
}
第二个:
if($HTTP_HOST=="www.bluefeel.com"){
require "bluefeel.htm";
}
elseif($HTTP_HOST=="www.99th.cn"){
require "99th.htm";
}
else{
require "other.htm";
}
该日志由 Kevin 发表于 2006, May 18, 1:59 AM
第一步:把这段代码放在你要放广告的网页位置:
<span id="myads">广告载入中...</span>
第二步:把这段代码放到页底:
<span id="span_myads">
这里放广告的JS代码或其他加载速度比较慢的内容都可以.
</span>
<script type="text/javascript">
myads.innerHTML=span_myads.innerHTML;
span_myads.innerHTML="";
</script>
该日志由 Kevin 发表于 2006, May 18, 1:58 AM
原理很简单,百度快照里面只有抓取了当前页面的文字信息,而图片和JAVASCRIPT代码还是调用远端服务器上的代码,如果你的网页里有通过.js文件的方式嵌入javascript代码,那么修改这个.js文件,在文件中加入以下代码,即可阻止别人通过百度快照查看你当前页面:
var page_url = window.location.href;
if ( page_url.indexOf("cache.baidu.com") != -1) {
top.location=http://www.bluefeel.com; //此处地址修改为你希望转向的地址
}
该日志由 Kevin 发表于 2006, May 18, 1:27 AM
我用一句话来形容,就是Google更乐于收录大站的页面,百度则乐于收录新站的页面。
为此我做一个实验:先申请了一个新域名,在上面放一个网站,然后不在其他任何网站做链接,而直接往百度和Google搜索引擎的提交页面进行提交。一个月过去了,百度收录的网页是24,900篇,Google收录的网页是0,这证实了我以前的猜测。
这说明了什么呢?说明百度比Google好吗?绝对不是的。因为Baidu和Google收录页面的标准是完全不同的。
Google是按照网页级别(PageRank)来收录的,只要网站有一定的网页级别,Google会快速收录的,而没有网页级别的网站,Google则坚决不去收录。Baidu则很夸张,采用的是来者不拒,多多益善的原则,无休止的进行收录。Baidu的这种不按网页级别的收录方式其实有很大的恶果,最主要的恶果是造成大量的垃圾网站流行,因为只要做一个垃圾站,Baidu就会立刻收录(25000页以内),这等于变相的鼓励大家去做垃圾站,去盲目采集。当垃圾站横行的时候,Baidu再通过人工的方式封站,对于大流量的网站再威胁其站长办理百度竞价排名。因此Baidu和大量的个人站长都结有恩怨。
这两种收录方式哪种更好呢?我个人认为Google的这种收录方式是比较科学的。因为互联网上的页面是个天文数字,收录应该是有选择的收录,好的网站则多收录,新站则应该少收录,等其慢慢知名了以后再多收录,这样也提高了效率,让用户搜索到更好的页面而不是更多的页面。如果对于新站不做分析就快速收录,那么会使得从技术上对抗恶意网站作弊(SEO)变得非常困难,Google通过给予新站给出一定的“考察期”来分析这个新站是否是作弊的垃圾站,而百度就只能依靠人工方式手动地删除垃圾站。对于收录网站的具体操作上,Google的爬虫显得较为“体贴”站长-Google爬虫占用服务器的资源非常少,通常是先用head来查看网页是否更新,如果更新了再抓取整个页面,这种方法耗费流量较少。而百度则不管三七二十一上来就抓整个站,有时甚至不遵守robots规则,而且其爬虫数量非常庞大,对于页面较多的网站通常会耗费惊人的流量,并且常常造成恶劣的后果。
当然,百度这种“贪婪”爬虫抓取方法,虽然会让用户能够在百度搜索出一些Google里搜索不到的页面,但这实在是损人利己。其带给网站站长不少负面效果:服务器和带宽资源过度消耗,垃圾站被变相鼓励了,原创的有特色的网站则被边缘化,MP3音乐网站则更苦不堪言-自己的MP3被百度盗链后带来大量文件下载却没有带来页面访问。
因此,中国的网民也出现了很奇怪的现象:大量的新网民和菜鸟新手喜欢用百度搜索,因为百度往往搜索到很多别处搜索不到的页面,但内容的匹配度则令人质疑,而专业人士和老鸟则更喜欢用Google,个人站长则普遍和百度有“个人恩怨”。因此百度在业界的Blog以及社区中口碑都不太好,但在普通的低层次的网民心中却不错,这些大量的普通网民给百度带来了大量流量。
其实百度也发现这样所带来的问题。网络新手和普通网民的影响力微不足道,被流氓网站修改了浏览器,也不会反抗,用时间长了反而会依赖和喜欢上这样的流氓网站。而IT专业人士则不同,他们建网站、写博客、开论坛,他们可以影响一大批普通用户,如果百度长期依靠低端用户而和大量站长结怨的话,其发展前景也是令人质疑的。
该日志由 Kevin 发表于 2006, May 18, 1:25 AM
原文:http://www.williamlong.info/archives/492.html
百度,这个自称是全球最大的中文搜索引擎,经过这几年来的发展,在中国的市场占有率已经超过了Google,独占国内搜索流量的第一名。作为中国最大的搜索引擎的百度,目前的确非常风光,在业界被千万光环所笼罩,但是它真的值得用户信赖和尊敬吗?百度是如何对待自己的产品,如何对待自己的用户呢?让我们一起来看一个真实的百度。
抄袭,永无止境
从百度成立的第一天起,百度就和抄袭结下了不解之缘,百度抄袭最多的产品当然是Google搜索引擎,从外观上看,百度整个网站的风格和Google如出一辙。当然,百度的抄袭不仅仅是界面这种低级的抄袭,更高级的抄袭是在搜索引擎的底层技术进行抄袭。Google搜索的技术核心是PageRank专利技术,通过对网页的链接进行计算而对网页的重要性做出客观的评价,而百度核心技术竟然和Google类似,也是通过超链分析产生不同的搜索结果。当然,对于这个问题百度也有自己的说法,百度总裁李彦宏就曾经在接受Forbes采访时宣称Google始创于1998年的PageRank技术专利为其持有,Google抄袭了百度的PageRank技术云云。
当然,百度的抄袭绝不仅仅如此,百度的发展史简直就是一部抄袭的历史,几乎所有Google的产品,只要百度有能力抄袭的产品,它就会不遗余力地进行抄袭。Google出了“地图服务”后,Baidu也推出“百度地图”,Google推出“桌面搜索”,Baidu就出“百度硬盘搜索”,Google出“工具栏”,Baidu也出“搜霸工具栏”,Google推出“新闻快讯订阅”,百度也出“邮件新闻订阅”,Google推出“Google Answers”,百度也出“百度知道”,Google推出“AdSense”,百度就出“百度主题推广”。当然,百度也有自己的说法,百度声称自己并不是简单模仿Google的所作所为,对于Google的一些奇怪的产品,百度是不会模仿的。
Google的精髓在于创新,每推出一个新产品都在市场、客户的前期需求方面做了大量调查工作,百度这种“拿来主义”的工作方式,的确为自己节省了大量的市场调研费用。但是令人质疑的是,一个企业如果自己产品的大部分功能都只能抄袭自竞争对手,那么它是否会有自己的发展前途呢?
竞价排名
竞价排名是百度模仿Google AdWords做的一种按效果付费的网络推广方式,是百度的主要盈利方式,但是其显示方式和Google AdWords有很大不同。用户在Google中搜索出来的结果中,赞助商链接位于页面顶部和右侧,用户们可以清楚地区分哪些是正常的搜索结果,哪些是赞助商们花钱买的位置。百度不仅仅在搜索结果的右侧有赞助商链接,在正常搜索结果的左侧链接也有赞助商广告,这些广告链接和真实搜索结果混杂在一起,很难区分,如果一个广告用户出的钱足够高,那么其广告链接会排在搜索结果的第一名,这样的处理,使得用户的搜索体验非常糟糕。由于遭到广泛的批评,百度搜索内容的广告最近有所减少,但是搜索结果第一页经常大部分或者全部是广告。
流氓软件
百度为了获得更大的流量,开发了一个颇有争议的流氓软件-百度超级搜霸,百度公司称其能使用户的搜索更加方便,并且远离网页广告困扰。但有大量用户投诉百度超级搜霸强制安装、难以卸载,在不少论坛中,如何卸载百度超级搜霸插件经常成为热门话题,在2005年北京网络行业协会设立的“流氓软件”网络调查中,百度超级搜霸成为“流氓软件”排行榜前十名,并被限令整改。然而可笑的是,2006年的3月15日,百度居然贼喊捉贼,自己开通超级搜霸315举报网站。
侵犯版权
百度对于知识产权的保护是比较漠视的,百度自身的很多服务在国际公认的法律中是违法的。例如颇受争议的百度MP3搜索提供在线播放和下载音乐MP3服务,一些唱片公司认为百度的这种服务侵犯了唱片公司信息网络传播权,给唱片公司造成了经济损失,为盗版提供了便利。早期曾有多家唱片公司在北京的法院起诉百度,虽然百度无一胜诉,但是法院裁决百度赔偿的金额却非常少,实际上起到了纵容百度继续侵权的效果。国际上公认提供MP3下载是非法的,典型的案例是在台湾提供音乐下载的Kuro网站负责人被判入狱三年并罚款,Google等搜索引擎在各国皆不提供有争议的MP3搜索。
百度最近开通的另一项服务-百度百科,更集中了百度的两大看家法宝-“抄袭”和“侵权”于一身,肆无忌惮地进行大规模地侵犯知识产权的行为,在百度百科上找到一条原创的条目如大海捞针般的困难,百度百科开通才两个星期,其条目数就超过了中文维基百科几年来的条目总和。而目前我们国家在著作权等法律上的漏洞,以及早先在音乐侵权案件上的低额罚款,使得百度在侵权方面有了更足的底气,在侵权的力度上也更加肆无忌惮(不过某些针对国外的服务有特殊处理)。
技术落后
在技术层面,做为搜索引擎最基本的技术-收录页面的技术,我们发现百度收录网站页面的技术相比Google来说是有很大缺陷的,这在我另外一篇文章:《Google和百度收录网站页面的比较》中有很详细的说明。百度的收录网页的机制使得作弊的垃圾网站更容易被收录,客观上使得原创的有特色的网站被边缘化,当垃圾站横行的时候,百度必需投入巨大的精力来封杀作弊的垃圾网站,误封正常网站的情况比比皆是,对于被封的大流量网站,一些百度的业务员威胁网站站长办理百度竞价排名,导致百度和大量站长都结有恩怨,越来越多的人开始咒骂百度。
冒充民族企业
百度在对外宣传上,张口闭口都说自己是所谓的“民族企业”,比Google等国外公司“更懂中文”,并打着所谓“爱国”的旗号,说反百度就是反对中国的民族产业,支持Google就是卖国云云。
然而,百度真的是中国公司吗?事实是:百度公司注册于英属开曼群岛,百度的创始人李彦宏持有美国绿卡,百度启动的资金是美国的风险投资,现在美资在百度中占有51%以上的份额,百度在中国注册全资子公司的目的可能是为了规避中国政府的关于外资不能进入新闻广告等领域的法规。因此,百度准确的说应该是一家由华人创办的、专注于在华业务的美资搜索引擎技术公司。
同行恶意竞争
百度对于同行的恶意竞争的手段可谓层出不穷。在百度赶超Google的过程中,在2002年9月发生了一起中国封杀Google的事件,导致中国大陆地区无法访问Google网站,后来因为各地用户强烈反对,Google又被解封,但Google的网页快照功能至今都无法正常使用,据传闻称封杀限制Google前后均由百度在幕后操作。
另外一起著名的事件是8848被百度攻击案,8848网站是中国一家从事电子商务的网站,在2005年1月21日,8848网站发现百度采用分布式拒绝服务攻击(DDOS攻击)的手段,借助几千家百度搜索联盟网站的巨大访问量集中攻击8848的服务器,使8848网站无法被正常访问至少长达26小时,导致网上商城的商户无法正常销售、支付和结算收款。然而,由于8848网站提交给法院的证据不足,法院判定8848败诉。
在2006年初,Google的CN中文域名在正式运作之际,尽管Google.cn的服务器是放在美国的加利佛尼亚州而不是在中国,但依旧有神密人物暗中举报给信息产业部,诬陷说Google.cn“涉嫌无照经营”,没有获取ICP认证,应当禁止运行。
以上是我总结出的百度在这些年出现的种种问题,这些问题也许还是中国IT行业中不少公司所面临的通病,急功近利、唯利是图、丧失诚信、同行之间恶意竞争等等,我们衷心地希望百度公司能够正确地面对自己的错误,勇敢地进行改正,而不是百般狡辩、抵赖、回避。如果百度还是执迷不悟,依旧这样对待自己的用户,那么最终百度必定会被自己地用户所唾弃。
注:我写本文的直接原因,是因为前几天看到有人在为百度摇旗呐喊地攻击Google。
更新:关于PageRank的专利到底属于谁,KESO在美国专利和商标局网站上查询到,Lawrence Page(即Larry Page)共有两项专利被批准,其中于1998年1月9日提交的PageRank的专利申请(PDF文件下载),于2001年9月4日被批准,美国专利号6,285,999。Li Yanhong有也有相关专利,美国专利号:5,920,859。专利提交日期为1997年2月5日,批准日期为1999年7月6日。这项专利是关于超文本文档检索系统和方法(Hypertext document retrieval system and method)。相关专家可以来分析两个专利的相似性。
该日志由 Kevin 发表于 2006, May 18, 1:24 AM
该日志由 Kevin 发表于 2006, May 18, 12:15 AM