Skip to content

標籤: 搜索引擎

关于“互联网是”什么的搜索实验

Doc Searls 在他的博客上记录了自己在Google上和Twitter上对 "The Internet is” 的搜索结果(带引号,即只显示包含这个完整的短语的页面),下面是他整理的Google上的结果(Twitter的请到他博客上去看):

“The Internet is” 互联网是:

1. a Series of Tubes 一系列管道

2. terrible 可怕的

3. really big 实在非常大

4. for porn 色..情.信息

5. shit 一坨屎

6. good 好东西

7. wrong 一个错误

8. killing storytelling 扼杀谎话

更多请入内阅读

 

1 Comment

醒醒吧来看日出:信息时代的分水岭

  我的家乡昆明有一个绝佳的观日出地点:滇池畔的西山。小时候为了看日出,在西山里的寺庙住下,天寒地冻地睡在硬得像石头一样的铺头上。好不容易睡着了,又突然被父母逼迫起床,昏头昏脑地被拖到观景的地方,心里充满怨恨。但是,当那轮红日从远处山峦中最终纵身一跃的时候,我还是被震撼了——太阳真的是跳出来的。从此留下心理阴影,导致我后来学习量变产生质变的原理时非常顺利,马上就知道:尽管时钟滴答滴答,对任何一个时间点都没有歧视。但一些事件真的可以成为时代的分水岭。

  嗯,信息传播的分水岭近在眼前。

  所谓“草根记者”在一两年前还只是部分掌握了网络技能的Geek的小众娱乐。现在它已经成了人人皆可为之、皆在为之的自然形态。看到什么新鲜的东西立即掏出手机咔嚓咔嚓,然后回家粘在博客、BBS、Twitter、Flickr或者在传统管制思路下发音为“非死不可”的Facebook上,已经成为人们生活的常态。而这一切,还在不断发展中,并且在我看来,正酝酿着一轮新的日出。

  如果说,典型Web 2.0形式的网站(如豆瓣和Youtube)还是建立在网站为中心,然后由用户到网站上来制造内容的逻辑上,那么一个新的时代即将到来——在这个时代,互联网将真正由以网站为中心变为以用户为中心,用户即网站,用户的信息瞬间发布、瞬间汇聚,即时更新。与此同时,这个时代的信息获取方式与传统的搜索引擎时代不同了,后者是由搜索引擎派出机器人搜寻既存的消息,而现在则有可能根据用户的需要自动推送信息给任何接受者。Twitter让每个人的页面都成为搜索引擎,并且是不需要打入搜索词的推送引擎。最有趣的是,通过开放的API,twitter上的信息可以瞬间共享到其它网站上(就象法豆首页上的一样)。网站已经不是中心了,人才是中心!或者更准确地说,就像新的P2P传送技术一样,已经没有中心了。

Comments closed

互联网上的隐藏地带:暗网

除了前两天提到的Usenet所代表的新闻组服务外,互联网上还有许多隐藏地带。“暗网”就是其中一类。

 

暗网

维基百科,自由的百科全书(2009年3月8日版本)
注意:本页面复制自维基百科,根据维基百科的要求,在知识共享 署名-相同方式共享 3.0协议之条款下提供。请转载者遵循该条款。

暗网(又称作深网,不可见网,隐藏网)是指互联网上的内容,不属于那些可以被标准搜索引擎索引的表面网络。

迈克尔.伯格曼将当今互联网上的搜索服务比喻为像在地球的海洋表面的拉起一个大网的搜索,巨量的表面信息固然可以通过这种方式被查找得到,可是还有相当大量的信息由于隐藏在深处而被搜索引擎错失掉。绝大部分这些隐藏的信息[暗信息]是由于网页信息必须通过动态请求而产生,而标准的搜索引擎却无法对其进行查找。传统的搜索引擎‘看’不到也获取不了这些存在于暗网的内容,除非通过特定的搜查这些页面才会动态产生,于是相对的,暗网就隐藏了起来。据估计,暗网是大于几个数量级表面网站。[1]

[编辑] 命名

Comments closed

简评“杭州律师状告百度索赔百万人民币”的新闻

  最近有一个“杭州律师状告百度索赔百万人民币”的新闻。根据网易新闻,此案原告为浙江金道律师事务所律师郭力,他在百度搜索自己所在律师事务所及自己姓名等关键字时,发现竟然可以查询到自己的邮件,在尝试了百度快照功能后,还可以阅读邮件的全部内容。郭力随后向邮件服务商反映了这一情况,得到的答复是邮件服务器缓存被百度的搜索程序“非法搜索”,致使邮件内容被链接并公开。郭力认为,邮件服务商与百度共同侵犯了他的秘密通信权,并向北京海淀区法院提起诉讼,要求被告在各自网站首页连续30天刊登致歉声明,同时赔偿经济损失1000元、精神损害抚慰金100万元。

对这个案件,于国富律师有一些评论(我已经加入了我的网摘),很有道理,不过还可更深入一些。我觉得,电子邮件本来就不应该被搜索,而不是过滤不过滤的问题。所以说,在邮件服务商,如果把页面安排成普通的页面,让搜索引擎不能识别,那么就是邮件服务商有过错;而在搜索引擎,如果邮件服务商已经做了适当的反搜索设置(例如:设置了阻挡搜索引擎爬虫的robots.txt,对缓存进行了处理等),则责任就是搜索引擎的。如果能证明搜索引擎的爬虫不守规矩,违反技术标准抓取页面,那就更能证明其过错了。

更深入地分析可以发现,本案还不但是上述的事实证据问题,还有一系列法律标准的判断问题。例如,对原告而言,是否只需要证明自己的隐私由于被告的行为被披露了就足够,而转而由被告来证明自己没有过错;还是说,原告必须自己证明被告的行为有过错?等等。。。时间有限,就不多说了……等案件判决书有了再说吧。

2 Comments