关于“互联网是”什么的搜索实验

关于“互联网是”什么的搜索实验

Doc Searls 在他的博客上记录了自己在Google上和Twitter上对 "The Internet is” 的搜索结果(带引号,即只显示包含这个完整的短语的页面),下面是他整理的Google上的结果(Twitter的请到他博客上去看):

“The Internet is” 互联网是:

1. a Series of Tubes 一系列管道

2. terrible 可怕的

3. really big 实在非常大

4. for porn 色..情.信息

5. shit 一坨屎

6. good 好东西

7. wrong 一个错误

8. killing storytelling 扼杀谎话

9. dead 死了

10. serious business 真正的生意

11. for everyone 所有人的

12. underrated 被低估了

13. infected 被感染了

14. about to die 快死了

15. broken 破碎了

我对照看了一下,上面基本是Google搜索结果前2页就包括了的内容,搜索结果很多元化

16. Christmas all the time 天天圣诞节

17. altering our brains 改变我们的脑子的东西

18. changing health care 改变医疗保健的工具

19. laughing at NBC 嘲笑全国广播公司的工具

20. changing the way we watch TV 改变我们看电视的方式的工具

21. changing the scientific method 改变科学研究方法的工具

22. dead and boring 死了,而且很无聊

23. not shit 不是一坨屎

24. made of kittens 由猫咪组成的

25. alive and well 非常健康的活着

26. blessed 被祝福的东西

27. almost full 几乎满了

28. distracting 分散精力的东西

29. a brain 一个大脑

30. cloudy 数据云

到了搜索结果第5页,上面提到的基本都已经有了

 

这个搜索很有意思,我扩展了一下,做了一个搜索引擎的比较试验。没时间通读的人,请直接滚动到页面下方看小结。

我在Google.com上用“互联网是”作为搜索词,得到以下的结果(因为中文的特点,我把搜索结果的上下文都复制了过来):

 

“互联网是”:

1. (中国的互联网是)开放的

2. (邓元鋆:移动互联网是)“中国创造” 发展动力

3. (8成受访者认为登录互联网是一项)基本权利

4. (李彦宏转帖:互联网是)弱势群体

5. (互联网是)美国的第三大新闻平台

搜索结果第1页完(每页10个结果,除了这5个外,其它是重复的)

 

6. (互联网是)不是让人变得愚昧

7. (下一代互联网是)什么

8. (杨元庆:移动互联网是)联想的机遇和方向

9. (互联网是)彩色的

10. (三网融合对互联网是)喜是悲


搜索结果第2页完

11. 爱、分享、融合

12. (中国互联网是)美国互联网跟班

13. (人大代表和政协委员:依法管理互联网是)国际通行做法

14. (互联网是)一个创造奇迹的地方

搜索结果第3页完

15. (全业务、移动互联网是)未来趋势

16. (移动互联网是)经济发展引擎

17. (谷歌事件证明“互联网)是政治”

18. (互联网是)变革传播方式的一项伟大科技创新

19. (互联网是)孕育人类天国文明的神圣之河

20. (互联网是)媒体深刻革命的根本动因

21. (移动互联网是)3G业务的最佳突破点

搜索结果第5页完(令人震精的是,前五页中,除了上面列出来的20条外,其它几乎所有搜索结果都是第一条的重复——其中包括一些人引用这句话而进行的评论)
 

22. (互联网是)工具不是玩具

23. (互联网是)谁的江湖

24. (互联网是)拉动内需的引擎

搜索结果第6页完(令人继续震精的是,这一页中,除了上面列出来的3条外,所有搜索结果仍然是第一条的重复)

搜索结果第7页全是重复前面的内容

25. (互联网是)柄双刃剑

除了这一条外,搜索结果第8页全是重复前面的内容

26. (互联网是)消费者获取电子产品信息的首要途径

除了这一条外,搜索结果第9页全是重复前面的内容

27. 互联网是推动农村信息化最便捷最经济的途径

28. 互联网是手段,营销才是本质

29. 互联网是最有效的企业推广平台

30. 互联网是广播电视的终结者

31. 张经甫:互联网是家居企业品牌塑造的“必选项”

32. 荆林波:互联网是进行征信最有效工具

33. 卫星互联网是商机还是隐阱

第10页忽然多元化了,10条结果中有7条是新的

 

让我们看看用关键词“互联网是”在百度上的搜索结果:

 

“互联网是”:

1. 南方周末:互联网是音乐的敌人还是朋友

2. 万鄂湘:互联网是民意 网民不关心司法才是灾难

3. 中国首度回应谷歌退出:中国互联网是开放的

4. 李彦宏转帖:互联网是弱势群体

搜索结果第1页完 (其他是重复或者无关的页面)

5. 互联网是彩色的!

6. 互联网是一场什么样的革命

7. 互联网是系统

8. 天涯学术专访胡泳:互联网是一个未完成的公共领域

9. 焦点网谈:互联网是游荡在孩子们身边的幽灵?

第2页完

10. 互联网是全球性的、开放性的、革命性的传媒

11. 移动互联网是第三代互联网

12. 李星:互联网面临四大挑战 未来互联网是什么

13. 互联网是用来做什么 — 杀鸡?宰牛?屠龙?

14. 互联网是谁发明的

15. 腾讯副总裁刘畅:互联网是中国经济发展新助推器

16. 互联网是媒体竞争格局最大变数

17. 互联网是提高执政能力的有效途径

18. 谁说互联网是免费的

19. 互联网是金矿

第3页完

20. 互联网是八九点钟的太阳?

21. 互联网是了解民情汇集民智的重要渠道

22. 互联网是信息化与工业化融合重要平台

23. 王志东:互联网是改革开放后十年的主要推动力

24. 胡泳:互联网是中国的天赐礼物 

第4页完

25. 互联网是解决方案

26. 强大而省钱的修炼工具

27. 乱世江湖

28. 圆的

第5页完

29. 第6页全是标题为“互联网是什么”的文章或重复的信息

30. 企业持续成长的加速器

31. 社会心理缓冲阀

32. 移动互联网是国产品牌手机企业的转折点

33. 互联网是个好东西

34. 战胜金融海啸的真正生产力

到第7页,有了34个不同的答案

 

作为校验,下面是百度搜索“网络是”的结果,(排除杂讯后)前几位的: 

 

1. 郑祖康:网络是解决就业问题的新途径

2. 网络是青年致富的好帮手

3. 新京报:网络是自由的也是法治的

4. 苏荣:网络是上情下达下情上达的重要媒体

5. 苏荣:网络是迄今为止人类最伟大的发明之一

6. 心理访谈第五场:网络是把"双刃剑"

7. 黄兴国:网络是问政于民、问计于民的重要平台

 

下面是百度搜索“因特网是”的结果,与前面未重复的前几位: 

 

1. 因特网,是在线谣言的温床吗

2. 因特网是农民的好帮手

3. 反腐败的重要工具

 

小  结

 

 首先只看中文搜索,作百度和Google.com之间的比较。

 

(1)可以发现二者在过滤重复信息上有不同的表现。Google用了10个页面,才实际上达到30个以上的不同搜索结果。百度只用了7个页面就达到30个以上的不同搜索结果,并且在第3页就已经有了近20个完全不同的搜索结果。其中的原因可能有技术方面的(比如Google爬虫爬的页面可能比较多,尤其是境外的中文网站),但对用户来说,这样的搜索结果所提供的有效信息显然比百度少。特别是搜索结果第5到9页,几乎不能提供什么新的信息。到了第10页,忽然偶然地来了一个小高潮,出现比较多的新信息(但在第5-9页的大量垃圾信息之后,有多少人会看第10页的内容呢?)。而百度则相对好一点,除了第6页外,各个页面中全新内容的碧绿一直都比较稳定,这对于用户黏性来说,是好事。

 

(2)可以发现百度和Google.com对“互联网是”什么的回答非常不同。比较各自的前30条有用结果,只有3条是重复的。第2页之后,二者给出的新答案(不包括重复的信息)就完全不同。对于用户来说,只看百度或者只看Google,似乎都会遗漏大量信息。相比起来,用谷姐搜乐一类合并搜索工具,效果会好很多(只是速度慢些)。

 

其次是英文与中文之间的比较。

 

(1)英文和中文之间的比较,可以首先发现英文的结果是非常多元化的,到了搜索结果第五页,就有了三十多个不同的答案。搜索中文的“互联网是”,哪怕是相对效果比较好的百度,也到了第7页才有三十个结果,并且此后很多页面是重复的。对此可能有两个原因,一是Google英文搜索的针对性和准确性要好很多,二是中文世界确实没有那么多元的资讯。我想应该是二者兼而有之吧。

 

(2)具体分析内容,英文结果也要有趣和广泛得多。最多的内容是人文性质的话题,比如“互联网是由猫咪组成的”等,而中文的则主要集中于政治话题(关于权)、经济话题(关于钱)和偶尔的一两个人文性话题。难道这的确是中文世界的生态吗?[注:这当然一部分是由于英文语法中“The Internet is”的句式相对覆盖面广,但也应注意到,由于“The”的存在,中文中出现“移动互联网是”一类在“互联网”一词前出现限定词的情况,在英文搜索中是不会出现的。所以,英文世界人们对互联网的形容更加多元化的结论,应当是成立的。]

 

更多结论,请寂寞的读者们发挥想像吧。最重要的是,读完了以后……哥,你懂的。

 

One comment

  1. leo

    很有意思。对百度似乎多了一点好感(本人崇洋媚外的情绪比较严重,呵呵)。中国人普遍活得太认真了,不过,唉,谁叫咱爹不亲娘不爱呢?另外,那么多“震精”,似乎有点男性不宜啊

Comments are closed.