深圳市博士通科技有限公司

360搜索真相究竟如何?

2012/10/24 10:11:09   阅读:2979    发布者:2979
8月31日,奇虎CEO周鸿祎召开媒体专访,沟通了他对360搜索的布局和设想,并对三百大战引发的关于“违反robots协议违规抓取百度内容” 等问题做出回应。

  然而在专访文章中,周鸿祎对五个关系到360搜索正当性的重要问题,却采取了混淆视听或直接回避的态度。本文希望再次提出这些问题与周鸿祎商榷,并希望周总能够正面回答。

  一、360搜索是独立的搜索引擎?

  周鸿祎专访时强调,360搜索和百度半点关系都没有,完全是创新的产物。此前,在360搜索的官方声明中,更声称“360搜索引擎是七年磨一剑,360搜索是用自有先进搜索技术打造的独立搜索引擎”。

  要做独立的搜索引擎,最基础的功夫就是要让爬虫去爬全网数据。而360的爬虫是什么时候才出现的?2012年8月27日,360搜索官方微博才正式推出“360蜘蛛”,并提示站长设置允许抓取的robots.txt协议。360蜘蛛在短短半个月内索引的网页量,就足够支撑360搜索满足用户需求,成为“第二大搜索引擎”吗?360的蜘蛛难道都是传说中的“蜘蛛侠”?

  可能的解释,要么是360蜘蛛以伪装的身份默默爬了七年网页,从没知会过站长;要么就是从其他搜索引擎那里“拿”了一些数据。

  笔者以“site”命令把搜索范围限定在特定站点中时,还发现许多网站根本没有被360搜索蜘蛛爬过,包括新浪网、58同城等热门大站。然而搜索相关关键词时,360搜索却能展示来自这些网站的搜索结果快照。

  有站长直接爆料称:“我在服务器上查看蜘蛛日志,发现了很大的问题。我站在7月份上线到8月16号360spider从来没有爬行,到8月17号开始出现360蜘蛛。但在360搜索中却出现8月9号的快照,那我9号的快照你从哪来的?”

  搜狗的报告显示,360搜索结果第一条比百度的相似度高达38%,远高于正常比例;此外明眼人都能看出来360搜索的UI与百度极为相似。如果一个搜索引擎,360搜索结果大量套用其他搜索、他的页面设计大量套用其他搜索,那它还称得上“独立搜索引擎”吗?

  二问:无视robots协议,谁是不正当竞争?

  按照国际惯例,搜索引擎会自觉按照每个网站的“robots协议”给予自己的权限来进行抓取,包括百度、谷歌、雅虎在内的搜索引擎都会遵循这一协议。

  然而,据了解,百度网站的Robots协议中并未授权360搜索爬虫抓取,但是360搜索却无视这种设置,擅自实施了抓取行为。很多内容源网站禁止搜索引擎抓取的网页中大多涉及存放在服务器上的后台数据库、用户稳私、密码等信息。这意味着,360无视内容源网站robots.txt协议中的设定,将导致存放在服务器上的不该被搜索到的隐私信息被搜索到,甚至直接在搜索结果中展示出来。

  对这一行为,360简单将其解释为“百度禁止360爬虫,是滥用Robots协议的恶意竞争行为”,实在有些避重就轻。

  就像资深互联网观察家洪波所说,“robots协议赋予网站禁止任何搜索爬虫的权利,这跟不正当竞争毫无关系,做搜索就要遵守搜索行业公认的游戏规则,无视规则,肆意违反规则才是真正的不正当竞争。”

  知名意见领袖炳叔在他的一篇博文中发问,“企业,特别是掌握大数据的搜索企业,居然连这样一种简单的robot道德契约都不愿意遵守?那谁还敢、谁还愿意,尝试另一个国家开发的全球化应用呢?”

  这些问题,周总该如何解答?

  三问:窃取用户隐私的搜索,是为了谁的体验?

  周鸿祎一直不断强调360搜索要给用户更好的搜索体验。但他其实回避了一个全国网友更关心的问题,就是360是不是窃取用户隐私?窃取哪些隐私?

  8月31日,百度工程师赵明华发布了一条名为【鬼节捉鬼】的微博。该微博指出,百度工程师通过一个设饵钓鱼的实验,让360浏览器抓取用户隐私的秘密暴露无遗。百度工程师制作了一个保存在服务器个人文件夹下,没有任何外链的简单网页,由于搜索引擎爬虫只能通过链接爬行网页,因此这个网页是完全封闭的。随后,百度工程师用360浏览器打开了这个网页。

  大约2小时之后,工程师在360搜索中输入相关关键词后,结果这个网页赫然出现在搜索结果第一行,并可以直接点击进入浏览网页内容。再换百度、谷歌、搜狗、搜搜等其他浏览器搜索相同内容,却仍然无法返回相应网页。

  对于这个问题,周总将其定性为竞争对手的恶意攻击。然而,全国的网友并不这么看,这条微博短短两天转发量已经超过25000次。也有网友证实确实有 360浏览器泄漏隐私的案例存在:网友Flyh4t就在微博中写道,“公司内部网站(需要vpn+动态口令才能访问)也被360抓了,这是怎么回事?”对此,鹰眼安全文化网发起者、中国计算机取证专家委员会成员黑客老鹰微博回复道,“这应该是公司内部有人用360浏览器。”

  此前,有360离职员工爆料称,360安全卫士每十分钟联一次网,每次上传6KB左右数据,一天上传约1MB数据(不包含下载数据),一年约 350MB数据。风雨无阻,永不间断。最近,在水木论坛上,也有网友爆料,使用360杀毒软件上传流量累计达到21G,相当把整整一个硬盘拷给了360。

  在这里,我想问周总,360窃取了哪些隐私,用来做什么?周总是否能够给出一个明确的回复?

  四问:混淆“竞价”概念,你到底懂不懂搜索?

  除了这次专访外,周鸿祎也不止在一个场合提过,360搜索要学习Google模式,不做竞价排名,会区分自然结果和推广结果,杜绝虚假信息。

  直接将“竞价模式”等同于“搜索结果混排”,不知道周总是真的不懂搜索引擎,还是试图偷换概念,颠倒是非,试图欺骗不专业的读者?

  所谓竞价,是一种全球通用的商业模式。这一模式源自宏观经济学理论,包括纳什Nash、维克瑞Vickrey、迈尔森Myerson等多位诺贝尔经济学奖大师都在这一领域进行研究。

  在搜索领域,Google的Adwords(Google竞价广告)采用的同样是标准的竞价模式,客户可以选择触发广告的关键字,并指定愿意为每次点击支付的最高金额。百度推广,Yahoo的Panama,淘宝的直通车也都采用了这种模式。今年6月, Facebook让广告商对广告位置进行实时竞价。放眼传统领域,平媒营销、电视广告、文物拍卖……竞价模式的例子更是比比皆是。

  而实际上,360的竞价平台,也早已经悄悄上线——几天前有媒体报道,360新上线的点睛营销平台(e.360.cn)和360效果联盟(union.360.cn)正在积极招商,而在360点睛营销平台页面上,“智能竞价机制”的概念更是赫然在目。

  对此,周总又将做何种解释?

  五问:打着垄断大旗谋私利,360要闹哪样?

  最近两周,周鸿祎最常挂在嘴边的,是“垄断”这个词。

  然而,比起百度在搜索市场上的高份额,在资深互联网观察家洪波看来,奇虎360或许才是真正的垄断者,“拿百度市场份额作为垄断的证据,而自己做搜索就成了中国网民大救星。不过他忘了一件事,百度搜索不具有排他性,用户可以自由地在百度、Google、搜狗和搜搜之间切换。但据360自己披露的数据,360杀毒软件占中国安全软件83.65%的市场份额,而这个产品是排他的。”

  据公开数据显示,目前360安全卫士用户达 3.5亿,360浏览器用户为2.3亿,360杀毒软件用户为2亿,360手机安全卫士用户为 1.2亿。和网页服务相比,客户端用户的选择成本更高,可以说是排他的。事实上,360安全软件不仅存在排他性的垄断性嫌疑,很多用户也存在“被安装、被修改、被屏蔽、被卸载、被搜索”,这种在垄断形势下,用户被强迫使用某些功能给用户造成的伤害比垄断本身更加严重。

  那么,是否垄断,周总能否给出一个明确的回复?

  我想,如果在接下来的一段时间里,360对这些问题的解答仍然苍白无力的话。那么,一个有垄断优势的搜索引擎,和一个不正当竞争的搜索引擎;一个有商业广告的搜索引擎,和一个窃取用户隐私的搜索引擎。两者之间,用户会选择谁,应该已经无需争辩。