刘开国:Google反做弊没有如百度
本文以下:
对百度,CTO刘开国的采访历程便是一个挤牙膏的历程,他永久没有会小题大作,对采访者的成绩,复兴得精练而专注。那位取李彦宏一同创建百度的“手艺新权要”,对搜索系统手艺使用的考虑,正在必然水平上表现了那个新上市公司的贸易标的目的及那个团队的手艺设想力。采访中,刘开国不竭接到要供解启的“做弊网站”的德律风,年夜多是生人材会间接将德律风挨到他那里,或是挨给李彦宏。采访由此而睁开。
反做弊是我们的手艺
《21世纪》:李彦宏挑选搜索系统做为百度的主业,其时是怎样肯定的?
刘开国:2000年之前,中国有很多搜索系统公司,Goyoyo是喷鼻港一个公司做的;科教院有一个网站,借有北年夜天网。其时创建公司时搜索系统曾经许多了。我们时机正在那里?正在其时我战李彦宏的通讯中,他道要做便做最好的。其时已有的搜索系统速率缓,索引小,用户体验很好。我们皆以为做一其中文搜索系统有很年夜远景,以是我便从北年夜出去,跟李彦宏一同创业了。
《21世纪》:如今去看,其时搜刮的中心手艺是甚么?
刘开国:分红好几块,一块是网页抓与,由蜘蛛法式挑选、抓与互联网中的网页,借要连续不竭天更新网页,将过时的网页剔撤除;两是超链阐发战内容阐发;三是针对用户的搜刮效劳:怎样处置海量数据战年夜范围的用户会见?怎样供给不变的效劳?有许多手艺成绩需求处理。
《21世纪》:您们是一帮人正在做?
刘开国:很多多少个组,重面是相干性的评价。哪些网页是用户念要的?前面便有很多多少手艺;好比超链阐发;那里有李彦宏的专利。超链正在Infoseek之前便有成生的手艺,李彦宏正在那女事情时便研讨得很细,但我们出有仅用那套办法,而是按照其时搜索系统齐球的开展做了改良。
《21世纪》:百度正在相干性圆里有甚么特征?
刘开国:有两个根本圆里:超链阐发战内容阐发。我们那帮手艺职员,包罗李彦宏,按照搜索系统其时的手艺开展,做出了一套百度本人的超链阐发体系。别的借得阐发网页内容,好比中文处置便很主要,要了解中文的语法战特定笔墨意义,果为中文取英文借是纷歧样的,只要判定笔墨是甚么意义,才气给用户供给搜刮成果。
《21世纪》:“棍骗搜刮”是甚么意义?您们有甚么共同的手艺去对于它?
刘开国:便是所谓的收集优化,好比SEO之类,链接一些域名,好象链接许多,但实践上是报酬做出去的。借有一些链接,便是专门帮他人做链接,那也是超链阐发。您没有是链接阐发吗?专门针对您。借有一些网站,专门给他人做,相干度也下,我们必需发明哪些是LINKFORM,然后阐发出去。
《21世纪》:那怎样看得出去?有简朴东西吗?
刘开国:我们曾经能够经由过程手艺手腕实时发明那种棍骗大概叫做弊。能否做弊,有一个很简朴的尺度:用户看到的内容战搜索系统看到的内容能否分歧?前一段搜刮“芙蓉姐姐”,出来以后许多是购脚机的,购其他疑息,那便是做弊。我们便阐发,他们是经由过程甚么办法去“棍骗搜刮”。好比LINKFARM,我们靠手艺发明出去,它曾经“堆砌枢纽词”了,我们看出它是做弊的,我便没有要它。那便是为什么厥后反弹那么年夜,有了“反百度同盟”的本果。有“反百度同盟”成员道,您为何屏障我?前一段搜狐网的一个峰会,一个医药网的道我们很好啊,您为何把我给启了?它的“堆砌”是做弊的,假如我们把它铺开,对用户是一种棍骗。
《21世纪》:好比正在百度搜“芙蓉姐姐”,您们把有些“芙蓉姐姐”链接给屏障了,那便不克不及给用户供给更多的成果了?
刘开国:是更精确,好比用户到那里去搜,获得的是实正的“芙蓉姐姐”而没有是脚机铃声。那样做的目标是给用户很好的用户体验。
《21世纪》:正在反做弊手艺里,有甚么能够明白辨认做弊?
刘开国:好比,去回相互链接、堆砌枢纽词等。借有远景色战布景色完整分歧,正在HTML内里,用户看没有睹,能够骗搜索系统,便那样骗用户。
《21世纪》:仅仅布景色也能够用去做弊?
刘开国:布景是乌色的,搜刮瞥见的仅仅是内容,是看没有到布景的。远景取后景一样,机械看没有着,人能看出去,风光也是辨认的果素。此中的笔墨便是有些网站念棍骗的工具。有许多办法做弊,屡见不鲜的。搜刮取做弊网站是永久没有会完毕的战役。
《21世纪》:有无能够“招抚”的做弊网站?
刘开国:没有会的。他们的长处很年夜,骗一面是一面,没有会到那里去做。
《21世纪》:有几那样的网站?
刘开国:天天碰着成千那样的网站。
《21世纪》:他们到那里推客户?
刘开国:纷歧定推客户,他们能够本人做铃声、短疑,SEO会推企业,给钱,我给您排位。
另外一个“仇敌”是Google吗?
《21世纪》:取Google的反做弊比,您们有甚么劣势?
刘开国:道Google的手艺比我们好,我没有认同,他们次要是不敷集合。好比反做弊的,Google中文便做不外我们,那有手艺成绩,借有人力,要晓得做弊习用的脚法,而Google没有晓得。那个形式我们比Google开展得更快,我们更靠近用户。我们中文的了解做得比他们好,好比像分词、切词,中文是一个一个字,放一起,那些字战词是纷歧样的。我做得比Google好。他们出有专门研讨中文。
《21世纪》:您们是用本人的手艺?
刘开国:是的。我们中文分词,那个手艺内里出有英文,中文自己的处置我们曾经到位,借有语法的使用,我们做得很好。语法是主谓宾,怎样用,老中不睬解。
《21世纪》:您们用从前的笔墨辨认手艺吗?
刘开国:对中文我们有一套共同的做法,如今成生的手艺皆没有太合适我们。
《21世纪》:有无用哪个仄台?好比年夜的硬件?
刘开国:那个硬件是我们本人做的。
《21世纪》:是使用硬件?
刘开国:没有是一套。我们间接用本人的工具。好比道辞书、分词、辞汇。那没有是释义的辞书,能够有许多资本。好比我们用群众日报的语料库,我们购置那样的材料。更多的仄台是我们本人的搜索系统。我们有日记,总结新的辞汇。我们对10亿计的网页也能阐发。那是Google中文做没有到的。最少出有散焦。别的从中文用户体验去道,我们也做得比他们好,好比用户体验是甚么、风俗是甚么。好比相干搜刮,正在中文内里,用户内心念的一个工作,好比“硬件”那个词,用户内心念的是硬件下载,但搜刮的是“硬件”那个词,他输进“硬件”,取搜刮没有符。百度会提醒得愈加精密化,究竟是硬件下载借是减稀,齐主动效劳,那样用户会以为很好。相似的事情我们下了许多工夫。其他像拼音检索,错别字改正,我们也能准确提醒。如今有些搜刮正正在抄我们。我以为不克不及崇洋。
注:相干网站建立本领浏览请移步到建站教程频讲。
相关信息
|
|
||||||
|
|
||||||
|
|
||||||
|
|
||||||
|
|