黑客传说
一想到此处,拉里不禁对眼前的这个中国少年肃然起敬了,尽管他看上去那么的年轻,但是拉里还是选择相信他,他相信自己的感觉,眼前的这个男孩身上有种特殊的魅力,让人感到很信任。
“非常高兴能听到你这么说,也非常感谢你的坦白。我想,在具体的商谈之前,还是先让我们向你介绍一下我们的BackRub吧。”拉里不知道许毅到底对他们的BackRub有多了解,所以他决定先按照一贯的程序,首先来向他展示一下他们的心血结晶。
许毅点了点头:“好的,我对BackRub也进行了一番了解,所以你们可以讲得具体一点,不用担心我能否听懂。”
拉里和赛尔吉都知道许毅是一个技术人员,所以他们也不觉得许毅的话里有什么狂妄之处。
首先开始介绍的是赛尔吉,一说到自己熟悉的BackRub,他一改刚才的拘束,变得口若悬河起来:“目前,在搜索引擎领域,已经有了很多非常著名的上市公司,例如yahoo、Infoseek、Inktomi、Excite、AltaVista和Lycos等,并且他们都取得了很大的成功,看上去,搜索引擎好像已经形成了传统商业模式,而且搜索引擎方面的技术好像也达到了非常成熟的地步——这是现在绝大多数业内人士的观点,他们认识在这方面的市场已经饱和,没有多大作为了,可事实真是如此吗?用户真的不关心搜索吗?我们不这么认为……”赛尔吉打算从搜索引擎的前途说开来,分析一下人们在这方面的需求市场。
可是这个时候,他却见到许毅却摆了动手,示意他停下来。赛尔吉的脸一下子变得通红通红,像是一口灌了一瓶烈性伏特加一样,同时他脸上也露出恼怒的神色。他以为,许毅也像其他人一样,鼠目寸光,并不认同自己的看法,额头上的青筋都冒起了。
许毅依然是笑笑:“这并不是我们现在该关心的,我想还是尽快进入主题吧,说说你们的BackRub。”许毅在心中又是好笑,又有些敬佩。来自未来的他自然知道搜索引擎以后的能量到底有多大,要不然他也不会来找他们两个了。要知道。这两个家伙创办的公司在几年之后就成为了几乎能够和微软抗衡的互联网巨头。所以他比任何人都清楚搜索引擎以后的前途,根本就不用赛尔吉来强调,故意觉得有些好笑。他敬佩的是赛尔吉在现在就已经看到了在搜索引擎领域表面上已经饱和的市场实际上才刚刚起步,大家在以后的信息生活中,离开了搜索引擎几乎是寸步难行,搜索引擎将会对社会的发展起到难以估量的作用。
听到许毅的放在,赛尔吉的脸更红了,不过这次并不是恼怒,而是不好意思。自己的话是为了显示他们BackRub的重要性而做铺垫,可毕竟是有些跑题。
拉里干咳了一声掩饰自己的尴尬,接过话头说道:“我来重点讲霁BackRub所采用的算法吧。目前互联网上的那些搜索引擎,对WEB页面的排序,是根据搜索的词组(短语)在页面中的出现次数(occunence),并用页面长度和HTML标签的重要性提示等进行权重修订的,这样的技术简直太粗糙了,一个网站可以简单地用一些优化方法来增加收录量。例如在网页中重复关键字。”说到这儿拉里看了看许毅。
许毅会意地点点头:“嗯,你说得不错,有些人就直接用背景色来将关键字隐藏在网页中以此来增加被收录的几率和数量。”在许毅看来,现在的网站想要提高搜索排名和搜索引擎的收录简直太容易了,他随随便便就可以举出N种方法来欺骗搜索引擎的机器爬虫。
拉里见许毅完全明白了自己的话于是接着说道:“而我们的PageRank算法则和以往的那些算法完全不同,充分考虑到了这些原因,简单说来就是通过其他文档链接到当前的页面的链接数量来决定当前页面的重要性,PageRank计算页面的重要性,对每个“链入”赋以不同的权值,链接提供页面的越重要则此链接入越高。当前页的重要性,是由其他页面的重要性决定的。这样可以有效地抵制被人为加工的页面欺骗搜索引擎的手法……”拉里一口气说了很多术语,而且这些术语还是他们自己规定出来的,所以在讲解的时候,他一直在观察许毅的反应,让他觉得奇怪的是许毅的脸上一直没有露出疑惑的神色,反而是频频点头,一副很懂的样子。刚开始拉进而还相信,可是讲到后面他就开始不高兴了,停下了讲解。
他认为许毅现在根本是不在懂装懂,要知道里面有很多术语是他和赛尔吉创造的,根本就没有公布出去,许毅却一直在点头,这不是在不懂装懂吗?
就在有着技术人员严谨和求实态度的拉里快要忍不住发飙的时候,许毅却帮了一件让他们两个都目瞪口呆的事情。
文心阁制作 更多精彩图书尽在文心阁
电脑访问:wenxin8
文心阁论坛:bbs。wenxin8第三卷 第233章 美国之行(4)
就在有着技术人员严谨和求实态度的拉里快要忍不住发飙的时候,许毅却作了一件让他们两个都目瞪口呆的事情。
只见许毅不知从哪里拿出一张纸来,然后刷刷在白纸上写出了一个公式,拿到拉里面前说道:“是这个样子吧?”
拉里和赛尔吉两人都傻眼了:他怎么知道这个公式?要知道,他们以前在给买主介绍pagerank算法的时候,从来没有向他们透露过,更别说对外公布了。难道他刚刚听了一下讲解就完全明白了?这……这不可能!尤其是,这个公式还体现了他们创造的一个用户模型——随机冲浪用户模型。这完全是他们的独创,也是这个算法的魅力所在。
“你……你怎么会知道?”赛尔吉说话都不利索了。
拉里也是一副难以置信的表情,震惊之后,他紧皱眉头地看着许毅,眼光闪烁,不知道在想些什么。
许毅自然猜到了他们的反应,他仍旧是那幅悠然自得的模样:“我说过,我对你们的BackRub很感兴趣,并且做过针对性的研究,尤其仔细研究了你们对外公布的资料,噢,我是指你们以前用共同的名义发表的一篇论文,根据那篇资料,再结合我自己的研究,所以我能很好地理解拉里的讲解。毕竟,你所使用的名词都是一些易于理解的,不是吗?”
拉里仔细想了想,觉得他这个说法被对方这么轻易地就拿出来了,无论是对这个结果都难以接受。所以震惊过后,拉里考虑到许毅的身份——一个技术高超的黑客——就立刻联想到,许毅是通过非法的手段窃取了自己的研究成果。
许毅见他们仍然没有相信自己,拿出了自己的杀手锏。他面无表情地说道:“实际上这个算法还可以进一步修正。”
“什么?”这次两人同时发出了惊呼。他们简直快要疯了,面前的这个家伙一次次地冲击着他们的心脏,现在他竟然说他们这个已经趋于成熟的算法还可以进一步修正!他们为了这个公式,不知道花费了多少个不眠之夜。精简再精简,直到再也找不到任何一处可以改动的地方。而现在,这个突然冒出来的中国小子,竟然信口开河地对他们的心血指手画脚!想到这里,他们两个都露出了愤怒的神色,同时噌地一下站了起来,打算掉头离去。
“呵呵,”许毅摇了摇头,心道,“这两个小家伙还真沉不住气,看来是在校园这个象牙塔中呆得太久了,单纯得可爱。嘿嘿,反正这个公式的修正算法你们不久之后就能发现,早一点透露给你们也没多大关系。
许毅完全无视他们的愤怒,很平静地拿起手中的笔在纸上的公式的一个参数下面加了一条横线,然后再加上了一个大大的“N”。右手拇指和食指拿着白纸,扬到拉里的眼前晃了晃。意思很明显——修正的算法就这么简单。
拉里的眉头又皱了起来,他沉住气盯着眼前的这个公式,道:“这个‘N’代表什么?”
“互联网上所有网页的数量。”许毅坐了下来,开始悠闲地品尝起面前的咖啡来。
赛吉尔听到许毅的话之后身体很明显地一震,然后他迅速从口袋中掏出一张皱巴巴的餐巾纸,一声不响地拿起桌上的笔开始在上面推算起来。拉里也趴在他的身边看着,随着赛尔吉的进展,他紧皱的眉头渐渐地开始舒展,最后逐渐变为惊讶。
一张餐巾纸很快写完,许毅嘴色露出一丝弧线,干脆从胸口的口袋中拿出一个袖珍小本递给赛尔吉,让他继续推算。赛尔吉没有客气,什么话也没说,继续埋头苦算。
大概十多分钟之后,赛尔吉终于完成了,他由许毅的这个公式往后一直推到了前面,完全证明这个公式是正确的,而且比他们的那个要复杂,但由于这个算法而产生的网页排序效果却要好上很多,更加合理也更加科学。
“这样,所有页面的网页级别就形成了一个概率分布,所有页面的网页级别之和就是……”赛尔吉南说道,“这个算法比我们的这个好太多了!”他和拉里对视了一眼,两人都从对方的眼睛中看出了震惊和赞叹。
“许毅,对不起,请原谅我们刚才的失态。”拉里很绅士地表达了自己的歉意。
“没关系,我想这是很正常的反应,如果是我,我也会那样的。”许毅很理解地说道,“现在,我们可以坐下来好好谈了吗?”
拉里摇了摇头:“不,许毅,我想我们没什么可谈的了。”
“呃……”这次轮到许毅错愕了,“你们……”
“很显然,你对这个算法的研究不比我们要深得多,以你的技术,你完全可以自己编写一个更好的搜索引擎出来。”拉里脸上露出羞愧的神色,他为自己的行为感到脸红,难怪别的公司不买自己的产品了,他郁闷地想。
赛尔吉的脸又红了,他也和拉里想的一样,没想到许毅已经走在了自己的前面,而他们还妄想拿着这个次品来卖给对方,这简直太……
“咳咳……”许毅强忍住想笑的冲动,一张老脸少有的红了红。
“没想到是因为这个原因拒绝了啊。”他恍然地想到,“虽然我也可以凭借这个技术重现你们的辉煌,但这未免太辛苦了点。我这次千里迢迢跑到这里来,目的之一就是为了你们,嘿嘿!”许毅自然不会放过这两个天才一样的人物。刚才他之所以那么做,就是为了等下收服他们打下铺垫。
许毅连忙站了起来,赶紧一把拉住他们两个:“你们先坐下,别急,我们公司已经决定购买你们的BackRub了。我可以明确地这样说。”
“你不会是在开玩笑吧?”赛尔吉吃惊地问道。
“不,当然不会。”许毅将他们两个按回座位,“我刚才说过,我们是通过研究你们的BackRub才受到启发的,是吧?”
拉里和赛尔吉点头。
许毅接着说道:“也就是说,这个算法的首创者还是你们。我们天毅集团是非常尊重个人知识产权的。所以虽然我们已经知道了这项技术的关键算法,但是还是决定收购你们的BackRub。强调一下,我不是在开玩笑。”
经过一番“大义凛然”的演讲,许毅终于说服了拉里和赛尔吉两人。
很快,拉里和赛尔吉两人就领着许毅去宿舍看他们的BackRub搜索引擎原型。
由于他们的搜索引擎需要大量的计算力,而拉里和赛尔吉这个时候还是两个穷小子。根本没有钱去买新的、运算功能强大的计算机,所以他们宿舍的这个服务器完全是他们两个用二手低端的计算机自己组装起来的,而且由于他们两个在硬件方面的超高造诣,他们愣是用这些少之又少,而且非常垃圾的机器组成了一台计算能力相当大的服务器。
许毅来到拉里的宿舍之后的第一感觉是是一个字——乱!
一个狭小的空间里面堆满了东西,各种装计算机零件用的箱子,堆满了整个房间的周围,中间并排摆放着三台计算机。其中以中间那台最为宠大。密密麻麻的布线相互缠绕在一起,让人看了都眼花缭乱,那是一台SunUltraII电脑,据赛尔吉介绍,它拥有两个200MHz的处理器和256M的内存,这在当时算是非常高的配置了,很明显这台就是BackRub的主机,此刻它正在嗡嗡嗡地全速运转着。在显示器的后面,有一个顶部花花绿绿的箱子,看上去这个东西很滑稽和古怪,但是它的来头很大——这是拉里和赛尔吉自己手工制造的10个9G的SCSI磁盘阵列,BackRub目前所有的数据都是在这个看起来很不起眼的小箱子里面。
桌子后面那个顶部花花绿绿的箱子,看起来不起眼
页面: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176