《In The Plex》Google 内部趣闻挖掘(三)

本文共被喵星人侦察过4,330次。。。

继续由我为大家筛选出Steven Levy讲述Google公司内幕的《In The Plex》一书里有趣的故事和内幕(第一篇第二篇见此):

  • 梅姐在印度班加罗尔Google总部给那里的本地工程师演示未来产品时,有人问:“现在我们知道产品路线图了,那赢利路线图呢?” “这不是我们思考的方式,我们关注用户,只要他们高兴了,我们就会有收入。”
  • Larry Page在为使用链接对网页进行排序的算法进行命名的时候耍了个小聪明,他称之为PageRank,导致很多人都以为PageRank中的Page指的是Web Page(网页)的意思,而非Larry Page的姓
  • 在最初Larry Page设计的系统里,bug超多,因为他用了Java。后来Page找到斯坦福里的一位朋友Hassan来改进,Hassan表示自己尝试了无数次依然无法修复Java本身的那些bug,最终决定不能再浪费时间了,干脆用自己更擅长的Python重写程序得了,Python更适合基于网页的项目,尤其是作为蜘蛛爬网页内容上
  • Google在二位创始人还在斯坦福的事情最初叫做BackRub
  • Larry Page最初设计的系统只让爬虫索引网页的标题,因为要索引网页里的内容更复杂,在索引了1500万个网页标题之后他们的测试结果就已经很有说服力了,每个进行测试的人都体验到了强大的数据索引能力
  • 不怎么会写程序的Sergey Brin设计了系统最初的算法,他用飞机航线做比喻。中心城市之所以突出的原因在于所有的航线都始于这里又终结于这里,从中心城市获得更多航线的城市就越重要。这跟网页是一个道理,链接你的网页越多,说明你越重要
  • 链接文字也很重要,如果一个网页将Bill Clinton链接到白宫的网页,那么Bill Clinton就是链接文字,在BackRub搜索Bill Clinton的第一个搜索结果就是白宫的网站,因为很多网站都将Bill Clinton的名字链接到白宫的总统介绍页面。而当时的其它搜索引擎都做不到这一点,即便白宫的网页里标出了Bill Clinton,他们还是找不到白宫的网页,而搜索Bill Clinton的第一个结果是一个“Bill Clinton每日一乐”的笑话网站。
  • 当时的BackRub只能以斯坦福10号楼最大的带宽(10Mb/s)来抓取网页,而整个斯坦福使用R3网络最高有45Mb/s的网速。BackRub团队修改了楼里的交换机配置,这样他们就可以用满整个T3网络了,而用满速抓取网页的只是一台放在宿舍里的电脑。
  • 当时有人通过服务器的记录发现www.stanford.edu不停的在访问他的网站(其实是BackRub的蜘蛛),有个来自Wyoming的女人联系了Larry Page要求他们停止这种行为,结果蜘蛛还是不停的在抓他们的网页,于是这个女人直接联系了Page的导师说斯坦福的电脑在搞他们,导师想解释这是蜘蛛,切通过robots.txt即可防止被蜘蛛干扰,但这女的根本听不懂。最后Larry Page很不情愿的建立了一个黑名单,不让蜘蛛访问那女的了
  • Brin和Page二人也在不断尝试关键字,一旦发现排序不对的结果就去查查算法哪里有问题,直到完善。Page曾经尝试university(大学)这个关键字,密歇根居然比斯坦福排名还高,这让认为斯坦福应该最高的哥俩很郁闷。“难道是算法有问题?”,检查一番后哥俩不得不承认密歇根大学在网上内容更丰富,这才是斯坦福落后的原因
  • 哥俩去Excite.com网站的CEO George Bell那里演示自己的成果。首先测试的是Internet这个关键字,在Excite.com网站搜索得到的第一个结果是个中文网站,因为错误的编码使得一串中文文字组成了internet这几个单词,囧。然后在BackRub输入internet,头两个结果都是告诉你如何使用浏览器的。Bell实验室相当沮丧──因为斯坦福搞出来的东西太棒了,如果Excite换用他们的搜索引擎瞬间让用户得到想要的结果,用户就会迅速离开,而Excite的广告赢利模式就是让用户留在自己的网页里,粘着率是当时统计网站的方式,换用BackRub的技术反到不行了。Bell告诉他们Excite只要比其它搜索引擎好80%就够了,当然这哥俩完全不明白Bell是什么意思
  • 1997年9月,哥俩想把BackRub改成更适合商业的名字,首先想到的是The Whatbox,直到他们发现这个词很像wetbox才放弃了。后来Page的舍友建议他们叫googol,表示1后面有100个零,这个词来源于googolplex,表示超级无敌大的数字。Brin在数年后解释说这个名字正代表了他们要做的事情,因为他们要索引成千上万的网页、图片和文档。之后Page故意错拼这个词改成Google,因为当时googol域名已经被注册,Page认为Google更容易拼写和记忆。
  • I’m Feeling lucky这个按钮的初衷是想代替域名导航站,Page在2002年曾经说过他们希望人们别再去猜某个网址会是什么网站,而说“去Google吧”。
  • Brin用GIMP程序设计了一个Google的主页,他问每个人感觉如何,所有人都说不好。但Page和Brin却觉得无所谓,他们认为放的东西越多打开速度越慢,特别是Page相信速度是取悦用户的关键。后来Page发现很多人都喜欢上了这个禅宗似的大量留白的网页,但其实当时他们这么做的另外一个原因是没有管理员来做设计,他们不得不自己动手。
  • 1998年Larry和Sergey的朋友们都在使用Google,甚至每天处理的搜索请求超过了一万次,占用了一半的斯坦福网络带宽,但当时Google的数据中心还是Page的宿舍,堆满了利用各种厂商的各种零件DIY出来的电脑机架,甚至他们用乐高拼了一个机柜
  • Larry Page突然意识到多年来要改变世界的梦想就要实现了,他说:“如果公司失败了,那是很糟糕,但重要的是至少我们尝试过了。”

如果我还有时间看书,会继续在每周归纳出一些有趣的故事,下周见~~

 

by 谷奥