在早期,搜索引擎最常見的做法就是直接對網站進行整個抓取,并且剛開始的時候一般只抓取網頁的標題,這就像是將圖書館中所有書籍的名字都登記在自己的本地數據庫中,別人要想查找相關內容,使用關鍵字在這個數據庫中進行匹配,如果發現標題中含有這個關鍵字,那么就可以認為這本“書”就是用戶所需要找的內容,便將這本“書”所在的“書架”告訴用戶,讓他去訪問。
書即網站,書所在書架則就是網站的地址鏈接。
后來,搜索引擎規模化,公司化之后,財大氣粗的公司擁有大量的資金,可以購置大量的服務器和硬盤,于是便開始了將網站上的所有網頁都給抓取下來,也就是說,用戶不但可以進行標題搜索,還可以進行文搜索。這無疑是一種進步,因為標題通常情況下所包含的信息只有那么多,不可能涵蓋所有內容。
但是,這是一個信息大爆炸的時代,互聯網就是一個知識的海洋,網站成千上萬,一個關鍵詞搜索出來的結果往往也有成千上萬,如果在這些結果中找到自己所需要的信息,又成為了一個難題。
這是所有搜索引擎都在研究的問題,歸根結底,就是將網頁進行排序,越好的網頁應該越排前列,這樣用戶就不需要花費多少時間就能找到自己所需要的信息。
說起來容易做起來卻是相當困難,各個搜索引擎公司都有自己的排序算法,這些都是商業機密,不對外公開。而用戶都是非常現實的,如果的產品好,的確可以帶來便利,那么他就會使用,并且還會推薦別人使用。
林鴻所發現的這個bck乳p就是看到別人推薦才發現的,并且一用之下,發現它的算法的確很強,通常情況下都能很快找到自己所要找的信息。
他經過研究發現,這個搜索引擎使用了一種名為pagerank的算法。
實際上,林鴻也不知道到底是不是叫這個名稱,他之所以稱之為pagerank,是因為這個名詞多次出現在源代碼中。
每一個網站都對應著一個pagerank值,服務器上專門有一個數據庫,用來保存各個網站的pagerank值。
林鴻將整個源代碼通讀了一遍,他發現pagerank分為十一個等級,從0級到10級,級別越高就代表著質量越好,那么該網站的排名也就越高。
至于如何計算網站的pr值也非常巧妙,則是根據鏈接的數量而進行計算的。
簡單說來就是統計所有蜘蛛所發現的那些網站上的鏈接,這些網站中通常都含有指向其他網站的鏈接,將其看成是一種投票,誰有一個鏈接,就得一分,誰的鏈接最多,誰的分數就越高,再將這個分數進行轉換,便有了pr值,。
這個算法的核心思想是,如果的網站質量好,那么別人就會喜歡給做鏈接,向別人推薦。
林鴻猜測,這種算法思想,很可能是來自科學界的文獻引用計算原則。
科學家寫文獻和論文的時候,通常需要查閱大量的資料,并且一般都會在自己的論文的末尾將查閱到的資料進行引用。一般認為,引用越多的文獻,質量便越高。
這個back乳b的網站正是使用這種方式來對網頁進行評級,從而讓用戶獲得了比較好的體驗。
林鴻在這臺服務器中,看到了一份商業計劃書,這個網站的主任larrypage似乎打算將這個網站進行商業化,正打算尋找天使投資人。
看到這里,林鴻有些心動了。
他對這個項目非常看好,雖然目前僅僅只是一個雛形,還有很多不足,不過這并沒有關系,還可以繼續進行完善。
這個項目很符合他一直以來都在想的一個問題,那就是在信息大爆炸時代,如何對這些信息進行加工處理,并且從中發現商業價值。
而很顯然,這個back乳b正好非常符合。
林鴻思考良久,最終決定投資這個項目。
林鴻調出比特信使,給菲麗絲發了幾段信息,讓她關注一下斯坦福的這個項目,如果他們尋求投資,則以他的名義進行接觸。
發完這些消息之后,他便給菲麗絲發了一條短信,讓她有時間的話就上線查收一下。
沒想到剛短信剛發完,對方就立刻回信了,說她馬上上線,讓他不要離開。
很快,比特信使上,菲麗絲便發來了消息。
其實林鴻也可以使用電子郵件和她進行通信,不過他已經習慣了使用比特信使,電子郵件如果需要進行加密的話,還需要使用諸如pgp這樣的加密軟件,而菲麗絲卻對這些軟件沒什么使用天賦,并且也不愿意去學習。
于是,涉及到機密的信息,他們還是傾向于使用比特信使。
菲麗絲:我來了,還在吧?
林鴻:嗯,在的。
菲麗絲:搜索引擎項目?怎么發現的這個項目?
林鴻:他們的網站已經上線了,非常不錯,我很看好他們的發展。
菲麗絲:我先看一下。
菲麗絲按照林鴻所給出的網站,去體驗了一下。
菲麗絲:的確好像不錯的樣子。可是,會不會太小了點?
菲麗絲的意思是,他們投資的項目,基本上涉及的資金都比較大,而這卻是一個個人網站,投資規模一般來說大不到哪里去,就算有回報也基本大不到哪里去。
林鴻:創始人是個人才,他們正打算尋求天使投資,將這個項目商業化,組建搜索引擎公司,如果不出意外的話,我想應該能夠發展得不錯,和硅谷的其他互聯網公司一樣,如果能上市的話,回報率應該很可觀。
林鴻有一點沒說,那就是如果投資之后,他將考慮參與到其中去,助他們一臂之力。之所以想投資這個項目,一方面是看好這個項目的潛力,另外一方面則是想通過這個途徑進入西方it業界,順便尋找一些合適的人才。
在這個領域,國外發展走在了國內的前列,無論是教育還是基礎設施的建設,中國都落后至少十年以上。國內這方面的人才,基本上還需要一段時間的培養,而現成的世界級的人才還是得從西方世界去尋找,林鴻打算將這個項目作為切入點,逐漸擴大it領域的投資,吸引世界級的人才為自己所用。
菲麗絲:這個消息是從哪里得來的?
林鴻:特殊渠道。不過,可別說我已經知道了這個消息,我想他們很快就會去硅谷或者其他地方見投資人,到時候再出現就行了,我的具體信息,暫時不要透露。
菲麗絲:了解了。我會找專業人士進行評估。另外問一句,打算占多少股份?
林鴻:自然是越多越好,當然,不能超過創始人的比例。
林鴻可不想越俎代庖,主要的原因是他沒時間。
對方的pagerank算法給了他很大啟發,只要他愿意,他可以做出比對方更為優秀的產品,可是他畢竟只有一個人,要做的事情太多了,不可能所有事情都親力親為。
解決方法之一就是找優秀的人才合作,自己提供資金或者技術,然后讓他們獨自去發展。
菲麗絲:我知道了。
他們倆再溝通了一會兒,菲麗絲便很快下線了。中國此刻是白天,而她那邊卻是午夜,她還得繼續補充睡眠。
她對林鴻的這個投資建議實際上并不怎么看好,在她看來,與其投資這些實業,不如直接投資金融產品,利潤大,回報周期短。
不過,這一次的投資后來所獲得的回報,到后來卻是讓她大吃一驚,最終成為了她所有投資項目中最為成功的一次投資。
由于天氣炎熱,吳東和張達都在睡午睡,而李奇卻是沒有睡意,閑不住跑到其他寢室串門去了。
一會兒后,李奇回來,見到林鴻正在使用電腦,便走到他身邊,對他說道:“老大,剛剛我聽到一個消息,說我們學校有一個bbs,叫做水木bbs。”
“哦?”這個消息讓林鴻有些微微驚訝,不過很快他也便釋然了,水木大學畢竟是國內的一流大學,在這一塊走在其他大學前面也是可以理解的。并且,水木大學的校園網在八十年代就已經組建起來,bbs的出現肯定是必然的。
“知道水木bbs的訪問網址么?”
“這個…我去再去問一下。”
說著,李奇便跑了回去,很快又回來了,他手中拿著一張紙條,上面抄著一個ip地址166.111.1.11。
“老大,就是這個。”李奇把紙條遞給林鴻。
由于是內部網絡,屬于局域網網站,不用聯通互聯網就能直接登錄。
林鴻啟動te客戶端,直接連了上去。
一個黑底白字的界面很快就出現了,緊接著客戶端中開始刷出歡迎信息。
“連上去了!”李奇有些興奮的喊了一聲。
他的聲音有點大,頓時將正在午睡的吳東和張達都給吵醒了。
全集,全文免費閱讀,電子書,請記住 地址: