第818章 搜索習慣
第818章 搜索習慣
go搜索提供的這個官方標記,直接切中了商務人士和普通網民對信息真實性的需求。
只要是存在於網際網路上的公開網頁,似乎沒有go搜索查不到的內容。
sto9.c🚀om最新最快的章節更新
加州伯克利分校的計算機實驗室里,埃里克正在研究go搜索的排序邏輯。
他在搜索框裡輸入了幾個C語言相關的生僻詞彙,看著返回的結果列表。
他們的爬蟲程序抓取範圍非常廣。
埃里克對身後的室友陳述著觀察結果。
只要是公開發布在網際網路上的網頁,幾乎都能被收錄。
而且排序機制很清晰。
室友湊近屏幕看了一會兒。
目前的檢索匹配機制還無法應對比較複雜的自然語言長句。
室友指出其中的技術局限。
如果你輸入一個完整的長疑問句,系統只會把句子拆解成獨立的詞彙,然後去匹配包含這些單詞的網頁,結果會有一定的偏差。
但這已經足夠了。
埃里克切換了幾個不同的搜索詞。
對於現階段的網民來說,精確的單詞相關匹配才是最常用的需求。
只要關鍵詞輸入準確,相關程度最高的網頁就會排在最前面。
幾乎沒有疏漏。
更重要的是他們對大企業和重要網站的處理方式。
埃里克輸入了微軟的英文名稱。
排在第一的是微軟的官方網站,帶有顯眼的官方標記和所屬公司全名。
排在後面的才是各種技術論壇里討論微軟系統漏洞的新聞和帖子。
這避免了近似信息的干擾。
埃里克指著那個官方標記。
技術上實現這種權重傾斜不難,難的是如何確認這個網站背後的實體身份。
紅木城,矽谷在線總部。
弗蘭克坐在會議室的主位上。
長桌兩側坐著搜索業務部的負責人和審核團隊的主管。
投影幕布上顯示著搜索請求量的增長曲線。
伴隨門戶網站日均一億次以上的點擊量,搜索框的使用頻次正在呈指數級上升。
搜索業務負責人做著常規匯報。
用戶已經習慣了在找不到特定信息時,直接使用我們的搜索功能。
這是目前市面上響應速度最快、收錄最全的搜尋引擎。
弗蘭克看著數據報表,微微點頭。
審核團隊的主管隨後發言,語氣中帶著明顯的疲憊。
馬歇爾先生,人工審核部門的壓力已經達到了極限。
主管翻開手裡的記錄冊。
為了確保搜索結果中官方標記的準確性,我們的審核員每天需要處理上千份企業和機構的資質證明。
他們要核對工商註冊信息,打電話確認官方域名的歸屬權,甚至要甄別那些試圖通過提供虛假材料來獲取官方標記的山寨網站。
在算法還無法完全自主辨別網頁真實權威性的時代,矽谷在線採用了人工介入的方式。
這部分工作消耗了大量的人力成本。
主管提出實際困難。
財務部那邊對我們不斷增加的招聘預算提出了疑問。
有人建議放寬審核標準,或者乾脆取消官方標記,完全交由機器算法去進行詞頻排序。
會議室里安靜下來。
負責技術的工程師們也看向弗蘭克。
維持這樣一支龐大的人工審核團隊,在以技術驅動為主的矽谷公司內部確實顯得有些沉重。
弗蘭克放下手裡的報表,雙手交叉放在桌面上。
「預算我會去和財務部溝通。」弗蘭克看著審核主管,給出了明確的答覆。
「審核團隊不僅不能裁撤,還要繼續擴招。你們需要多少人,就招多少人。
主管鬆了一口氣。
弗蘭克站起身,走到會議室的白板前。
「網際網路上的信息每天都在以爆炸式的速度增長。」
弗蘭克拿著馬克筆。
「以後網上的東西會越來越多,真假難辨。我們的webdir靠人工分類目錄來整理網際網路,但隨著網頁數量的增加,人工分類註定會跟不上速度。我們的爬蟲技術解決了收錄廣度和速度的問題,但廣度帶來的副作用就是信息過載和虛假信息的泛濫。」
他轉過身,看著會議室里的眾人。
「機器算法可以匹配單詞,可以計算詞頻,但目前還無法判斷一個網站背後的公司是否合法註冊,是否是網民真正想找的那個實體。這個時候,我們的人工標記就是最後一道防線。」
弗蘭克將馬克筆放在白板槽里。
「這部分工作雖然需要人工標記,但是這樣的付出是值得的。因為我們在建立用戶對go搜索的信任。當網民發現,只要通過我們查到的大企業主頁和重要網站,都有明確的官方標記和公司全名,他們就不需要再去擔心被近似信息干擾。這種體驗是無可替代的。」
時間進入1996年的盛夏。
隨著搜索結果的日益精準和官方標記覆蓋面的不斷擴大,go搜索在網民心中的權威性開始潛移默化地提升。
它不再僅僅是go.com門戶網站上的一個附屬功能,而是逐漸成為了網民探索虛擬世界的基礎工具。
那些習慣了在論壇里閒聊、在新聞版塊看資訊的用戶,在遇到任何工作或生活上的疑問時,第一反應不再是去翻閱實體資料或者求助他人,而是將目光投向屏幕頂端那個乾淨的輸入框。
華爾街的分析師們在撰寫研報時,開始將是否被go搜索官方標記作為評估一家初創網際網路公司正規程度的非正式參考標準。
傳統企業的老闆們也開始注意到這個變化。
他們開始主動派人聯繫矽谷在線的審核部門,提交繁瑣的證明材料,只為了在搜索結果中爭取到那個代表權威的標記。
在這個信息開始泛濫的時代,矽谷在線用一套機器算法結合人工審核的嚴謹機制,在無序的網際網路中建立起了一套有序的信任體系。
網民的習慣一旦養成,便很難被改變。
矽谷在線通過這個搜索框,將自己更深地嵌入了整個網際網路的基礎設施之中。
1996年6月。
太平洋東岸的美國,華爾街的交易員和矽谷的工程師們正圍著矽谷在線的股票代碼和流量數據進行著一場資本與技術的狂歡。
而在太平洋西岸的日本,另一場屬於電子遊戲玩家的暑期狂歡也已經悄然開啟。
(還有更新耶)