第88章 了解了一點點
第84章 了解了一點點
「天網課題組最早是95重點科研項目,最初由陳葆珏教授負責,開發出最早的天網;目前新的課題組剛成立,也確立了新項目。」
李曉明教授簡單地給餘江介紹了課題組情況,頓了頓道:「你有自己的目標,這當然很好,但越是困難的目標,就越是不能一蹴而就。」
餘江嗯了一聲。
「所以有沒有興趣來天網實驗室?」
獲取最新章節更新,請訪問sto9🌼.com
說完後,李曉明教授便一臉溫和地看著餘江。
餘江的名字,從去年填報計算機科學系之後,就放在了他的案前。
高考出分後,招辦表示該生目標明確、意志堅定,數學和計算機水準均達國際頂賽金牌水平,值得重點培養,他的名字因此被全系熟知。。
但全系的老師卻都沒有「管他」。
都在看他自己到底想往什麼方向走,要怎麼走。
而隨著一學期過去,他卻並沒有任何動作。
反而只是在期末考試中坐實了他的「考神」之名————
李曉明覺得,應該干預一下了。
這麼好的腦袋,如果只用在考試上,太浪費了!
然而,餘江卻沒有第一時間回答他,反而陷入了思考。
李曉明微微驚訝起來。
難道這傢伙真是鐵了心要現在就去弄他那什麼神經網絡?
這時餘江突然抬頭。
「好的,李老師。」
李曉明好奇道:「你剛才想什麼呢?」
「我在想這種搜索工具的未來。」
——
「哦?你說說看。」李曉明看了一眼手錶,笑道:「我還以為你在想技術問題。」
餘江輕輕咳了咳。
他確實是在想技術問題。
——這種純學術攻堅的東西,一開始還可以「突破空白」、「達到領先」,繼而培養人才。
但畢竟是課題項目,完全無法和巨頭對抗,將會不可避免地面臨經費欠缺、
人員流動、無法商業化等難題。
最後的下場要麼是裱糊一通繼續要經費;要麼是項目徹底關停。
「搜索工具本質上是對已有信息的整理和調取,當人工智慧理解和掌握海量的信息後,它應該就會逐漸消亡了。」
聽到餘江直接聯繫到人工智慧,李曉明笑了起來。
他想到了此人在招辦人員面前的話。
一再冷的板凳也要有人坐,他們不坐我坐!
「很有想法,但人工智慧怎麼掌握海量的信息呢?」李曉明饒有興趣地問道:「純基於文檔符號訓練還是高速存儲?」
餘江搖頭:「純文檔符號不行的,去年Bengio教授在NIPS上提出了用低維稠密向量表示單詞含義的概念,這意味著文本可以進行向量化,從而化解維度災難,當然後期工作還是有很多,但起碼有個基礎了。
7
李曉明頓時驚訝起來。
他對神經網絡涉足不多,但光是聽到餘江對神經網絡前沿這麼熟悉,他起碼能確定這小伙子不是空談。
當下他沉吟了幾秒道:「行,那你就多想想怎麼把課題組和你的想法結合起來,或者從工程中干起—很多靈感都是在實幹中湧現出來的。」
餘江點頭。
「還有點時間,我帶你到實驗室熟悉一下。」
目送李曉明出門,餘江看向那位留著齊耳短髮、額頭有幾顆痘痘的研二師姐。
師姐也瞪大眼睛看著他,就仿佛好奇的小貓看到了玩具。
就在餘江想著怎麼開口的時候,突然看到師姐沖他眨了眨眼。
「余神好,終於見到活人了。
「師姐好————」
「哈哈哈哈!」喻林笑著從椅子上起身,她身材嬌小,也就一米六不到,看起來跟個小男孩差不多。
「來來來,我給你介紹一下咱們組現在的情況。」
「大BOSS呢,就是李教授,然後王建勇老師負責爬蟲,閆宏飛閆哥負責分布式運算、徐飛負責FTP、彭波負責模塊開發、我負責字典。」喻林口齒伶俐,連珠炮一般就把目前整個天網課題組的情況介紹了個遍。
餘江吃了一驚:「才這麼點人啊?」
「之前人挺多,去年有幾個師兄沒畢業就走了。」喻林笑了笑:「他們一走,咱們這邊網頁搜索的底層就吃力了,於是李老師就新開了課題,重點走FTP搜索。」
「是去百度了?」
「對的。」
別的人他不熟悉,但百度的雷鳴他還是知道的,此人在天網就是核心,進了百度也是技術大佬之一。
聽著喻林的語氣似乎並沒有什麼,餘江也就點了點頭。
畢竟天網是學術項目,這裡的每個人,都只是把它用來當「練手」的工具,然後等畢業就直接進相關行業—你總不能把未來的東家當對手吧?
在喻林身旁的「公用電腦」坐下,餘江剛一按電源,就聽到呼啦啦的風扇直轉,緊接著就是唰唰唰的硬碟聲,折騰了一分多鐘,才看到win2000界面。
喻林過來輸入密碼後,餘江又等了一會才敢操作滑鼠。
靠!賽揚566!
他打開網頁看了一眼17173,發現傳奇的新聞一個接著一個,幾乎占據了整版————
截至目前,傳奇的在線人數已經突破十五萬。
關掉瀏覽器,餘江站起身來,開始溜達。
心中只想著那幾位老哥快點從機房出來,見個面趕緊走人。
旁邊的喻林別看性子活躍,但真是靜若處子,此時正盯著顯示器一眨也不眨地不斷敲著鍵盤。
餘江站到她身後。
只見她正在翻看用戶搜索日誌,統計新詞。
「學姐是在維護字典?」
「嗯呢。」
「天網現在用的是正向最大搜索法嗎?」
「嗯呢。」
「沒有雙向匹配?」
「嗯呢。嗯?!」喻林依舊隨口回答著,而後瞬間望向餘江:「你懂這個?」
「了解了一點點。」
餘江沒說謊,他當初是真的了解了一點點一他差點加入搜狗的。
「一點是幾點?雙向匹配是我的課題!」喻林瞬間瞪大眼:「怎麼解決雙向等長歧義?」
餘江想了想:「試試加一條詞長乘積優先規則?」
「等長歧義時,分別算兩種切分結果里每個詞長度的乘積,乘積更大的那個,就是更合理的分詞。」
「如果乘積相同,靠右長詞優先,符合現代漢語表達習慣。」
喻林低頭想了想。
「臥槽!你等著!」
餘江搖頭一笑,站到她身後,開始安靜地等待。
就在這時,門外也傳來一陣急促的腳步聲。
不多時,幾個男子魚貫進門。
(下章稍晚,中午依舊有更新。)
(還有更新耶)