第(2/3)頁 “那行吧。” …… 十分鐘后,寧為看著認(rèn)證過后的微博,終于想好了措辭。 “我是寧為,剛看到整件事情,感謝大家的信任與支持。想說點(diǎn)什么,又不知道說什么好!那就給大家拜個早年吧!祝大家新的一年快樂能單調(diào)遞增,煩惱是高階無窮,好運(yùn)連續(xù)且可導(dǎo),理想一定洛必達(dá)!” 沒去試圖解釋什么。 因?yàn)閷帪榘l(fā)現(xiàn)根本沒有必要,所有基于邏輯跟理性的判斷,大家已經(jīng)都幫他說了,再去解釋自己沒說那些話,有些畫蛇添足了。 而且紀(jì)子珩那條最新聲明已經(jīng)論述了事情的前因后果,他在說一遍也沒了什么意義。 就這樣,挺好的! 做完這些,他便關(guān)了微博,長出了口氣,開始下載今天實(shí)驗(yàn)室最新上傳的實(shí)驗(yàn)數(shù)據(jù),繼續(xù)做各種記錄跟比對,心情放松之下突然來了靈感,開始將所有異常數(shù)據(jù)歸類,然后按照今天靈感爆棚時想到的一種數(shù)學(xué)方法進(jìn)行堆棧。 很快,寧為似乎從這些紛雜的數(shù)據(jù)中找到了規(guī)律。 終于他在無數(shù)紛雜的數(shù)據(jù)中找到了一個個異常值,再次歸類,寧為發(fā)現(xiàn)所有這些找出的異常數(shù)據(jù)在一定情況下,滿足正態(tài)分布特點(diǎn)。 這次終于有眉目了。 對比數(shù)據(jù)的特點(diǎn),寧為終于發(fā)現(xiàn)所有發(fā)生錯誤的數(shù)據(jù)同時指向算法回歸部分的一個問題。 湍流算法在讀取異常數(shù)據(jù)流的時候需要經(jīng)過多層判定,并對初篩出的疑似爬蟲或惡意連接信號做出一個預(yù)標(biāo)記,并導(dǎo)入自己的數(shù)據(jù)庫,進(jìn)行下階段的數(shù)據(jù)比對。 比如最淺層的對不合規(guī)瀏覽器頭,或者包含了爬蟲信息的瀏覽器頭的判定,以及對某類ip一定時間內(nèi)訪問次數(shù)的判定等…… 而在數(shù)以億次的處理正常連接請求之后,記錄下當(dāng)數(shù)據(jù)對流時產(chǎn)生的數(shù)據(jù)特征,再跟數(shù)據(jù)庫內(nèi)異常數(shù)據(jù)進(jìn)行比對,嘗試放入,再比對,發(fā)出驗(yàn)證碼,再比對,這一過程中,最后反饋給算法的是數(shù)據(jù)流的異常特征碼,對符合異常特征碼的信號進(jìn)行標(biāo)記,而不是標(biāo)記具體的ip。 問題就出在這里,在某次次遞歸過程中,極少數(shù)正常的請求在比對并自動記錄特征碼的過程中,反饋時出了異常,這就導(dǎo)致同一類特性的數(shù)據(jù)全部被系統(tǒng)錯誤判定。 這個時候就體現(xiàn)出文檔做得足夠細(xì)致帶來的好處了。 找到了實(shí)驗(yàn)室測試誤判率無法降低的原因所在,修改了思路,然后只需要查閱文檔,很快便精準(zhǔn)的找到了需要修改的部分。 編程快搶手的絕對是名不虛傳。 只花了三個小時,寧為便將程序更新完畢,然后傳回了實(shí)驗(yàn)室。 雖然時間已經(jīng)比較晚了,但他還是又給余興偉打了個電話。 “喂,余哥!” “小寧總,還有什么吩咐?” 剛才兩人已經(jīng)通過電話,再打過來肯定有事。 “我剛才把湍流算法重新更新了一下,發(fā)到實(shí)驗(yàn)室里了,明天你去處理一下,重新第二輪測試。” “嗯?” 余興偉愣了愣,隨后由衷的說道:“小寧總,我服了你了,今天這么多亂七八糟的事情,你竟然還有心情改代碼。” “嗯,亂七八糟的事的確有點(diǎn)多,這不是我還沒反應(yīng)過來,就解決了嗎?” 聽起來真心很有道理的樣子,直讓余興偉羨慕嫉妒恨。 “小寧總,你身上又多了一條讓我崇拜的特質(zhì)。” “額?有嗎?” “有啊,您真會凡爾賽!” 寧為:“……” …… 魯東義昨晚就到了江城,然后在江城休息了一晚,第二天搭乘最早的一班高鐵來到郾城。 所以寧為一大早便要趕到火車站去接人。 這次寧為吸取了經(jīng)驗(yàn),把自己包裹的很嚴(yán)實(shí)。 帽子遮住額頭,圍巾擋住大半邊臉,配上臃腫的羽絨服,不是熟識的人還真不可能認(rèn)出他來。 這身裝扮的確有用,為了不錯過時間,寧為直接約了輛網(wǎng)約車,司機(jī)明顯很健談,一上車就跟寧為聊上了,聊的還是寧為。 第(2/3)頁