123,123

百度校招數(shù)據(jù)挖掘工程師筆試題和面試題答案目

筆試時間：2015-9-20

筆試職位：機器學習/數(shù)據(jù)挖掘工程師

筆試城市：天津、深圳、南京等

一. 簡答題

1. new 和 malloc 的區(qū)別。

2. hash沖突是指什么?怎么解決?給兩種方法，寫出過程和優(yōu)缺點。

3. 命中的概率是 0.25，若要至少命中一次的概率不小于 0.75，則至少需要幾次?

二. 算法設計題

1. 用C/C++寫一個歸并排序。

數(shù)據(jù)結(jié)構(gòu)為struct Node{int v; Node next};

接口為 Node merge_sort(Node );

2. 設計S型層次遍歷樹的算法，比如根節(jié)點是第一層，第二層從左至右遍歷，第三層從右至左遍歷，第四層再從左至右遍歷，以此類推。

舉例：應依次輸出 1 2 3 6 5 4 7 8 9。

3. 一個url文件，每行是一個url地址，可能有重復。

(1)統(tǒng)計每個url的頻次，設計函數(shù)實現(xiàn)實現(xiàn)。

(2)設有10億url，平均長度是20，現(xiàn)在機器有8G內(nèi)存，怎么處理，寫出思路。

三. 系統(tǒng)設計題

自然語言處理中的中文分詞問題，前向最大匹配算法(FMM)。

注：題目舉例說明了FMM的基本思想。

(1)設計字典的數(shù)據(jù)結(jié)構(gòu) struct dictnote。

(2)用C/C++實現(xiàn)FMM，可選接口為

int FMM(vector iLetters, dictnode iRoot, vector oResults);

其中 iLetters 為待分詞的句子，比如 {“小”，“明”，“今”，“天”，“買”，“了”，“i”，“p”，“o”，“n”，“e”，“6”}，

iRoot 是字典， oResults 保存輸出結(jié)果，即分詞的位置。也可以自己設計接口。

(3)收集了一些手機品牌的字典，如{iphone, 諾基亞}。

現(xiàn)在要求查找包含這些手機品牌的網(wǎng)頁，比如包含 iphone6, 諾基亞 9973 等。

怎么修改FMM實現(xiàn)這個功能，可以寫偽代碼。

百度校招數(shù)據(jù)挖掘工程師筆試題和面試題答案目

西安交通工程學院什么專業(yè)是王牌專業(yè) 比較好的有哪些

寧夏文科491分能上什么大學, 491分左右能報考哪些大學

德州科技職業(yè)學院什么專業(yè)是王牌專業(yè) 比較好的有哪些

河北物理295分能上什么大學, 295分左右能報考哪些大學

甘肅中醫(yī)藥大學什么專業(yè)是王牌專業(yè) 比較好的有哪些

黑龍江文科534分能上什么大學, 534分左右能報考哪些大學

百度校招產(chǎn)品經(jīng)理筆試題和面試題答案

百度校園招聘筆試題和面試題答案

知名企業(yè)招聘時對員工的情商測試題

事業(yè)單位綜合素質(zhì)測試題及答案

河北新聞網(wǎng)兩學一做知識競賽(試題+答案完整版)

河北新聞網(wǎng)兩學一做知識競賽活動試題答案

兩學一做學習教育知識競賽活動10篇

開展兩學一做學習教育知識競賽活動真題答案

一汽集團招聘筆試題目

百度校招產(chǎn)品經(jīng)理筆試題和面試題答案

百度校園招聘筆試題和面試題答案

知名企業(yè)招聘時對員工的情商測試題

熱門推薦

甘肅林業(yè)職業(yè)技術(shù)學院什

廈門演藝職業(yè)學院什么專

寧夏文科304分能上什么大

廈門大學什么專業(yè)是王牌

貴州交通職業(yè)技術(shù)學院什

貴州大學什么專業(yè)是王牌

最新文章

保利校園招聘筆試題目

阿里巴巴校園招聘筆試題目

華為招聘上機筆試題

中國電信筆試題（附答案）

中國電信招聘筆試題目精選

6年京東軟件測試筆試題目