崗位職責(zé):
1、負(fù)責(zé)網(wǎng)頁信息抽取技術(shù)的研究和開發(fā);
2、負(fù)責(zé)爬蟲各個(gè)系統(tǒng)核心代碼開發(fā);
3、提高數(shù)據(jù)抓取的效率和質(zhì)量,解決數(shù)據(jù)的重復(fù),垃圾數(shù)據(jù)識(shí)別,清洗;
4、提高系統(tǒng)的可運(yùn)維,可測性,易用性。
任職要求:
1、3年以上python或java開發(fā)經(jīng)驗(yàn);
2、熟悉MYSQL,MSSQL,具備sql調(diào)優(yōu)經(jīng)驗(yàn);
3、了解爬蟲的設(shè)計(jì)及實(shí)現(xiàn)流程;
4、了解HTML基礎(chǔ)知識(shí);
5、具備團(tuán)隊(duì)協(xié)作精神;
6、了解文本分類,統(tǒng)計(jì)分析,自然語言處理,機(jī)器學(xué)習(xí)算法,熟悉前端技術(shù)和分布式計(jì)算,有分布式存儲(chǔ)經(jīng)驗(yàn)者優(yōu)先。
聯(lián)系我時(shí),請(qǐng)說是在吉安人事人才網(wǎng)上看到的,謝謝!