歡迎來(lái)到培訓(xùn)無(wú)憂(yōu)網(wǎng)! 璇风櫥褰� | 鍏嶈垂娉ㄥ唽

咨詢(xún)熱線(xiàn) 400-001-5729

位置:深圳培訓(xùn)無(wú)憂(yōu)網(wǎng) > 深圳電腦與IT > 深圳軟件系統(tǒng) > 深圳Python開(kāi)發(fā)

深圳Python爬蟲(chóng)及文本分析學(xué)術(shù)應(yīng)用培訓(xùn)班

授課機(jī)構(gòu):深圳CDA數(shù)據(jù)分析師培訓(xùn)機(jī)構(gòu)

地址:深圳市南山區(qū)桃源街道民企科技園

網(wǎng)報(bào)價(jià)格:¥電詢(xún)

課程原價(jià):¥電詢(xún)

咨詢(xún)熱線(xiàn):400-001-5729

課程詳情 學(xué)校簡(jiǎn)介 學(xué)校地址 申請(qǐng)?jiān)嚶?tīng)

關(guān)鍵詞:python爬蟲(chóng)培訓(xùn)機(jī)構(gòu)有哪些

Python爬蟲(chóng)及文本分析學(xué)術(shù)應(yīng)用培訓(xùn)班

課程名稱(chēng):Python爬蟲(chóng)及文本分析學(xué)術(shù)應(yīng)用
課程類(lèi)目:Python
課程類(lèi)型:正式課
授課形式:現(xiàn)場(chǎng)+遠(yuǎn)程
免費(fèi)試聽(tīng):是
適合基礎(chǔ):零基礎(chǔ)學(xué)員
上課人數(shù):60
班級(jí)名稱(chēng):基礎(chǔ)班
上課時(shí)間:周一到周日9-18點(diǎn)
開(kāi)班時(shí)間:每月開(kāi)課
課時(shí)數(shù)量:40


01
課程亮點(diǎn)

本課程致力于講授完整的結(jié)構(gòu)化數(shù)據(jù)、文本數(shù)據(jù)的獲取、存儲(chǔ)、讀取、處理和分析過(guò)程,我們期望課程可以幫助到廣大的用戶(hù),包括所有想要使用python編程語(yǔ)言實(shí)現(xiàn)數(shù)據(jù)獲取和文本分析的在校師生、以及致力于將數(shù)據(jù)分析與挖掘的價(jià)值廣泛運(yùn)用到實(shí)際場(chǎng)景的商業(yè)人士。


02
學(xué)習(xí)目標(biāo)

不再單一依靠開(kāi)源公開(kāi)數(shù)據(jù)網(wǎng)站的數(shù)據(jù),適當(dāng)擺脫對(duì)國(guó) 家統(tǒng)計(jì)年鑒、wind數(shù)據(jù)庫(kù)、知網(wǎng)數(shù)據(jù)的依賴(lài),能夠從更多元的渠道獲取數(shù)據(jù),使用python更高效的處理數(shù)據(jù),并用更前沿的技術(shù)分析和挖掘數(shù)據(jù)信息,為我們的科研工作減輕中間工作負(fù)擔(dān)。


03
課程內(nèi)容

01章概述 爬蟲(chóng)與文本分析概述
01-01結(jié)構(gòu)化數(shù)據(jù)/文本數(shù)據(jù)的獲取方法概述
01-02高效的編程語(yǔ)言實(shí)現(xiàn)結(jié)構(gòu)化數(shù)據(jù)處理與文本分析的價(jià)值
02章編程基礎(chǔ)
02-01python編程基礎(chǔ)(標(biāo)準(zhǔn)數(shù)據(jù)類(lèi)型,控制流,自定義函數(shù),類(lèi),os文件處理模塊)
02-02python重要數(shù)據(jù)科學(xué)計(jì)算庫(kù)(Numpy,Pandas,Matplotlib,Pyecherts,wordcloud)
03章數(shù)據(jù)獲取
03-01爬蟲(chóng)基礎(chǔ)(網(wǎng)絡(luò)爬蟲(chóng)簡(jiǎn)介,爬蟲(chóng)的基本原理,HTML 簡(jiǎn)介,數(shù)據(jù)存儲(chǔ))
03-02網(wǎng)頁(yè)抓�。ㄊ褂� Urllib網(wǎng)頁(yè)抓取,requests實(shí)戰(zhàn))
03-03BeautifulSoup4(簡(jiǎn)介,安裝,BS 對(duì)象的種類(lèi),遍歷文檔樹(shù),搜索文檔樹(shù))
03-04Xpath(什么是Xpath,Xpath開(kāi)發(fā)工具,Xpath常用規(guī)則)
03-05動(dòng)態(tài)渲染頁(yè)面抓�。⊿elenium的安裝,基本使用,聲明瀏覽器對(duì)象,訪問(wèn)頁(yè)面,定位元素,節(jié)點(diǎn)交互,動(dòng)作鏈,執(zhí)行 JavaScript,獲取節(jié)點(diǎn)信息,延時(shí)等待,前進(jìn)后退,Cookies,選項(xiàng)卡管理,異常處理)
03-06爬蟲(chóng)實(shí)戰(zhàn)(網(wǎng)站的爬取,基電商評(píng)價(jià)文本爬�。�
04章數(shù)據(jù)存儲(chǔ)與讀取
04-01可供讀取數(shù)據(jù)類(lèi)型介紹(excel、pdf、txt、html、mysql數(shù)據(jù)庫(kù)文件介紹)
04-02數(shù)據(jù)的存儲(chǔ)(將數(shù)據(jù)存儲(chǔ)到excel表,txt文本,word文檔)
04-03數(shù)據(jù)的讀�。╬ython批量讀取多個(gè)多子表excel,python讀取txt文件,word文檔)
05章數(shù)據(jù)處理
05-01正則表達(dá)式(什么是正則表達(dá)式,正則表達(dá)式匹配規(guī)則,re模塊的使用)
05-02文本處理常用方法(字符串的不變性,排序行,段落格式化,二進(jìn)制轉(zhuǎn)化為ASCII,重復(fù)字詞過(guò)濾,提取郵件地址,提取URL地址,大寫(xiě)轉(zhuǎn)換,符號(hào)化,刪除停用詞,同義詞與反義詞處理,文本翻譯,單詞替換,拼寫(xiě)檢查,WordNet接口,語(yǔ)料訪問(wèn),標(biāo)記單詞,塊和裂口,塊分類(lèi),文本分類(lèi),雙字母組,文字改寫(xiě),文字換行,頻率分布,文字摘要,詞干算法,約束搜索)
05-03結(jié)構(gòu)化數(shù)據(jù)處理--數(shù)據(jù)清洗(numpy數(shù)值計(jì)算要點(diǎn)串講,Pandas數(shù)據(jù)處理串講,python統(tǒng)計(jì)圖表展示)
06章文本分析實(shí)戰(zhàn)
06-01重要的庫(kù)(jieba庫(kù)簡(jiǎn)介)
06-02關(guān)鍵詞提�。P(guān)鍵詞任務(wù)概述,TF-IDF算法原理,相似文章推薦原理介紹,實(shí)例:紅樓夢(mèng)文本分析的實(shí)現(xiàn),文件與詞庫(kù)的讀取,完成分詞與詞云圖的繪制)
06-03文本分類(lèi)(新聞素材介紹,新聞內(nèi)容的關(guān)鍵詞提取,詞向量轉(zhuǎn)化與ngram模型,樸素貝葉斯算法完成新聞分類(lèi))

  • 培訓(xùn)無(wú)憂(yōu)網(wǎng)
免 費(fèi) 申 請(qǐng) 試 聽(tīng)
提交申請(qǐng),《培訓(xùn)無(wú)憂(yōu)網(wǎng)》課程顧問(wèn)老師會(huì)一對(duì)一幫助你規(guī)劃更適合你的專(zhuān)業(yè)課程!

留下你的信息,課程顧問(wèn)一對(duì)一為你規(guī)劃更合適課程!
  • 姓名:

  • 手機(jī):

  • 地區(qū):

  • 想學(xué)什么: