關於講師 MASTER

 
李厚均

Isaac 畢業於台大電子所,主要專長為人工智慧及資料分析,擅長處理影像辨識、金融數據等問題。
過去曾於多處擔任資料科學講師,同時,也曾在許多上市櫃公司擔任內訓講師及顧問,具有相當豐富的教學及實戰經驗。

課程內容 PROJECT

零基礎入門網路爬蟲,開啟Python Coding之路

一天只有24小時,資訊量卻每分每秒在爆量增加,資料蒐集與文字工作的負擔日漸不堪負荷,該如何在有效的時間內從龐大資料中快速取得有效的資訊加以利用呢?網路爬蟲絕對是最重要的技能之一。只要選對工具與程式語言,也能讓程式零經驗、想自動化蒐集資料的你快速上手實戰,減輕工作上的負擔!

上完課掌握哪些技能

  •    快速從網頁擷取重要資訊。
  •    掌握HTML、CSS、Javascript等網頁基礎知識。
  •    運用Brautifilsoup & Regular Expression解析HTML。
  •    學會觀察網頁中get/post封包,並有能力模擬封包。

誰適合上課

  •    想寫程式卻不知道該選擇哪種語言。
  •    懂程式語言,卻沒有學過Python的人。
  •    想要快速掌握資料科學實務應用的人。
  •    想轉行、想理財節省人工擷取資訊的人。


課程主要教學如何在資料海中快、狠、準的找到對自己有效的資訊並加以利用。課程設計四大單元、二十一個小節來手把手帶你學會如何用Python撰寫爬蟲,針對網頁爬取所需資訊,透過程式有效地蒐集網路上不同的金融數據並加以分析,是資料數據時代想要投資理財或從事相關行業不可或缺的能力。


單元一、網頁基礎原理

第一單元首先介紹網頁基礎原理,帶學員直接從現有網站觀察程式碼,解析網頁構成三大要件HTML、CSS、Javacript分別扮演的角色及實際功用,分析CSV、Json常見的資料儲存格式。

單元二、Python 基礎爬蟲 

第二單元開始進入網路爬蟲的世界,首先介紹伺服器與HTML的關係,於本機建置Anaconda、Jupyter的上課環境,透過網頁觀察get/post封包,並實際動手製作Python模仿get/post封包,以及如何使用Brautifilsoup & Regular Expression來解析HTML。

單元三、Python 爬蟲實務 

具備網頁概念與基礎爬蟲技術之後,實務上會發現不是每個網頁都會乖乖地讓你爬取資訊。第三單元要教你如何爬取表格資料,更要帶您排除網站上的防護機制,例如閃避網頁驗證碼、大量爬取單一頁面資料、自動定時爬取資料等等,解決實務上常遇到的狀況。

單元四、儲存資料 

前面單元已經學會如何爬取資料並儲存成CSV格式,第四單元則是要教大家透Pyhton內建的database SQLite將資料儲存在資料庫裏面,當未來有需要的時候就快速獲取資訊。


講師 Isaac 畢業於台大電子所,主要專長為人工智慧及資料分析,擅長處理影像辨識、金融數據等問題。他過去曾於多處擔任資料科學講師,同時,也曾在許多上市櫃公司擔任內訓講師及顧問,具有相當豐富的教學及實戰經驗。

目前為T客邦長期合作講師,開立過許多課程,如Python大數據爬蟲、金融大數據分析平台、AI人工智慧深度學習、Apache Spark大數據平台處理實務等課程。授課經驗豐富,累積學員數超過數百名,並有經營Facebook粉絲專頁-小李談數智,在社群提供更多關於人工智慧、深度學習的資訊。

 經歷 

AI人工智慧講師

台積電、中華電信等企業內訓AI講師

T客邦資深講師

Lab AI軟體工程師

 學歷 

台灣大學電子工程研究所碩士

美國伊利諾香檳分校交換學生

交通大學電子工程學系學士 

 著作 

選擇的能力–探索人工智慧的核心

專案人氣

425
人觀看

 

課程售價

限量20名
零基礎入門網路爬蟲,開啟Python Coding之路
線上影音課程(總長約 171分鐘):

課程長度:2小時52分鐘
課程期限:永久觀看

第一章節、網頁基礎:看懂網頁的架構、排版與互動機制
單元1、為什麼需要網路爬蟲
單元2、起手式:建置學習環境並開始看網頁原始碼
單元3、看懂負責網頁內容架構的HTML
單元4、看懂負責網頁外觀與排版的CSS
單元5、看懂負責網頁互動機制的JavaScript
單元6、儲存與傳輸資料的重要格式:CSV與Json

第二章節、開始打造Python爬蟲
單元7、跟伺服器溝通:Get封包介紹
單元8、跟伺服器溝通:Post封包介紹
單元9、用Anaconda建置Python開發環境
單元10、用Get方法打造Python爬蟲
單元11、用Post方法打造Python爬蟲
單元12、用Beautifulsoup解析HTML
單元13、用RegularExpression解析HTML
單元14、混合運用Beautifulsoup和RegularExpression
單元15、如何爬取下載網頁圖片

第三章節、Python爬蟲實務
單元16、如何爬取表格資料
單元17、如何設定自動抓取網頁
單元18、如何繞掉網頁驗證碼
單元19、如何大量爬取單一頁面
單元20、如何定時爬取網頁更新資訊

第四章節、儲存資料
單元21、使用SQLite資料儲存

特價
$1600
原價
$2500
單次訂閱 /
永久觀看
5/18 限時64折
此價格僅剩 0 天 19 小時
猜你也會喜歡
OGSM目標管理法 打造高效團隊一頁搞定!
張敏敏
NT$
3790
拆解考試的技術|職場證照版
趙胤丞
NT$
2550