顯示具有 requests 標籤的文章。 顯示所有文章
顯示具有 requests 標籤的文章。 顯示所有文章

2019年1月30日 星期三

[Python] 爬網頁分析練習 套件安裝

因為工作需求,第一次自己寫一個很簡單的爬蟲分析

其實也是照著網路上面各個神人的方式刻成符合自己的需求

首先因為python 簡陋,你要依你的需求安裝module

才能帶入這個module的指令

我們今天是要爬網頁,所以會需要安裝下面幾個套件

使用pip install 的指令進行安裝 pip install (your_module_name)

第一個要安裝BeautifulSoup 套件
再來我們還需要搭配使用 lxml 套件與 requests 套件。
lxml 套件是用來作為 BeautifulSoup 的解析器
BeautifulSoup 可以支援的解析器其實不只一種
還有 html.parser(Python 內建)與 html5lib
根據官方文件的推薦,我們使用解析速度最快的 lxml