java如何爬取網(wǎng)頁
時間:
黎正888由 分享
百度搜索引擎的原理其中之一就是定期的派出網(wǎng)絡爬蟲到互聯(lián)網(wǎng)上去爬取網(wǎng)頁,下面就讓學習啦小編教大家java如何爬取網(wǎng)頁吧。
java爬取網(wǎng)頁的方法
我希望輸入一個有效的網(wǎng)址后返回這一網(wǎng)址下的網(wǎng)頁源碼,則有代碼如圖:
通過網(wǎng)址連接到指定的網(wǎng)址
在運行之前把開發(fā)空間的的編碼改為UTF-8,否則編譯執(zhí)行返回的網(wǎng)頁中的中文會變成亂碼
連接成功后通過連接對象得到輸入流,讀出輸入流就可以得到網(wǎng)頁代碼
運行后得到的網(wǎng)頁代碼如下
把返回的代碼復制到EditPlus中運行一下看看
猜你感興趣的:
java如何爬取網(wǎng)頁
百度搜索引擎的原理其中之一就是定期的派出網(wǎng)絡爬蟲到互聯(lián)網(wǎng)上去爬取網(wǎng)頁,下面就讓學習啦小編教大家java如何爬取網(wǎng)頁吧。 java爬取網(wǎng)頁的方法 我希望輸入一個有效的網(wǎng)址后返回這一網(wǎng)址下的網(wǎng)頁源碼,則有代碼如圖: 通過網(wǎng)址連接到指定的
推薦度:
點擊下載文檔文檔為doc格式