用java爬虫来提高CSDN博客访问量,浏览量
                                                            生活随笔
收集整理的這篇文章主要介紹了
                                用java爬虫来提高CSDN博客访问量,浏览量
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.                        
                                首先明確一點,采用爬蟲來提高訪問量,這樣是不對滴,同學們請不要使用。
咋們用的java的jsoup來進行爬蟲,也可以用http就是代碼有點多,咋們省著點來。
一、首先,項目中引入如下jar包,讓爬蟲變的簡單和容易。
<dependency><groupId>org.jsoup</groupId><artifactId>jsoup</artifactId><version>1.11.3</version></dependency>二、啥話不說了,貼代碼,一頁就可以實現
import java.io.IOException; import java.text.SimpleDateFormat; import java.util.ArrayList; import java.util.Date; import java.util.List; import java.util.Timer; import java.util.TimerTask; import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; import org.jsoup.select.Elements;public class csdn {public static void main(String[] args) throws IOException {//執行計劃的任務放在TimerTask的子類中,由Timer進行該任務。Timer timer = new Timer();//創建一個任務,1s后開始執行,并此后每隔2分鐘執行一次。timer.schedule(new TimerTask() {//創建n,看看循環的次數int n=1;//創建m,看看循環的次數int m=0;@Overridepublic void run() {List<Object> list = new ArrayList<Object>();//循環的次數看你博客有多少頁就行,也可以爬下來,我懶的爬,直接就寫死了,我的博客總共9頁。for (int i = 1; i < 10; i++) {Document doc;try {//先把博客上面所有的鏈接獲取到放在list中doc = Jsoup.connect("https://blog.csdn.net/weixin_38959210/article/list/"+i+"?").header("Accept-Encoding", "gzip, deflate").userAgent("Mozilla/5.0 (Windows NT 6.1; WOW64; rv:23.0) Gecko/20100101 Firefox/23.0").maxBodySize(0).timeout(600000).get();Elements csdndoc=doc.select("h4");Elements csdnurl =csdndoc.select("a");for (Element element : csdnurl) {String fangwenliang=element.attr("href"); list.add(fangwenliang);}} catch (IOException e) {// TODO Auto-generated catch blocke.printStackTrace();}}//讓list中的鏈接循環進行訪問,但是因為list有一個廣告鏈接一直存在,所以要進行判斷。for (int j = 0; j < list.size(); j++) {String url=list.get(j).toString();if (url.equals("https://blog.csdn.net/yoyo_liyy/article/details/82762601")) {System.out.println("進入了yoyo_liyy這個廣告網站");}else {System.out.println("成功點擊博客");try {//開始進行訪問,沒訪問一次就是一次點擊。 Document shuaxin = Jsoup.connect(url).header("Accept-Encoding", "gzip, deflate").userAgent("Mozilla/5.0 (Windows NT 6.1; WOW64; rv:23.0) Gecko/20100101 Firefox/23.0").maxBodySize(0).timeout(600000).get();m++;} catch (IOException e) {// TODO Auto-generated catch blocke.printStackTrace();}}}System.out.println("訪問博客結束");System.out.println("成功點擊了博客:"+m+"篇");Date date = new Date();SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss"); System.out.println(df.format(date)+ ":正在執行第"+n+"遍");n++;}},1000,120000);// 因為csdn對頻繁刷新有限制,所以設置從第一秒開始,每兩分鐘執行一次 }}三、根據自己的博客修改一下訪問地址,就是這一長串https://blog.csdn.net/weixin_38959210/article/list/"+i+"?
如果有廣告的話,看看自己的廣告地址,修改這一長串https://blog.csdn.net/yoyo_liyy/article/details/82762601
四:然后就可以跑起來了
總結
以上是生活随笔為你收集整理的用java爬虫来提高CSDN博客访问量,浏览量的全部內容,希望文章能夠幫你解決所遇到的問題。
 
                            
                        - 上一篇: 换机助手软件怎么使用
- 下一篇: tp提示游戏环境异常还能继续玩吗 LIN
