![网络数据采集技术:Java网络爬虫实战](https://wfqqreader-1252317822.image.myqcloud.com/cover/251/33831251/b_33831251.jpg)
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
2.4 条件判断与循环
条件判断语句是Java程序中最常见的选择控制结构,共分为三种形式:if、if-else和if-else if-else语句。程序2-1为这三种语句的语法格式。
程序2-1
![](https://epubservercos.yuewen.com/CDDCA8/18096059701207306/epubprivate/OEBPS/Images/37607_26_01.jpg?sign=1738803593-GOPOpssoXi6DbA9hc85ZonU8pU3vEp0P-0-17fd4d13cdee6116a4669e3c04f80125)
例如,在网络爬虫中,经常使用if-else语句判断网页是否请求成功,如程序2-2所示。
程序2-2
![](https://epubservercos.yuewen.com/CDDCA8/18096059701207306/epubprivate/OEBPS/Images/37607_26_02.jpg?sign=1738803593-6CB9PQMK35l2ImQpfct5HQdHZsVVTtk8-0-7292163710e2c79757e7ea422711183a)
循环语句是Java程序中重要的结构,其功能是反复执行某段程序。Java中共有三种语句实现循环操作,即while,do-while和for循环语句。程序2-3为这三种语句的语法格式。
程序2-3
![](https://epubservercos.yuewen.com/CDDCA8/18096059701207306/epubprivate/OEBPS/Images/37607_27_01.jpg?sign=1738803593-6EncgwA9EgR9mcYeh3vBbT3CzxRFZM8A-0-cd3442f3a2404cd6526d18f7b374bdcd)
如在网络爬虫中,使用while循环URL队列,反复执行URL请求以及解析任务,直到队列为空,即所有URL采集完成。程序2-4为执行的流程。
程序2-4
![](https://epubservercos.yuewen.com/CDDCA8/18096059701207306/epubprivate/OEBPS/Images/37607_27_02.jpg?sign=1738803593-5gz2YhCxaEkaGt6QEzbhGUnZkUFyIOJa-0-f2122b5c4736a06c4199aec9508e243d)
另外,如果采集的页面包含多页,可以通过for循环的方式,拼接每页URL,并将这些URL添加到队列中,如程序2-5所示。
程序2-5
![](https://epubservercos.yuewen.com/CDDCA8/18096059701207306/epubprivate/OEBPS/Images/37607_27_03.jpg?sign=1738803593-iEYTGzypmuhC8JZNLRaWSalQjCVy2A19-0-b81da3e0ed03ee8101abacf87c6e0085)
![](https://epubservercos.yuewen.com/CDDCA8/18096059701207306/epubprivate/OEBPS/Images/37607_28_01.jpg?sign=1738803593-Q7FAO5cEDzJm6jj0jpzaQFIxUkKpK58X-0-2e733bb25ca3e98c3d90f2940ae3aabb)