Java爬虫 50行代码爬取一个网页（最简单的爬取）

2023-08-05 22:53:51

最简单最基础的写法没有任何骚操作

package regex;

import java.io.*;
import java.net.HttpURLConnection;
import java.net.URL;
import java.net.URLConnection;

public class Test {
    public static void main(String [] args)
    {
        try
        {
        //url地址
            URL url = new URL("https://www.cangqionglongqi.com/xingjiyoulun/28543.html");
            //建立一个连接
            URLConnection urlConnection = url.openConnection();
            HttpURLConnection connection = null;
            if(urlConnection instanceof HttpURLConnection)
            {
            //对象向下转型
                connection = (HttpURLConnection) urlConnection;
            }
            else
            {
                System.out.println("请输入 URL 地址");
                return;
            }
            //建立一个读取流从连接中读取
            BufferedReader in = new BufferedReader(
                    new InputStreamReader(connection.getInputStream(),"gbk"));
                  
            BufferedWriter wr=new BufferedWriter( new OutputStreamWriter(new FileOutputStream("a.txt"),"gbk"));
            String urlString = "";
            String current;
            //如果有数据就一致读
            while((current = in.readLine()) != null)
            {
                urlString += current;
                //每读一行写一行到文本中
                wr.write(current);
                wr.newLine();
                wr.flush();
       }
           System.out.println(urlString);

        }catch(IOException e)
        {
            e.printStackTrace();
        }
    }
}

Java爬虫 50行代码爬取一个网页（最简单的爬取）

继续阅读

Java小案例——随机数猜测随机数猜测

nginx location中斜线的位置的重要性

sort()函数到底是怎样进行数字排序的

27 Best Free Eclipse Plug-ins for Java Developer to be ProductiveCode Quality PluginsText Editor PluginsDependency ManagementVersion Control Integration PluginsFramework Development Continuous Integration Related PluginsOther Utility Plugins

Java String.format方法的简单使用

neo4j之cypher使用文档

GitHub连夜封杀！这份阿里 10W 字内部 Java 字面试手册到底有多强？

spark/scala关于【资源文件】加载方法概述外部文件加载方案测试资源文件打包入jar包中小结

mybatis_入门程序Mybatis入门

AOP编程_Android优雅权限框架(1)概念基础，2021金三银四前言正文大纲正文

Effective Java 8:通用程序设计

OOM三种类型

工厂模式-三种类型

【递归】高效率求2的n次幂

win10本地scala和spark安装安装scala安装spark

scala (3) Function 和 Method