网络编程套接字(2)
UDP数据报套接字编程
API介绍
DatagramSocket
DatagramSocket是UDP的Socket,用于发送和接收数据报.
操作系统中有一类文件,就叫做socket文件(普通文件/目录文件:在硬盘上的)
socket文件:抽象的表示了网卡这样的硬件设备
DatagramSocket就是对socket文件进行读写,也就是借助网卡发送数据.
通过网卡发送数据,就是写socket文件;通过网卡读取数据,就是读socket文件.
DatagramSocket构造方法:
方法签名 | 方法说明 |
DatagramSocket() | 创建一个UDP数据报套接字的Socket,绑定到本机 任意一个随机端口(一般用于客户端) |
DatagramSocket(int port) | 创建一个UDP数据报套接字的Socket,绑定到本机 指定的端口(一般用于服务端) |
DatagramSocket方法:
方法签名 | 方法说明 |
void receive(DatagramPacket p) | 从此套接字接收数据报(如果没有收到数据报,该 方法会阻塞等待) |
void send(DatagramPacket p) | 从此套接字发送数据包(不会阻塞等待,直接发送) |
void close() | 关闭此数据报套接字 |
DatagramPacket
UDP数据报,每次接收数据的基本单位,就是一个UDP数据报
DatagramPacket是UDP Socket发送和接收的数据报.
DatagramPacket构造方法:
方法签名 | 方法说明 |
DatagramPacket(byte[] buf, int length) | 构造一个DatagramPacket以用来接收数据报,接收的 数据保存在字节数组(第一个参数buf)中,接收指定 长度(第二个参数length) |
DatagramPacket(byte[] buf, int offset, int length, SocketAddress address) | 构造一个DatagramPacket以用来发送数据包,发送的 数据为字节数组(第一个参数buf)中,从0到指定长度 (第二个参数length).address指定目的主机IP和端口号 |
DatagramPacket方法:
方法签名 | 方法说明 |
InetAddress getAddress() | 从接收的数据报中,获取发送端主机IP地址; 或从发送的数据报中,获取接收端主机IP地址 |
int getPort() | 从接收的数据报中,获取发送端主机的端口号; 或从发送的数据报中,获取接收端主机的端口号 |
byte[] getData() | 获取数据报中的数据 |
构造UDP发送的数据报时,需要传入SocketAddress,该对象可以使用InetSocketAddress来创建.
InetSocketAddress
InetSocketAddress (SocketAddress的子类) 构造方法:
方法签名 | 方法说明 |
InetSocketAddress(InetAddress addr, int port) | 创建一个Socket地址,包含IP地址和端口号 |
代码示例
UDP Echo Server
下面以一个简单的回显服务器作为代码示例的程序(回显服务器:客户端发啥请求返回啥响应)
警告:文本解析巨长无比
import java.io.IOException;
import java.net.DatagramPacket;
import java.net.DatagramSocket;
import java.net.SocketException;
public class UdpEchoServer {
/*
最开始的一步:先创建DdtagramSocket对象
接下来需要操作网卡,操作网卡是通过socket对象完成的
socket对象是在内存中的,通过这个来影响网卡(类似遥控)
*/
private DatagramSocket socket = null;
/*
一个主机上的一个端口号只能被一个进程绑定,反过来,一个进程可以绑定多个端口
创建对象时,手动指定一个端口号(在运行服务器程序的时候,主动指定端口)
程序一启动就需要关联上/绑定上一个操作系统中的端口号
端口号也是一个整数,用来区分一个主机上进行网络通信的程序.
*/
//参数时服务器要绑定的端口
public UdpEchoServer(int port) throws SocketException {
/*
SocketException是网络编程中的常见异常,通常表示
socket创建失败,比如端口号被别的进程占用,就会失败
*/
socket = new DatagramSocket(port);
}
//使用这个方法启动服务器
public void start() throws IOException {
System.out.println("服务器启动");
while(true) {
//反复的,长期的执行针对客户端请求处理的逻辑.(不停的收到请求,返回响应)
//一个服务器,运行的过程中,要做的事情,主要是三个核心环节.
//1.读取请求,并解析. (一个服务器单位时间处理的请求返回响应越多,服务器越厉害)
DatagramPacket requestPacket = new DatagramPacket(new byte[4096], 4096);
/*
receive就从网卡中读出了一个数据报,就被放入了requestPacket对象中.
其中UDP数据报的载荷部分就被放到requestPacket内置的字节数组中了.
除了UDP报头,还有其它信息,比如收到的数据:源IP
*/
//如果执行到这个地方,没有客户端请求的话,就会阻塞.
socket.receive(requestPacket);
//转成字符串,方便逻辑处理(前提:后续客户端发的就是一个文本字符串)
String request = new String(requestPacket.getData(), 0, requestPacket.getLength()); //有效长度
//2.根据请求,计算出响应(对于回显服务器,这一步什么都不用做)
String response = process(request);
//3.把响应写回给客户端
//此时需要告知网卡,要发的内容是啥,要发给谁
//requestPacket是客户端发来的数据报.
//通过getSocketAddress()得到InetAddress对象,这个对象就包含了和服务器的通信对端(对应客户端IP)
//此时就起到了把消息返回给客户端的效果(还可以看到UDP是无连接通信,socket不包含对端IP,端口)
DatagramPacket responsePacket = new DatagramPacket(response.getBytes(),
response.getBytes().length, requestPacket.getSocketAddress());
socket.send(responsePacket);
//记录日志,方便观察程序执行效果
System.out.printf("[%s : %d] req: %s, resq: %s\n", requestPacket.getAddress()
requestPacket.getPort(), request, response);
}
}
/*
上述代码中,可以看到UDP是无连接的通信~UDPsocket自身不保存对端的IP和端口
而是在每个数据报中有一个.另外代码中也"建立连接","接受连接"的擦做
面向数据报,send和receive都是以DatagramPacket为主
*/
//根据请求计算响应
public String process(String request) {
return request;
}
public static void main(String[] args) throws IOException {
//指定任何想要的端口,但要确保这个端口在机器上未被其它进程占用
UdpEchoServer server = new UdpEchoServer(9090);
server.start();
}
}
UDP Echo Client
import java.io.IOException;
import java.net.DatagramPacket;
import java.net.DatagramSocket;
import java.net.InetAddress;
import java.net.SocketException;
import java.util.Scanner;
public class UdpEchoClient {
private DatagramSocket socket = null;
private String serverIp;
private int serverPort;
//服务器的ip和服务器的端口 (因为发起请求的前提就是知道服务器在哪).
public UdpEchoClient(String ip, int port) throws SocketException {
serverIp = ip;
serverPort = port;
//这个new操作,就不再指定端口了.让系统分配一个空闲端口
socket = new DatagramSocket();
}
/*
在服务器中,在代码中需要手动指定端口号,才能保证端口始终固定
如果不手动指定,依赖系统自动分配导致服务器重启之后,端口号就
变了,客户端可能找不到服务器在哪了
服务器这个机器,是在程序员手里的,是可控的.
程序员能知道服务器有哪些端口被使用,客户端是在普通用户的机器上
*/
//让这个客户端反复的从控制台读取用户输入的内容,把这个内容构成UDP请求,发送给服务器
//最终显示在客户端的屏幕上
public void start() throws IOException {
Scanner sc = new Scanner(System.in);
System.out.println("客户端启动!");
while(true) {
//1.从控制台读取用户输入内容
System.out.println("->"); //命令提示符,提示用户要输入的字符串
String request = sc.next(); //从控制台读取,最好使用next而不是nextLine
//2.构造请求对象,并发给服务器
DatagramPacket requestPacket = new DatagramPacket(request.getBytes(),
request.getBytes().length, InetAddress.getByName(serverIp), serverPort);
socket.send(requestPacket);
//3.读取服务器的响应,解析出响应内容.
DatagramPacket responsePacket = new DatagramPacket(new byte[4096], 4096);
socket.receive(responsePacket);
String response = new String(responsePacket.getData(), 0, responsePacket.getLength());
//4.显示到屏幕上
System.out.println(response);
}
}
public static void main(String[] args) throws IOException {
UdpEchoClient client = new UdpEchoClient("127.0.0.1", 9090);
client.start();
}
}
让我们结合一下服务器和客户端,来看一下执行的流程:
1.服务器启动,启动之后,立即进入while循环,执行到receive(),进入阻塞等待,这时还未收到客户端的请求.
2.客户端启动,启动之后进入while循环,执行到输入那里堵塞,此时用户未输入内容.
3.用户在客户端输入字符串回车.此时阻塞解除,next会返回刚才的内容.基于用户输入内容,构造一个DatagramPacket对象,并进行send.send执行完之后,继续receive操作,等待服务器响应数据(此时服务器还没响应,就会阻塞).
4.服务器收到请求之后,就会从receive阻塞中返回.返回之后,就会根据读到的DatagramPacket对象,构造String request,通过process方法构造出一个String response,再根据response构造一个DatagramPacket表示响应对象.再通过send来进行发送给客户端.(执行这个的过程中,客户端也在阻塞等待).
5.客户端从receive中返回执行,就能获取到服务器返回的响应,并且打印到控制台上,与此同时,服务器进入下一个环节,也就是进入到第二轮receive阻塞.等待下一个请求了.
UDP Dict Server
我们之前写的服务器是回显服务器,我们来扩展以下,写一个处理简单英译汉功能的服务器.
import java.io.IOException;
import java.net.SocketException;
import java.util.HashMap;
import java.util.Map;
public class UdpDictServer extends UdpEchoServer{
private Map<String, String> dict = new HashMap<>();
public UdpDictServer(int port) throws SocketException {
super(port);
dict.put("cat", "小猫");
dict.put("dog", "小狗");
dict.put("fuck", "我爱你");
//可以在这里添加千千万万个单词.使每一个单词都有对应的翻译
}
@Override
public String process(String request) {
//把请求对应单词的翻译,给返回回去
return dict.getOrDefault(request, "该单词没有查询到!");
}
public static void main(String[] args) throws IOException {
UdpDictServer server = new UdpDictServer(9090);
server.start(); //在此处会除法多态
}
}
TCP流套接字编程
和刚才的UDP类似.但是TCP是面向字节流的,传输的基本单位是字节
API介绍
ServerSocket
这个Socket类对应到网卡,只能给服务器使用.
ServerSocket是创建TCP服务端Socket的API.
ServerSocket构造方法:
方法签名 | 方法说明 |
ServerSocket(int port) | 创建一个服务端流套接字Socket,并绑定到指定端口 |
ServerSocket方法:
方法签名 | 方法说明 |
Socket accept() | 开始监听指定端口(创建时绑定的端口),有客户端 连接后,返回一个服务端socket对象,并基于该 Socket建立与客户端的连接,否则阻塞等待 |
void close() | 关闭此套接字 |
Socket
对应到网卡,既可以给客户端使用,也可以给服务器使用.
Socket是客户端Socket,或服务端接收到客户端建立的连接(accept方法)的请求后,返回的服务端Socket.
不管是客户端还是服务端Socket,都是双方建立连接之后,保存对端信息,及用来与对方收发数据的.
Socket构造方法:
方法签名 | 方法说明 |
Socket(String host, int port) | 创建一个客户端流套接字Socket,并与对应IP的主机 上,对应端口的进程进行连接 |
Socket方法:
方法签名 | 方法说明 |
InetAddress getInetAddress() | 返回套接字所连接的地址 |
InputStream getInputStream() | 返回此套接字的输入流 |
OutputStream getOutputStream() | 返回此套接字的输出流 |
代码示例
TCP Echo Server
import java.io.IOException;
import java.io.InputStream;
import java.io.OutputStream;
import java.io.PrintWriter;
import java.net.ServerSocket;
import java.net.Socket;
import java.util.Scanner;
public class TcpEchoServer {
private ServerSocket serverSocket = null;
//这个操作就会绑定端口号
public TcpEchoServer(int port) throws IOException {
serverSocket = new ServerSocket(port);
}
//启动服务器
public void start() throws IOException {
System.out.println("服务器启动!");
while(true) {
//这是个建立链接的过程,就相当于接地阿努好的时候这边拨完号打过去,另一边在响铃
//通过accept()操作接听电话,然后进行通信
//clientSocket负责后续通信交互
Socket clientSocket = serverSocket.accept();
/*accept可能会产生阻塞.没有客户端,就会阻塞.有客户端的时候再处理
有一个客户端来了, accept一次就能返回一次.
有多个客户端连过来了,accept就会执行多次
*/
processConnection(clientSocket);
}
}
//通过这个方法来处理一个连接的逻辑
private void processConnection(Socket clientSocket) {
System.out.printf("[%s:%d] 客户端上线!\n", clientSocket.getInetAddress(), clientSocket.getPort());
//接下来就可以读取请求,根据请求计算响应,返回响应这三步走了.
//Socket对象包含两个字节流对象,可以把这两字节流对象获取到,完成后续的读写
/*
inputStream是从网卡中读,OutputStream是向网卡中写
TCP是面向字节流的.和文件操作以一样的类和方法来完成tcp socket的读写
*/
try(InputStream inputStream = clientSocket.getInputStream();
OutputStream outputStream = clientSocket.getOutputStream()) {
//一次连接中,可能会涉及到多次请求/响应
while(true) {
//1.读取请求并解析..为了读取方便,直接使用Scanner
Scanner sc = new Scanner(inputStream);
//客户端退出的时候就会触发Tcp的"断开连接"流程.
//服务器这边的代码也会感知到,对应Scanner就在hasNext()处返回false.
if(!sc.hasNext()) {
//读取完毕,客户端下线.
System.out.printf("[%s:%d] 客户端下线!\n", clientSocket.getInetAddress(), clientSocket.getPort());
break;
}
//这个代码暗含一个约定,客户端发过来的请求,得是文本数据. next读的时候要督导空白符才会结束.
// 因此就要客户端发来的请求必须带有空白符结尾.比如\n或者空格.
String request = sc.next();
//2.根据请求计算相应
String response = process(request);
//3.把响应写回客户端
// 通过这种方式可以写回,但是这种方式不方便给返回的响应中添加\n
//outputStream.write(response.getBytes(), 0, response.getBytes().length);
// 也可以给outputStream套上一层,完成更方便的写入.
PrintWriter printWriter = new PrintWriter(outputStream);
printWriter.println(response);
//这里还需要加一个"刷新缓冲区"的操作
printWriter.flush();
//日志,打印当前的请求详细.
System.out.printf("[%s:%d] req: %s, resq: %s\n", clientSocket.getInetAddress(),
clientSocket.getPort(), request, response);
}
} catch (IOException e) {
e.printStackTrace();
} finally {
//在finally中加上close操作,确保当前socket被正确关闭
/*
tcp的clientSocket是每个客户端都有一个.随着客户端
越来越多.这里消耗的socket也会越来越多(如果不释放,就可能把文件操作符表占满)
*/
try {
clientSocket.close();
} catch (IOException e) {
e.printStackTrace();
}
}
}
private String process(String request) {
return request;
}
public static void main(String[] args) throws IOException {
TcpEchoServer server = new TcpEchoServer(9090);
server.start();
}
}
Tcp Echo Client
import java.io.IOException;
import java.io.InputStream;
import java.io.OutputStream;
import java.io.PrintWriter;
import java.net.Socket;
import java.util.Scanner;
public class TcpEchoClient {
private Socket socket = null;
//要和服务器通信, 就需要先知道,服务器所在的位置
public TcpEchoClient(String serverIp, int serverPort) throws IOException {
//这个new操作完成之后,就完成了tcp连接的建立
socket = new Socket(serverIp, serverPort);
}
public void start() {
System.out.println("客户端启动!");
try (InputStream inputStream = socket.getInputStream();
OutputStream outputStream = socket.getOutputStream()) {
Scanner scannerConsole = new Scanner(System.in);
Scanner scannerNetwork = new Scanner(inputStream);
PrintWriter printWriter = new PrintWriter(outputStream);
while(true) {
//1.从控制台中读取字符串
System.out.println("->");
if(!scannerConsole.hasNext()) {
break;
}
String request = scannerConsole.next();
//2.把请求发给服务器
//使用println带上换行, 后续服务器读取请求,就使用scanner.next()读取
printWriter.println(request);
printWriter.flush();
// 不要忘记flush, 确保数据是真的发出去了
//3.从服务器中读取响应
String response = scannerNetwork.next();
//4.把响应打印出来
System.out.println(response);
}
} catch (IOException e) {
e.printStackTrace();
}
}
public static void main(String[] args) throws IOException {
TcpEchoClient client = new TcpEchoClient("127.0.0.1", 9090);
client.start();
}
}
服务器引入多线程
如果只是单个线程,无法同时响应多个客户端.
虽然第二个客户端和服务器在内核层面上建立tcp连接了,但是应用程序这里无法把连接拿到应用程序里处理(人家给你打电话,电话一直响,但是不接)
这个问题,不是tcp引起的,而是因为代码结构不够好,两层循环所引起.UDP服务器只有一层循环.就不涉及该问题.之前UDP服务器天然可处理多个客户端请求.
所以主要的问题就是无法既能给客户端循环提供服务,又能去快速调用到第二个accept.
这时我们就想到了多线程的方法,此处给每个客户端都分配一个线程.
//启动服务器
public void start() throws IOException {
System.out.println("服务器启动!");
while(true) {
Socket clientSocket = serverSocket.accpet();
//每次来一个客户端,就创建一个新线程.每次走一个,就销毁一个线程
Thread t = new Thread(() -> {
//此时,就把processConnection交给新线程负责了.
//主循环就会快速执行完一次后,回到accept这里阻塞等待新的客户端来
processConnection(clientSocket);
});
t.start();
}
}
但是,我们不由得要思考一个新的问题,就是引入多线程,免不了频繁的线程销毁与创建,在资源申请与释放上开销比较大.所以有什么更好的方法可以解决呢>
服务器引入线程池
为了避免频繁创建销毁线程,也可以引入线程池.
//启动服务器
public void start() throws IOException {
System.out.println("服务器启动!");
ExecutorService service = Executors.newCachedThreadPool();
while(true) {
Socket clientSocket = serverSocket.accept();
//使用线程池来解决上述问题
service.submit(new Runnable() {
@Override
public void run() {
processConnection(clientSocket);
}
});
}
}
线程,解决的是线程的频繁销毁创建问题.如果,当前的场景是线程频繁的创建,而不是销毁呢?
就比如像游戏服务器这种,服务器可能处理的时间非常长.
此时如果继续使用线程池/多线程,就会导致服务器一下积累大量线程,对于服务器的负担也非常重.
长短连接
TCP发送数据时,需要先建立连接,什么时候关闭连接就决定是长连接还是短连接:
短连接:每次接收到数据并返回响应后,都关闭连接,即是短连接.也就是说,短连接只能一次收发数据.
长连接:不关闭连接,一直保持连接状态,双方不停的收发数据,即是长连接.也就是说, 长连接可以多次收发数据.
对比以上长短连接,两者区别如下:
建立连接,关闭连接的耗时:短连接每次请求,响应都需要建立连接,关闭连接;而长连接只需要第一次建立连接,之后的请求,响应都可以直接传输.相对来说建立连接,关闭连接也是要耗时的,长连接效率更高.
主动发送请求不同:短连接一般是客户端主动向服务端发送请求;而长连接可以是客户端主动发送请求,也可以是服务端主动发.
两者的使用场景不同:短连接使用于客户端请求频率不高的场景,如浏览网页等.长连接适用于客户端和服务端通信频繁的场景,如聊天室,实时游戏等.
扩展了解:
基于BIO(同步阻塞IO)的长连接会一直占用系统资源.对于并发很高的服务端系统来说,这样的消耗是不能承受的.
由于每个连接都需要不停的阻塞等待接收数据,所以每个连接都会在一个线程中运行.
一次阻塞等待对应着一次请求,响应,不停处理也就是长连接的特性:一直不关闭连接,不停的处理请求.
实际应用时,服务端一般是基于NIO(即同步非阻塞IO)来实现长连接,性能可以极大的提升.