Linux에서(내 라이브 서버는 RHEL 5.5에 있습니다. 아래 LXR 링크는 해당 커널 버전입니다) 다음과 같이 man 7 ip
말합니다.
SO_REUSEADDR 플래그가 설정되지 않으면 바인드된 TCP 로컬 소켓 주소는 닫힌 후 일정 기간 동안 사용할 수 없습니다.
을(를) 사용하지 않았습니다 SO_REUSEADDR
. "기간"은 얼마나 되나요? 얼마나 오래 지속되는지, 어떻게 변경하는지 어떻게 알 수 있나요?
나는 이 문제를 인터넷 검색하여 몇 가지 정보를 찾았지만 그 중 어느 것도 애플리케이션 프로그래머의 관점에서 실제로 이것을 설명하지 못했습니다. 재치 있게:
- TCP_TIMEWAIT_LENin은
net/tcp.h
"TIME-WAIT 상태를 파괴하기 전에 기다려야 하는 시간"이며 "약 60초"로 고정되어 있습니다. - /proc/sys/net/ipv4/tcp_fin_timeout"소켓이 우리 쪽에서 닫힌 경우 소켓을 FIN-WAIT-2 상태로 유지하는 시간"이고 "기본값은 60초"입니다.
내가 겪고 있는 어려움은 TCP 수명 주기의 커널 모델과 프로그래머의 포트 비가용성 모델 사이의 격차를 해소하는 것, 즉 이러한 상태가 "언젠가"와 어떻게 관련되는지 이해하는 것입니다.
답변1
프로그램에서 소켓을 사용할 수 없도록 만드는 아이디어는 아직 전송 중인 모든 TCP 세그먼트가 도착하여 커널에 의해 삭제되도록 허용하는 것입니다. 즉, 응용 프로그램이 close(2)
소켓을 호출할 수 있지만 라우팅 지연이나 제어 패킷 결함으로 인해 TCP 연결의 다른 쪽 끝에서 일시적으로 데이터를 보낼 수 있습니다. 애플리케이션은 더 이상 TCP 세그먼트를 처리하지 않겠다고 표시했으므로 커널은 TCP 세그먼트가 들어오면 이를 폐기해야 합니다.
나는 시간 초과를 확인하기 위해 컴파일하고 사용할 수 있는 작은 프로그램을 C로 작성했습니다.
#include <stdio.h> /* fprintf() */
#include <string.h> /* strerror() */
#include <errno.h> /* errno */
#include <stdlib.h> /* strtol() */
#include <signal.h> /* signal() */
#include <sys/time.h> /* struct timeval */
#include <unistd.h> /* read(), write(), close(), gettimeofday() */
#include <sys/types.h> /* socket() */
#include <sys/socket.h> /* socket-related stuff */
#include <netinet/in.h>
#include <arpa/inet.h> /* inet_ntoa() */
float elapsed_time(struct timeval before, struct timeval after);
int
main(int ac, char **av)
{
int opt;
int listen_fd = -1;
unsigned short port = 0;
struct sockaddr_in serv_addr;
struct timeval before_bind;
struct timeval after_bind;
while (-1 != (opt = getopt(ac, av, "p:"))) {
switch (opt) {
case 'p':
port = (unsigned short)atoi(optarg);
break;
}
}
if (0 == port) {
fprintf(stderr, "Need a port to listen on\n");
return 2;
}
if (0 > (listen_fd = socket(AF_INET, SOCK_STREAM, 0))) {
fprintf(stderr, "Opening socket: %s\n", strerror(errno));
return 1;
}
memset(&serv_addr, '\0', sizeof(serv_addr));
serv_addr.sin_family = AF_INET;
serv_addr.sin_addr.s_addr = htonl(INADDR_ANY);
serv_addr.sin_port = htons(port);
gettimeofday(&before_bind, NULL);
while (0 > bind(listen_fd, (struct sockaddr *)&serv_addr, sizeof(serv_addr))) {
fprintf(stderr, "binding socket to port %d: %s\n",
ntohs(serv_addr.sin_port),
strerror(errno));
sleep(1);
}
gettimeofday(&after_bind, NULL);
printf("bind took %.5f seconds\n", elapsed_time(before_bind, after_bind));
printf("# Listening on port %d\n", ntohs(serv_addr.sin_port));
if (0 > listen(listen_fd, 100)) {
fprintf(stderr, "listen() on fd %d: %s\n",
listen_fd,
strerror(errno));
return 1;
}
{
struct sockaddr_in cli_addr;
struct timeval before;
int newfd;
socklen_t clilen;
clilen = sizeof(cli_addr);
if (0 > (newfd = accept(listen_fd, (struct sockaddr *)&cli_addr, &clilen))) {
fprintf(stderr, "accept() on fd %d: %s\n", listen_fd, strerror(errno));
exit(2);
}
gettimeofday(&before, NULL);
printf("At %ld.%06ld\tconnected to: %s\n",
before.tv_sec, before.tv_usec,
inet_ntoa(cli_addr.sin_addr)
);
fflush(stdout);
while (close(newfd) == EINTR) ;
}
if (0 > close(listen_fd))
fprintf(stderr, "Closing socket: %s\n", strerror(errno));
return 0;
}
float
elapsed_time(struct timeval before, struct timeval after)
{
float r = 0.0;
if (before.tv_usec > after.tv_usec) {
after.tv_usec += 1000000;
--after.tv_sec;
}
r = (float)(after.tv_sec - before.tv_sec)
+ (1.0E-6)*(float)(after.tv_usec - before.tv_usec);
return r;
}
나는 이 프로그램을 3개의 다른 컴퓨터에서 시도했고 커널이 루트가 아닌 사용자가 소켓을 다시 여는 것을 허용하지 않을 때 55초에서 59초 사이의 가변적인 시간을 얻었습니다. 위의 코드를 "opener"라는 실행 파일로 컴파일하고 다음과 같이 실행했습니다.
./opener -p 7896; ./opener -p 7896
다른 창을 열고 다음을 수행했습니다.
telnet otherhost 7896
이로 인해 "opener"의 첫 번째 인스턴스가 연결을 수락한 다음 닫습니다. "opener"의 두 번째 인스턴스는 bind(2)
매초 TCP 포트 7896에 액세스하려고 시도합니다. "opener"는 55~59초의 지연을 보고합니다.
인터넷 검색 후 다음과 같은 제안을 하는 사람들을 발견했습니다.
echo 30 > /proc/sys/net/ipv4/tcp_fin_timeout
이 간격을 줄이기 위해. 이것은 나에게 효과가 없습니다. 내가 액세스할 수 있는 4개의 Linux 머신 중 2개는 30개, 2개는 60개입니다. 또한 값을 10으로 낮게 설정했습니다. "오프너" 프로그램과 차이가 없습니다.
이 방법:
echo 1 > /proc/sys/net/ipv4/tcp_tw_recycle
그것은 상황을 변화시킵니다. 두 번째 "오프너"는 새 소켓을 얻는 데 약 3초밖에 걸리지 않았습니다.