[HTTP 완벽가이드] 01. HTTP 개관

[웹 클라이언트와 서버]

웹 서버는 인터넷의 데이터를 저장하고, HTTP 클라이언트가 요청한 데이터를 제공한다.

클라이언트는 서버에게 HTTP 요청을 보내고, 서버는 요청된 데이터를 HTTP 응답으로 돌려준다. 

 

 

[리소스]

웹 서버는 웹 리소스를 관리하고 제공한다. 웹 리소스는 웹에 콘텐츠를 제공하는 모든 것을 말한다.

리소스는 정적일 수 있지만 동적일 수도 있다. 

 

1) 미디어 타입

인터넷은 수천가지 데이터 타입을 다루므로, 웹서버는 모든 HTTP 객체 데이터에 MIME 타입이라는 데이터 포맷 라벨을 붙인다.

웹 브라우저는 서버로부터 객체를 응답받을 때, 다룰 수 있는 객체인지 MIME 타입을 통해서 확인할 수 있다.

웹 서버는 데이터 콘텐츠와 함께 MIME 타입을 보내준다.

MIME(Multipurpose Internet Mail Extensions) 타입은 사선(/)으로 구분된 주 타입과 부타입으로 이루어진 문자열 라벨이다.

➡️ 예시 text/html, text/plain, image/jpeg, image/gif, video/quicktime, application/vnd.ms-powerpoint

 

2) URI

웹 서버 리소스는 각자 이름을 가지고 있기 때문에 클라이언트는 관심 있는 리소스를 지목할 수 있다.

서버 리소스는 URI로 불리며, 정보 리소스를 고유하게 식별하고 위치를 지정할 수 있다.

URI는 프로토콜, 서버, 리소스를 명시한다.

 

3) URL

통합 자원 지시자(URL)는 리소스 식별자의 가장 흔한 형태이며, 특정 서버의 한 리소스에 대한 구체적인 위치를 서술한다.

 

URL은 세 부분으로 이루어진 표준 포맷을 따른다.

1. 스킴(Scheme): 리소스에 접근하기 위해 사용되는 프로토콜

2. 서버의 인터넷 주소 ex) www.joes-hardware.com 

3. 웹 서버의 리소스 ex) /specials/saw-blade.gif

 

대부분의 URI는 URL이다.

 

4) URN

유니폼 리소스 이름(URN)은 콘텐츠를 이루는 한 리소스에 대해, 그 리소스의 위치에 영향 받지 않는 유일무이한 이름 역할을 한다.

리소스가 그 이름을 변하지 않게 유지하는 한, 여러 종류의 네트워크 프로토콜로 접근해도 문제 없다.

 

 

[트랜잭션]

HTTP 트랜잭션은 요청 명령응답 결과로 구성되어 있다.

이 상호작용은 HTTP 메시지라고 불리는 정형화된 데이터 덩어리를 이용해 이뤄진다.

1) 메서드

HTTP는 HTTP 메서드라고 불리는 여러 가지 종류의 요청 명령을 지원한다.

모든 HTTP 요청 메시지는 한 개의 메서드를 가지며, 메서드는 서버에게 어떤 동작이 취해져야 하는지 말해준다.

 

주요 HTTP 메서드

HTTP 메서드 설명
GET 서버에서 클라이언트로 지정한 리소스를 보내라
PUT 클라이언트에서 서버로 보낸 데이터를 지정한 이름의 리소스로 저장하라
DELETE 지정한 리소스를 서버에서 삭제하라
POST 클라이언트 데이터를 서버 게이트웨이 애플리케이션으로 보내라
HEAD 지정한 리소스에 대한 응답에서, HTTP 헤더 부분만 보내라

 

 

2) 상태코드

모든 HTTP 응답 메시지는 상태 코드와 함께 반환된다. 

상태 코드는 클라이언트에게 요청이 성공했는지, 추가 조치가 필요한지 알려주는 3 자리 숫자다.

 

3) 웹 페이지는 여러 객체로 이루어질 수 있다.

애플리케이션은 보통 하나의 작업을 수행하기 위해 여러 HTTP 트랜잭션을 수행한다

 

[메시지]

HTTP 메시지는 단순한 줄 단위의 문자열이며,
클라이언트에서 서버로 보낸 HTTP 메시지를 요청 메시지, 서버에서 클라이언트로 보낸 HTTP 메시지를 응답 메시지라고 부른다.

HTTP 메시지는 단순한 줄 단위 텍스트 구조를 갖고 있다.

 

HTTP 메시지는 3 부분으로 이루어진다.

1. 시작줄 - 요청인 경우 무엇을 해야하는지, 응답인 경우 무슨 일이 일어났는지 나타낸다.

2. 헤더 - 각 헤더 필드는 구문 분석을 위해 키:값 형태로 구성되어 있다. 헤더는 빈 줄로 끝난다.

3. 본문 - 헤더의 빈 줄 다음에 어떤 종류의 데이터든 들어갈 수 있는 메시지 본문이 필요에 따라 들어올 수 있다. 시작줄, 헤더와 달리 본문은 임의의 이진 데이터를 포함할 수 있다.

 

[TCP 커넥션]

 

1) TCP/IP

HTTP는 애플리케이션 계층 프로토콜이므로, 네트워크 통신의 핵심적인 세부사항에 대해서 신경쓰지 않는다. 세부사항은 TCP/IP에게 맡긴다. 

 

HTTP 네트워크 프로토콜 스택

 

TCP는 다음과 같은 서비스를 제공한다.

1. 오류 없는 데이터 전송

2. 순서에 맞는 전달 (데이터는 언제나 보낸 순ㄴ서대로 도착한다)

3. 조각나지 않는 데이터 스트림(언제든 어떤 크기로든 보낼 수 있다.)

 

TCP/IP는 패킷 교환 네트워크 프로토콜의 집합이며, 각 네트워크와 하드웨어의 특성을 숨기고, 어떤 종류의 컴퓨터나 네트워크든 서로 신뢰성있는 의사소통을 하게 해준다.

 

2) 접속, IP 주속 그리고 포트번호

HTTP 클라이언트가 서버에 메시지를 전송하려면, IP 주소와 포트번호를 사용해 클라이언트와 서버 사이에 TCP/IP 커넥션을 맺어야 한다.

 

HTTP 서버의 IP 주소와 포트번호를 사용할 때는 URL을 이용하면 된다. 이를 이용하여 클라이언트는 TCP/IP로 쉽게 통신할 수 있다.

 

HTTP를 이용하여 서버의 HTML 리소스를 사용자에게 보내주는 순서

a. 브라우저는 서버으 URL에서 호스트명을 추출

b. 브라우저는 서버의 호스트명을 IP로 변환

c. 브라우저는 URL에서 포트번호를 추출

d. 브라우저는 웹 서버와 TCP 커넥션을 맺음

e. 브라우저는 서버에 HTTP 요청을 보냄

f. 서버는 브라우저에 HTTP 응답을 돌려줌

g. 커넥션이 닫히면 브라우저는 문서를 보여준다.

 

[프로토콜 버전]

HTTP 프로토콜의 버전들

1. HTTP/0.9

2. HTTP/1.0

3. HTTP/1.0+

4. HTTP/1.1

5. HTTP/2.0

 

[웹의 구성요소]

1) 프락시

클라이언트와 서버 사이에 위치한 HTTP 중개자이며, 클라이언트의 모든 HTTP 요청을 받아 서버에 전달한다. 

애플리케이션은 사용자를 위한 프락시로 동작하며 사용자를 대신하여 서버에 접근한다.

 

프락시는 주로 보안을 위해 사용된다. 웹 트래픽 흐름 속에서 신뢰할만한 중개자 역할을 한다. 

또한, 요청과 응답을 필터링할 수 있다.

프락시는 클라이언트와 서버 사이에서 트래픽을 전달한다.

 

2) 캐시

웹  캐시와 캐시 프락시는 자신을 거쳐가는 문서들 중 자주 찾는 것의 사본을 저장해두는 특별한 종류의 HTTP 프라시 서버다.

클라이언트가 다음에 같은 문서를 요청하면 그 캐시가 갖고 있는 사본을 받을 수 있다.

캐시 프락시는 성능 향상을 위해 자주 찾는 문서의 사본을 저장해둔다.

 

3) 게이트웨이

게이트웨이는 다른 서버들의 중개자로 동작하는 특별한 서버다. 게이트웨이는 주로 HTTP 트래픽을 다른 프로토콜로 변환하기 위해 사용된다. 게이트웨이는 언제나 스스로가 리소스를 갖고 있는 진짜 서버인 것처럼 요청을 다룬다.

HTTP/FTP 게이트웨이

 

4) 터널

터널은 두 커넥션 사이에서 raw 데이터를 열어보지 않고, 그대로 전달해주는 애플리케이션이다.

HTTP 터널은 주로 비 HTTP 데이터를 하나 이상의 HTTP 연결을 통해 그대로 전송해주기 위해 사용된다.

 

HTTP 터널을 활용되는 예시 - 암호화된 SSL 트래픽을 HTTP 커넥션으로 전송함으로써 웹 트래픽만 허용하는 사내 방화벽을 통과시키는 것

비 HTTP 네트워크 너머로 데이터를 전달하는 터널 (HTTP/SSL 터널)

 

5) 에이전트

사용자 에이전트는 사용자를 위해 HTTP 요청을 만들어주는 클라이언트 프로그램이다.