안녕하세요! RyuWoong입니다.
Web Perfomance를 위해서는 브라우저에서 웹페이지를 보여줄때 어떠한 과정을 거치고, 무엇 때문에 Web Perfomance에 영향을 주는지 알 필요가 있겠죠?
Web Perfomance를 위해서는 빠른로드, 상호작용이 원활한 콘텐츠로 이루어진 웹 경험 두 가지의 목표 달성이 중요합니다. 실제 성능 및 체감되는 성능을 향상 시키는 방법을 이해하기 위해서는 브라우저가 어떻게 동작하는지 알아봅시다!
개요.
빠른 사이트는 더 좋은 사용자 경험을 제공합니다. 사용자는 로드가 빠르고 상호작용이 원활한 콘텐츠로 이루어진 웹 경험을 원합니다.
웹 성능에 있어서 두 가지 주요한 문제는 지연시간과 브라우저가 대부분 싱글 스레드로 동작한다는 것입니다.
이를 다른 말로 한다면 빠른 로딩과 렌더링 최적화가 필요하다고 할 수 있습니다.
탐색(Navigation)
탐색은 웹페이지를 로딩하는 첫 단계입니다. 사용자가 URL을 주소창에 입력하거나, 링크를 클릭하거나 폼을 제출하는 등의 동작을 통해 요청을 보낼때 마다 발생합니다.
DNS 조회(DNS LookUp)
웹페이지를 탐색하는 첫번째 단계는 해당 페이지에 요청하기 위한 주소를 찾는 것입니다. 예를 들어 https://example.com 에 접속했을 때, 이 사이트를 처음 방문 했다면 DNS 조회가 필요합니다.
DNS 조회는 네임서버에 https://exaple.com의 실 주소(IP)를 요청합니다. 쉽게 비유하자면, 전화번호부와 유사합니다. 동생에게 연락을 하고 싶다면 전화번호부에서 동생을 찾아 함께 적혀있는 전화번호를 확인해서 연락을 할 수 있듯이, 도메인으로 IP를 찾는 과정이라고 할 수 있습니다.
이렇게 전달 받은 IP는 일정 기간 동안 Cache됩니다. 따라서 해당 도메인으로 요청시 캐시된 IP 주소가 있다면 네임 서버에 다시 요청하는 대신 바로 요청할 수 있으므로 요청 시간이 빨라집니다.
모바일 네트워크인 경우.
사용자가 모바일 환경에 있을 때, DNS 조회를 위해서는 Cell Tower → 통신사 → DNS 에 도달해야함으로, 각 거리에 따라 상당한 지연시간이 발생할 수도 있습니다.
TCP 핸드셰이크(TCP Handshake)
IP 주소를 알고난 후, 브라우저는 서버와 TCP 3방향 핸드세이크를 통해 연결합니다. 이 방식은 데이터를 전송하기 전에 통신하려는 두 주체가 TCP 소켓 연결을 위한 매개변수를 주고 받을 수 있도록 만들어졌습니다.
TCP 3방향 핸드셰이크는 “SYN-SYN-ACK” 로 불리기도 합니다. 두 컴퓨터간 TCP 세션을 연결하고 시작하기 위해서 TCP가 3개의 메세지를 전달합니다. 즉, 서버로 요청을 보내기전에 3번의 통신이 먼저 이루어진다는 의미입니다.
TLS 협상 (TLS Negotiation)
HTTPS를 이용한 보안성 있는 연결을 위해서는 또 다른 “핸드셰이크”가 필요합니다.
이 핸드셰이크는 통신 암호화에 쓰일 암호를 결정하고, 서버를 확인하고, 실제 데이터 전송 전에 안전한 연결이 이루어지도록 합니다. 이를 위해서 자원에 대한 실제 요청 전에 사용자와 서버를 3번 더 왕복해야합니다.
연결에 보안성을 더하는 것은 페이지 로딩을 더디게 하지만, 보안성 있는 연결은 지연시간이라는 비용을 낼 만큼 가치가 있습니다. 이후 브라우저와 웹서버 사이에 전송되는 데이터는 제 3자가 가로채더라도 해독될 수 없게 되기 때문입니다.
응답 (Response)
웹서버로 한 번 연결되고 나면, 브라우저는 유저 대신에 초기 HTTP Get Request를 보냅니다. 대게 HTML파일을 요청하는데, 서버가 요청을 받으면 관련 응답 헤더와 함께 HTML을 전달해줍니다.
이 초기 요청에 대한 응답은 수신된 첫 바이트 데이터를 포함하고 있습니다. Time to First Byte는 사용자가 요청을 보내고 HTML의 첫 패킷을 받는데 걸린 시간을 의미합니다. 첫 번째 컨텐츠 청크는 일반적으로 14KB 크기의 데이터 입니다.
TCP 슬로우 스타트 (TCP Slow Start) / 14kb rule
첫 응답 패킷은 14kb입니다. 이는 네트워크 통신 속도를 조절하는 알고리즘인 TCP 슬로우 스타트에 의해 정해진 것입니다. 슬로우 스타트는 네트워크 최대 대역폭을 파악 할 수 있을 때까지 점진적으로 데이터의 전송량을 증가시킵니다.
TCP 슬로우 스타트 방식에 따라 첫 패킷을 받고난 이후에 서버는 다음 패킷의 사이즈를 두 배인 28kb로 늘립니다. 뒤 이은 패킷의 크기도 미리 정의한 임계치에 다다르거나, 혼잡의 징후가 나타나기 전까지 2배씩 커집니다. TCP 슬로우 스타트는 혼잡을 피하기 위해서 네트워크의 용량에 적당한 전송 속도를 찾고자 점진적으로 속도를 높여나갑니다.
혼잡 제어(Congestion Control)
서버가 TCP 패킷으로 데이터를 보내고, 사용자와 클라이언트는 확인응답(acknowledgements, ACKs)을 보내면서 데이터의 수신을 확인해줍니다. 연결은 하드웨어나 네트워크 상태에 따라서 제한된 용량만을 가지고 있습니다. 만약 서버가 패킷을 너무 빠르게 보내게 되면, 그 패킷들은 무시될 것입니다. 즉 확인 응답이 없을 것입니다. 서버는 이를 누락된 확인 응답으로 파악합니다. 혼잡 제어 알고리즘은 보내진 패킷의 흐름과 확인 응답을 바탕으로 전송 속도를 결정합니다.
구문 분석(Parsing)
브라우저가 첫 번째 데이터의 청크를 받으면, 수신된 정보를 구문 분석하기 시작합니다. 구문 분석은 브라우저가 네트워크를 통해 받은 데이터를 DOM이나 CSSOM로 바꾸는 단계입니다. 이는 렌더러가 화면에 페이지를 그리는데 사용됩니다.
요청된 HTML 페이지의 크기가 초기 패킷의 크기인 14kb 보다 크더라도, 브라우저는 구문 분석을 시작하고 가지고 있는 데이터 수준에서 렌더링을 시도합니다. 이것이 웹 성능 최적화에서 브라우저가 페이지를 렌더링 하는데 필요한 모든 것, 아니면 적어도 페이지의 템플릿(첫 렌더링에 필요한 HTML이나 CSS)만이라도 첫 14kb에 포함해야하는 이유입니다. 하지만 화면에 렌더링하기 전에 HTML, CSS, Javascript를 구문 분석해야 합니다. 하지만 화면에 렌더링 하기 전에 HTML, CSS, Javascript를 구문 분석해야 합니다.
DOM 트리 구축(Building the DOM tree)
첫번째는 HTML을 처리하여 DOM 트리를 만드는 일입니다. HTML 구문 분석은 토큰화와 트리 생성을 포함합니다. HTML 토큰은 시작 및 종료 태그 그리고 속성 이름 및 값을 포함합니다. 만약 문서가 잘 구성되어 있다면 구문 분석은 명확하고 빠르게 이루어집니다.
DOM 트리는 문서의 내용을 설명합니다. HTML 요소는 시작하는 태그이고 DOM 트리의 루트 노드입니다. 트리는 다른 태그간의 관계와 계층을 반영합니다. 다른 태그에 감싸져 있는 태그는 자식 노드입니다. DOM 노드의 개수가 많아질수록, DOM 트리를 만드는데 더 오랜 시간이 걸립니다.
구문을 분석하면서 이미지와 같은 논 블로킹 자원을 발견하면, 브라우저는 해당 자원을 요청하고 분석을 계속합니다. 구문 분석은 CSS 파일을 만났을 때도 지속될 수 있습니다. 하지만 async나 defer같은 설정이 되어있지 않은 <script> 태그는 렌더링을 막고, HTML의 분석을 중지시킵니다. 브라우저의 프리로드 스캐너가 이 작업에 도움을 주지만, 많은 스크립트는 로딩을 느리게 만드는 요인이 될 수 있습니다.
프리로드 스캐너(Preload Scanner)
브라우저가 DOM 트리를 만드는 프로세스는 메인 쓰레드를 차지합니다. 그렇기 때문에, 프리로드 스캐너 는 사용 가능한 컨텐츠를 분석하고 CSS나 Javscript, 웹 폰트 같이 우선순위가 높은 자원을 요청합니다. 프리로드 스캐너 덕에 구문 분석 중에 외부 자원에 대한 참조를 찾아 요청하는 것을 기다리지 않아도 됩니다. 프리로드 스캐너가 자원을 뒤에서 ‘미리’ 요청합니다. 구문 분석 중 해당 자원에 다다를때면 이미 그 자원은 전송 받고 있거나 이미 전송 받은 후 일 겁니다.
<link rel="stylesheet" src="styles.css" />
<script src="myscript.js" async></script>
<img src="myimage.jpg" alt="image description" />
<script src="anotherscript.js" async></script>
위 예제처럼 메인 스레드가 HTML과 CSS를 분석하고 있을 때, 프리로드 스캐너는 스크립트와 이미지를 찾아 먼저 다운로드하기 시작할 것입니다. Javascript의 분석과 실행 순서가 중요하지 않고 스크립트가 프로세스를 막지 않도록 하려면 async속성이나 defer속성을 추가하여 동시에 다운 받거나, 다 받은 후 받게 설정 할 수 있습니다.
CSSOM 구축
두번째는 CSS를 처리하고 CSSOM 트리를 만드는 것입니다. CSS 객체 모델은 DOM과 비슷합니다. DOM과 CSSOM은 둘 다 트리구조이며 각각의 독립적인 자료구조 입니다. 브라우저는 CSS 규칙을 이해할 수 있고 작업을 진행할 수 있도록 스타일 맵으로 변환합니다. 브라우저는 CSS에 있는 각각의 규칙을 읽고, 트리 노드를 만듭니다.
CSSOM 트리는 사용자 에이전트의 스타일 시트(각 브라우저가 정해놓은 CSS 기본 규칙)를 포함합니다. 브라우저는 노드에 적용 가능한 가장 일반적인 규칙부터 적용합니다. 그리고 재귀적으로 더 구체적으로 적용된 규칙에 따라 스타일을 수정해갑니다. 다른 말로, 속성 값을 Casecade해 나갑니다.
CSSOM을 만드는 것은 매우 매우 빠릅니다. 개발자 도구에서 "스타일 재계산"에는 CSS를 구문 분석하고, CSSOM 트리를 만들고, 계산된 스타일을 재귀적으로 계산하는데 드는 총 시간이 표시됩니다. CSSOM을 만드는데 드는 시간은 일반적으로 한 번의 DNS 조회를 하는 시간보다 짧기 때문에 웹 성능 최적화의 관점에서 CSSOM을 최적화하는 것은 성능 향상에 대해 극적인 모습을 보기 어렵습니다.
남은 작업들 (Other Processes)
Javascript 컴파일(JavaScript Compilation)
CSS가 분석되고 CSSOM이 생성되는 동안, 프리 스캐너 덕에 Javascript 파일 같은 다른 자원도 다운로드 됩니다. 다운로드 된 Javascript는 해석 → 컴파일 → 구문 분석 → 실행됩니다. 스크립트는 추상 구문 트리로 구문 분석됩니다. 분석이 완료되면 메인 쓰레드에서 실행되는 바이트코드가 생성됩니다.
접근성 트리 구축(Building the Accessibility Tree)
브라우저는 접근성 트리를 만듭니다. 보조 장치는 이 트리를 이용해 내용을 분석하고 해석합니다. 접근성 객체 모델(AOM)은 DOM의 의미 버전입니다. 브라우저는 DOM이 업데이트 될 때 접근성 트리도 업데이트 합니다. 접근성 트리는 보조 기술 자체적으로 수정될 수는 없습니다.
AOM이 만들어지기 전까지 스크린리더는 컨텐츠에 접근 할 수 없습니다.
렌더(Render)
렌더링 과정에는 스타일, 레이아웃, 페인트 그리고 때로 합성이 포함됩니다. CSSOM과 DOM 트리는 구문 분석되는 과정에서 생성되고 렌더 트리로 합성됩니다. 렌더 트리는 보이는 요소의 레이아웃을 계산을 하고 요소를 화면에 페인트합니다. 어떤 경우에는 컨텐츠가 자신만의 레이어를 가지도록 조작되고, 나중에 합성됩니다. 화면의 일부분을 CPU 대신 GPU가 그리면서 메인 쓰레드의 부담이 줄고 성능이 향상됩니다.
스타일(Style)
세 번째 단계는 DOM과 CSSOM을 합쳐 렌더 트리를 만드는 것입니다. 계산된 스타일 트리(렌더 트리)는 DOM 트리의 루트부터 시작하여 눈에 보이는 노드를 순회하며 만들어집니다. display: none 스타일 속성을 가진 요소와 같이, 화면에 나타나지 않는 태그의 경우 렌더링 결과에 나타나지 않을 것이기 때문에 렌터 트리에 포함되지 않습니다. visibility: hidden 속성을 가진 요소는 자리를 차지하기 때문에 렌더 트리에 포함됩니다.
각각의 보이는 노드는 그 노드에 적용된 CSSOM 규칙이 있습니다. 렌더 트리가 보이는 모든 노드의 내용과 계산된 스타일을 가지고 있습니다. DOM 트리에서 보이는 모든 노드에 관련된 스타일을 모두 맞춰보고, CSS 캐스케이드 방식에 따라서 각 노드의 계산된 스타일이 무엇일지 결정합니다.
레이아웃(Layout)
네 번째 단계는 렌더 트리를 기반으로 각 노드의 도형 값을 계산하기 위해 레이아웃을 실행하는 것입니다.
레이아웃은 렌더 트리에 있는 모든 노드의 너비, 높이, 위치를 결정하는 프로세스입니다. 추가로 페이지에서 각 객체의 크기와 위치를 계산합니다. 리플로우 는 레이아웃 이후에 있는 페이지의 일부분이나 전체 문서에 대한 크기나 위치에 대한 결정입니다.
렌더 트리가 만들어지고 나면, 레이아웃이 시작됩니다. 브라우저는 각 객체의 정확한 크기와 위치를 결정하기 위해서 렌더 트리의 루트 노드부터 시작하여 순회합니다.
웹페이지는 대부분 박스 형태이며, 다른 기기, 다른 설정은 제한 없이 매우 다양한 뷰 포트 크기를 가집니다. 레이아웃 단계에서 뷰 포트의 크기를 고려합니다. 브라우저는 화면에 표시될 모든 다른 상자의 크기를 결정합니다. 뷰 포트의 크기를 기본으로하며, 레이아웃은 일반적으로 본문에서 시작해 모든 후손의 크기를 각 요소의 박스 모델 속성을 통해 계산합니다. 이미지와 같이 크기를 모르는 요소를 위해서 위치 표시 공간을 남겨둡니다.
페인트(Paint)
마지막 단계는 각 노드를 화면에 페인팅하는 것입니다.
페인팅이 처음 일어나는 것을 첫 번째 의미있는 페인트라고 부릅니다. 페인팅 혹은 레지스터화 단계에서, 브라우저는 레이아웃 단계에서 계산된 각 박스를 실제 화면의 픽셀로 변환합니다. 페인팅에서 텍스트, 색깔, 경계, 그림자 및 버튼이나 이미지 같은 대체 요소를 포함하여 모든 요소의 시각적인 부분을 화면에 그리는 작업이 포함됩니다. 브라우저는 이 작업을 매우 빠르게 해야합니다.
부드러운 스크롤이나 애니메이션을 위해서, 스타일 계산, 리플로우, 페인팅과 같이 메인 쓰레드를 점유하는 모든 작업은 브라우저를 16.67ms 미만만 차지해야만 합니다. 2048 X 1536 화면에서 iPad는 화면에 페인트해야 할 3,145,000 픽셀을 가지고 있습니다. 이는 매우 많은 픽셀이며, 이 픽셀은 매우 빠르게 페인팅되어야 합니다. 첫 페인팅보다 다시 페인팅하는 것이 더 빠르게 마무리되기 위해서, 화면에 그리는 작업은 일반적으로 몇 개의 레이어로 구분됩니다. 그 다수의 레이어를 다루며 렌더링을 하기 위해 합성이 필요합니다.
페인팅은 레이아웃 트리의 요소를 레이어로 분리할 수 있습니다. 컨텐츠를 CPU의 메인 쓰레드에서 GPU 레이어로 격상하는 것은 페인트 및 리페인트 성능을 높입니다. 레이어를 가동시키는 구체적인 속성과 요소가 있습니다. 요소에는 <video> 그리고 <canvas>가 포함되어 있습니다. 구체적인 속성에는 opacity, 3D transform, will-change 등이 있습니다. 자손 노드가 위의 이유 중 하나(혹은 여러 개)로 자신만의 레이어를 필요로 하는 것이 아니라면, 이 노드는 그들의 레이어에서 그들의 자손과 함께 그려집니다.
레이어는 성능을 향상시킵니다. 하지만 메모리 관리 측면에서 봤을 때는 비싼 작업입니다. 따라서 웹 성능 최적화 전략으로 과도하게 쓰이지는 않아야 합니다.
합성
문서의 각 섹션이 다른 레이어에서 그려질 때, 섹션을 겹쳐놓으면서 그것들이 올바른 순서로 화면에 그려지는 것과 정확한 렌더링을 보장하기 위해 합성이 필요합니다.
페이지가 계속해서 자원을 로드하면, 리플로우가 일어날 수 있습니다. 리플로우는 리페인트와 재합성을 일으킬 수 있습니다. 이미지의 사이즈를 미리 정해놨다면 리플로우는 필요하지 않을 것입니다. 그리고 리페인트 되야할 레이어만 다시 리페인트 하고 필요하다면 합성할 것입니다. 하지만 이미지 사이즈를 미리 정해놓지 않았다면, 이미지가 서버로부터 받아진 후, 렌더링 과정은 레이아웃 단계로 돌아가서 다시 시작됩니다.
상호 작용(Interactivity)
메인 쓰레드가 페이지를 그리는 것을 완료하면, 모든 것이 준비되었다고 생각할 수도 있습니다. 하지만 꼭 그렇지는 않습니다. 만약 지연된 Javascript를 다운했다면, 그리고 onload 이벤트가 발생할 때 코드가 실행된다면, 메인 쓰레드는 여전히 바쁠 것입니다. 그래서 스크롤링, 터치 등 다른 상호작용이 불가능 할 것입니다.
Time to Interactive(TTI)는 DNS 조회와 SSL 연결이 이루어지는 첫 요청부터 페이지가 상호작용할 준비가 될 때까지 얼마나 걸리는지를 측정하는 단위입니다. 첫 번째 콘텐츠가 포함된 페인트 이후 페이지가 사용자와의 상호작용에 50ms 이내로 응답할 때를 상호작용 가능한 시점으로 봅니다. 만약 메인 쓰레드가 구문 분석, 컴파일, Javascript 실행에 사용되고 있다면, 메인 쓰레드를 사용할 수 없고 따라서 사용자 상호작용에 50ms 이내로 적절하게 반응하지 못합니다.
참조.
'Programming > Web' 카테고리의 다른 글
Web Performance .03 중요 렌더링 과정 (0) | 2023.04.02 |
---|---|
Web Perfomance .01 Latency (0) | 2023.03.24 |
Web Performance .00 시작하기 전에 (0) | 2023.03.23 |
HTTP 그리고 1.0, 1.1, 2.0 (0) | 2023.03.15 |
웹표준과 웹접근성 (Web Standards & Web Accessibility) (0) | 2023.03.11 |
삽질의 기록과 일상을 남기는 블로그입니다. 주로 React Native를 다룹니다.
포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!