What happens when…
原文链接
原文简介
This repository is an attempt to answer the age old interview question “What happens when you type google.com into your browser’s address box and press enter?”
Except instead of the usual story, we’re going to try to answer this question in as much detail as possible. No skipping out on anything.
This is a collaborative process, so dig in and try to help out! There are tons of details missing, just waiting for you to add them! So send us a pull request, please!
This is all licensed under the terms of the Creative Commons Zero license.
正文
按键处理过程
按下”g”键(The “g” key is pressed)
以下内容介绍了物理键盘和操作系统中断的工作原理。
当你按下“g”键时,浏览器会接收到该事件,随后触发自动完成机制。浏览器根据自己的算法,以及你是否处于隐私浏览模式,浏览器会在浏览器的地址框下方给出输入建议。这些算法大部分会优先考虑搜索历史、书签、cookies以及整个互联网热门搜索的排序等内容给出建议。当你输入 “google.com”时,后台会有很多代码默默运行,随着每次按键都会使得给出的建议更加准确。甚至有可能在你输入之前,浏览器就将 “google.com” 建议给你。
回车键按下(The “enter” key bottoms out)
我们将键盘上的回车键按到最低处作为起点。此时,一个专门用于回车键的特有的电流回路被闭合(直接连接或电容器间接闭合)。这使得少量的电流流入键盘的逻辑电路,逻辑电路扫描每个按键开关的状态,对于按键开关的电位弹跳变化消除电噪声,并将其转换为键码整数,本例中回车码值为13。然后键盘控制器对键码进行编码,传送到计算机。现在几乎都是通过通用串行总线(USB)或蓝牙(Bluetooth)连接进行传输的,但以前一直是通过PS/2或ADB连接进行传输。
USB键盘:(In the case of the USB keyboard: )
- 键盘的USB电路由计算机的USB主机控制器的1号引脚提供的5V电源供电。
- 键码值存储在键盘内部电路存储在一个叫做”endpoint”的寄存器内。
- USB控制器大概每隔10ms便查询一次”endpoint”以得到存储的键码值数据,这个最短时间间隔由键盘提供。
- 键值码值通过USB串行接口引擎(USB SIE)被转换成一个或者多个遵循低层USB协议的USB数据包。
- 这些数据包通过D+针和D-针(中间的两个针)的差分电信号,以最高1.5Mb/s的速度从键盘传输至计算机。速度限制是因为人机交互设备(HID)总是被声明成”低速设备”(USB 2.0 compliance)。
- 这个串行信号在计算机的USB控制器处被解码,然后被人机交互设备(HID)通用键盘驱动进行进一步解释。之后按键的码值被传输到操作系统的硬件抽象层。
虚拟键盘(触屏设备):(In the case of Virtual Keyboard (as in touch screen devices): )
- 当用户把手指放在电容触摸屏上时,微弱的电流从传导层的静电域经过手指传导,形成了一个回路,使得屏幕上触控的那一点电压下降,屏幕控制器产生一个中断,报告这次“点击”的坐标。
- 然后移动操作系统通知当前活跃的应用,有一个点击事件发生在它的某个GUI部件上了,现在这个部件是虚拟键盘的按钮
- 虚拟键盘引发一个软中断,将“按键按下”的消息发送给操作系统(os)。
- 该中断会通知当前焦点应用程序一个“按键按下”事件。
产生中断[非USB键盘](Interrupt fires [NOT for USB keyboards])
键盘在它的中断请求线(IRQ)上发送信号,信号会被中断控制器映射到一个中断向量(整型数) 。CPU使用中断描述符表(IDT)将中断向量映射到由内核提供的函数(interrupt handlers)。当一个中断信号到达时,CPU根据中断向量索IDT引找到对应的中断处理器。这样就该内核上场了。
(Windows)一个 WM_KEYDOWN 消息被发往应用程序((On Windows) A WM_KEYDOWN message is sent to the app)
HID把键盘按下的事件传送给 KBDHID.sys 驱动程序,该驱动将HID的信号转换成一个扫描码(Scancode),这里回车的扫描码是 VK_RETURN(0x0d)。 KBDHID.sys 驱动和 KBDCLASS.sys (键盘类驱动,keyboard class driver)进行交互,这个驱动负责安全地处理所有键盘和小键盘的输入事件。之后它又去调用 Win32K.sys ,在这之前有可能把消息传递给安装的第三方键盘过滤器。这些都是发生在内核模式。
Win32K.sys 通过 GetForegroundWindow() API找到当前哪个窗口是活动窗口。这个API提供了当前浏览器的地址栏的句柄。Windows系统的 “message pump” 机制调用 SendMessage(hWnd, WM_KEYDOWN, VK_RETURN, lParam) 函数, lParam 是一个用来指示有关按键更多信息的掩码,这些信息包括按键重复次数(这里是0),实际扫描码(可能依赖于OEM厂商,不过通常不会是 VK_RETURN ),功能键(alt, shift, ctrl)是否被按下(在这里没有),以及一些其他状态。
Windows的 SendMessage API直接将消息添加到特定窗口句柄 hWnd 的消息队列中,之后赋给 hWnd 的主要消息处理函数 WindowProc 将会被调用,用于处理队列中的消息。
处于活跃状态的句柄 hWnd 实际上是一个edit control控件,这种情况下,WindowProc 有一个用于处理 WM_KEYDOWN 消息的消息处理器,消息处理器在监听到按键消息时会查看 SendMessage 传入的第三个参数 wParam ,因为这个参数是 VK_RETURN ,于是它知道用户按下了回车键。
(Mac OS X)一个 KeyDown NSEvent被发往应用程序((On OS X) A KeyDown NSEvent is sent to the app)
中断信号会触发 I/O Kit Kext 键盘驱动中的中断处理事件。驱动把信号翻译成键码值,然后传给 OS X 的 WindowServer 进程。然后, WindowServer 将这个事件通过 Mach 端口分发给合适的(活跃的,或者正在监听的)应用程序,并将其放到应用程序的事件消息队列里。随后,有足够权限的线程调用 mach_ipc_dispatch 函数从队列中读取事件。这个过程通常是由 NSApplication 主事件循环产生并通过 NSEventType KeyDown 的 NSEvent 来处理的。
(GNU/Linux)Xorg 服务器监听键码值((On GNU/Linux) the Xorg server listens for keycodes)
当使用图形界面的 X Server 时,X Server 会使用通用事件驱动 evdev 获取按键码值。X Server 按照特定的规则把键码值重新映射,映射成扫描码。当这个映射过程完成之后, X Server 把这个按键字符发送给窗口管理器(DWM,metacity, i3等等),窗口管理器再把字符发送给当前窗口。当前窗口使用有关图形API把文字符号打印在输入框内。
网络资源请求过程
我们这里将浏览器发起请求、DNS解析、服务器响应、浏览器渲染…做成一张图:
解析URL(Parse URL)
浏览器通过 URL 能够获得如下信息:
Protocol "http"
Resource "/"
输入的是 URL 还是搜索的关键字?(Is it a URL or a search term?)
当没有给出协议或有效的域名时,浏览器会将地址框中给出的文本输入到浏览器的默认网络搜索引擎。大部分情况下,在把文字传递给搜索引擎的时候,URL会带有特定的一串字符,用来告诉搜索引擎这次搜索来自这个特定浏览器。
转换非 ASCII 的 Unicode 字符(Convert non-ASCII Unicode characters in hostname)
- 浏览器检查主机名中是否含有非 a-z, A-Z,0-9, – 或者 . 的字符。
- 案例中主机名是 google.com ,所以没有非ASCII的字符;如果有的话,浏览器会对主机名部分使用 Punycode 编码。
检查 HSTS 列表(Check HSTS list)
- 浏览器检查自带的“预加载 HSTS(HTTP严格传输安全)”列表,这个列表里包含了那些只能使用HTTPS进行连接的网站。
- 如果网站在这个列表里,浏览器会使用 HTTPS 而不是 HTTP 协议,否则,最初的请求会使用HTTP协议发送。注意,网站不在HSTS列表中也可以使用HSTS策略。用户对网站的第一次HTTP请求会收到一个响应,要求浏览器只能使用 HTTPS 发送请求。然而,就是这第一个 HTTP 请求,却可能会使用户受到 downgrade attack 的威胁,这也是为什么现代浏览器都预置了 HSTS 列表。
DNS 查询(DNS lookup)
- 首先浏览器会检查域名是否在其缓存当中(要查看 Chrome 当中的缓存, 打开 chrome://net-internals/#dns)。
- 如果浏览器缓存中没有,就去调用 gethostbyname 库函数(操作系统不同函数也不同)进行查询。
- gethostbyname 函数在试图进行DNS解析之前,会检查域名是可以通过本地 Hosts 文件(其位置因操作系统而异)中的引用来解析。
- 如果 gethostbyname 没有这个域名的缓存记录,也没有在 hosts 里找到,它将会向网络栈中配置的 DNS 服务器发送一条 DNS 查询请求。通常是本地路由器或者 ISP 的缓存 DNS 服务器。
- 如果 DNS 服务器和我们的主机在同一个子网内,系统会按照下面的 ARP 过程对 DNS 服务器进行 ARP查询。
- 如果 DNS 服务器和我们的主机在不同的子网,系统会按照下面的 ARP 过程对默认网关进行查询。
ARP 过程(ARP process)
要想发送 ARP(地址解析协议)广播,我们需要有一个目标 IP 地址,同时还需要知道用于发送 ARP 广播的接口的 MAC 地址。
- 首先查询 ARP 缓存中是否有我们目标IP的ARP条目,如果缓存命中,我们返回结果:目标 IP = MAC
如果缓存没有命中:
- 查看路由表,看看目标 IP 地址是不是在本地路由表中的某个子网内。是的话,使用跟那个子网相连的接口,否则使用与默认网关相连的接口。
- 查询选择的网络接口的 MAC 地址。
- 我们发送一个二层( OSI 模型 中的数据链路层)ARP 请求:
ARP Request:
Sender MAC: interface:mac:address:here
Sender IP: interface.ip.goes.here
Target MAC: FF:FF:FF:FF:FF:FF (Broadcast)
Target IP: target.ip.goes.here
根据连接主机和路由器的硬件类型不同,可以分为以下几种情况:
- 直连:
- 如果计算机和路由器是直接连接的,路由器会返回一个 ARP Reply (见下面)。
- 集线器:
- 如果计算机连接到一个集线器,集线器会把 ARP 请求向所有其它端口广播,如果路由器也“连接”在其中,它会返回一个 ARP Reply 。
- 交换机:
- 如果计算机连接到了一个交换机,交换机会检查本地 CAM/MAC 表,看看哪个端口有我们要找的那个 MAC 地址,如果没有找到,交换机会向所有其它端口广播这个 ARP 请求。
- 如果交换机的 MAC/CAM 表中有对应的条目,交换机会向有我们想要查询的 MAC 地址的那个端口发送 ARP 请求
- 如果路由器也“连接”在其中,它会返回一个 ARP Reply
ARP Reply:
Sender MAC: target:mac:address:here
Sender IP: target.ip.goes.here
Target MAC: interface:mac:address:here
Target IP: interface.ip.goes.here
- 现在我们有了 DNS 服务器或者默认网关的 IP 地址,我们可以继续 DNS 请求了:
- 客户端使用>1023的源端口,向 DNS 服务器 53 端口发送 UDP 请求包,如果响应包太大,会使用 TCP 协议。
- 如果本地/ISP DNS 服务器没有找到结果,它会递归查询请求,一层一层向高层 DNS服务器做查询,直到查询到起始授权机构(SOA),如果找到会把结果返回。
使用套接字(Opening of a socket)
当浏览器得到了目标服务器的 IP 地址,以及 URL 中给出来端口号(http 协议默认端口号是 80, https 默认端口号是 443),它会调用系统库函数 socket ,请求一个 TCP流套接字,对应的参数是 AF_INET/AF_INET6 和 SOCK_STREAM 。
- 这个请求首先被交给传输层,在传输层请求被封装成 TCP segment。目标端口会被加入头部,并从操作系统内核的动态端口内(Linux下是ip_local_port_range)获取一个源端口。
- TCP segment 被发送到网络层,网络层会在其中再加入一个 IP 头部,里面包含了目标服务器的IP地址以及本机的IP地址,把它封装成一个IP packet。
- 接下来这个 TCP packet 到达链路层层,链路层会在封包中加入 frame 头部,里面包含了本地内置网卡的MAC地址以及网关(本地路由器)的 MAC 地址。像前面说的一样,如果内核不知道网关的 MAC 地址,它必须进行 ARP 广播来查询其地址。
到了现在,TCP 封包已经准备好了,可以使用下面的任意方式进行传输:
对于大部分家庭或小型企业的互联网连接,数据包会从本地计算机出发,经过本地网络,再通过调制解调器(MOdulator/DEModulator)把数字信号转换成模拟信号,使其适于在电话线路,有线电视光缆和无线电话线路上传输。在连接的另一端,是另外一个调制解调器,它把模拟信号转换回数字信号,交由下一个 网络节点(newwork node) 处理。节点的目标地址和源地址将在后面讨论。
大型企业和比较新的住宅通常使用光纤或直接以太网连接,这种情况下一直使用的是数字信号,会被直接传到下一个 网络节点 进行处理。
最终数据包会到达管理本地子网的路由器。从那里,它将经过自治区域(autonomous system, 缩写 AS)的边界路由器,其他自治区域,最终到达目标服务器。一路上经过的这些路由器会从IP数据报头部里提取出目标地址,并将其路由到相应的下一个跳(下一个目的地)。每经过一个路由器,IP数据报头部 time to live (TTL) 域的值就会减1,如果数据包的TTL变为0,或者路由器由于网络拥堵等原因队列满了,那么这个包会被路由器丢弃。
上面的发送和接受过程在 TCP 连接期间会发生很多次:
- 客户端选择一个初始序列号(ISN),将设置了 SYN 位的数据包发送给服务器端,表明自己要建立连接并设置了初始序列号。
- 服务器端接收到 SYN 包,如果它可以建立连接:
- 服务器端选择它自己的初始序列号
- 服务器端设置 SYN 位,表明自己选择了一个初始序列号(ISN)
- 服务器端把 (客户端ISN + 1) 复制到 ACK(acknowledgment number)字段,并添加ACK标志,以表明它接收到了客户端的第一个数据包
- 客户端通过发送下面一个数据包来确认这次连接:
- 自己的序列号+1
- 接收端 ACK+1
- 设置 ACK 位
- 数据通过下面的方式传输:
- 当一方发送了N个 Bytes 的数据之后,将自己的 SEQ 序列号也增加N
- 另一方确认接收到这个数据包(或者一系列数据包)之后,就会发送一个 ACK 包,ACK 的值设置为接收到的数据包的最后一个序列号
- 关闭连接时:
- 要关闭连接的一方发送一个 FIN 包
- 另一方确认这个 FIN 包,并且发送自己的 FIN 包
- 要关闭的一方使用 ACK 包来确认接收到了 FIN
TLS握手(TLS handshake)
- 客户端想服务器端发送一个 ClientHello 消息,消息中同时包含了它的 Transport Layer Security (TLS) 版本,可用的加密算法和压缩算法。
- 服务器端向客户端返回一个 ServerHello 消息,消息中包含了服务器端的TLS版本,服务器所选择的加密和压缩算法,以及数字证书认证机构(Certificate Authority,缩写 CA)签发的服务器公开证书,证书中包含了公钥。客户端会使用这个公钥加密接下来的握手过程,直到协商生成一个新的对称密钥。
- 客户端根据其可信CA列表验证服务器端的证书是否可信。如果认为可信,客户端会生成一串伪随机数,并用服务器的公钥加密它。这串随机数会被用于生成新的对称密钥。
- 服务器端使用自己的私钥解密客户端生成的随机,然后使用这串随机数生成自己的对称主密钥副本。
- 客户端向服务器端发送一个 Finished 消息,使用对称密钥加密这次通讯的一个散列值。
- 服务器端生成自己的 hash 值,然后解密客户端发送来的信息,检查这两个值是否匹配。如果匹配,就向客户端发送一个 Finished 消息,同样使用协商好的对称密钥加密。
- 从现在开始,TLS 会话都使用对称秘钥进行加密,传输应用层(HTTP)内容。
HTTP 协议(HTTP protocol)
如果浏览器是 Google 出品的,它不会使用 HTTP 协议来获取页面信息,而是会与服务器端发送请求,商讨使用 SPDY 协议。
如果浏览器使用 HTTP 协议而不支持 SPDY 协议,它会向服务器发送这样的一个请求:
GET / HTTP/1.1
Host: google.com
Connection: close
[其他头部]
其中“其他头部”包含了一系列的由冒号分割的键值对,其格式符合HTTP协议规范,它们之间由一个换行符分割开来。(这里我们假设浏览器没有违反HTTP协议标准的错误,同时假设浏览器使用 HTTP/1.1 协议,不然的话头部可能不包含 Host 字段,同时 GET 请求中的版本号会变成 HTTP/1.0 或者 HTTP/0.9 )。
HTTP/1.1 定义了“关闭连接”的选项 “close”,发送者使用这个选项指示这次连接在响应结束之后会断开。例如:
Connection:close
不支持持久连接的 HTTP/1.1 应用必须在每条消息中都包含 “close” 选项。
在发送完这些请求和头信息后,浏览器向服务器发送一个空的换行符,表示要请求的内容已经完成。
服务器端返回一个响应码,指示这次请求的状态,响应的形式是这样的:
200 OK
[响应头部]
然后是一个换行,接下来发送的是 www.google.com 的HTML内容。然后,服务器可能会关闭连接,或者,如果客户端请求保持连接的话,服务器端会保持连接打开,以供之后的请求重用。
如果浏览器发送的HTTP头部包含了足够多的信息(例如包含了 Etag 头部),以至于服务器可以判断出,浏览器缓存的文件版本自从上次获取之后没有再更改过,服务器可能会返回这样的响应:
304 Not Modified
[响应头部]
这个响应没有有效载荷,浏览器会从自己的缓存中取出想要的内容。
在解析完 HTML 之后,浏览器和服务器会重复上面的过程,直到HTML页面引入的所有资源(图片,CSS,favicon.ico等等)全部都获取完毕,区别只是头部的 GET / HTTP/1.1 会变成 GET /$(相对www.google.com的URL) HTTP/1.1 。
- GET /$(URL relative to www.google.com) HTTP/1.1.
如果HTML引入了 www.google.com 域名之外的资源,浏览器会回到上面解析域名那一步,并遵循该域名的所有步骤。请求中的 Host 头部会变成相应的域名。
HTTP 服务器请求处理(HTTP Server Request Handle)
HTTPD(HTTP Daemon)服务器在服务器端处理请求/响应的服务器。最常见的 HTTPD 服务器有 Linux 的 Apache 或 nginx,和 Windows 上的 IIS。
- HTTPD 接收请求。
- 服务器把请求拆分为以下几个参数:
- HTTP 请求方法(GET, POST, HEAD, PUT, DELETE, CONNECT, OPTIONS, 或者 TRACE)。直接在地址栏中输入 URL 这种情况下,使用的是 GET 方法。
- 域名,本例:google.com。
- 请求路径/页面,本例:/ (我们没有请求google.com下的指定的页面,因此 / 是默认的路径)
- 服务器验证其上已经配置了 google.com 的虚拟主机。
- 服务器验证 google.com 接受 GET 方法。
- 服务器验证该用户可以使用 GET 方法(根据 IP 地址,身份信息等)。
- 如果服务器安装了 URL rewrite module(例如 Apache 的 mod_rewrite 和 IIS 的 URL Rewrite),服务器会尝试匹配重写规则,如果匹配上的话,服务器会按照规则重写这个请求。
- 服务器去拉取与请求对应的内容,本例中访问路径是 “/” ,会访问首页文件(你可以重写这个规则,但是这个是最常用的)。
- 服务器会使用指定的处理程序分析处理这个文件,假如 Google 使用 PHP,服务器会使用 PHP 解析 index 文件,并把 PHP 的输出结果返回给请求者。
浏览器背后的故事(Behind the scenes of the Browser)
当服务器提供了资源之后(HTML,CSS,JS,图片等),浏览器会执行下面的操作:
- 解析 —— HTML,CSS,JS
- 渲染 —— 构建 DOM 树 -> 渲染 -> 布局 -> 绘制
浏览器(Browser)
浏览器的功能是从服务器上取回你想要的资源,然后展示在浏览器窗口当中。资源通常是 HTML 文件,也可能是 PDF,图片,或者其他类型的内容。资源的位置通过用户提供的 URI(Uniform Resource Identifier) 来确定。
浏览器解析和展示 HTML 文件的方法,由 HTML 和 CSS 的规范指定。这些标准由 W3C(World Wide Web Consortium) 维护。
不同浏览器的用户界面大都十分接近,有很多共同的 UI 元素:
- 一个地址栏
- 后退和前进按钮
- 书签选项
- 刷新和停止按钮
- 主页按钮
浏览器高层架构(Browser High Level Structure)
组成浏览器的组件有:
- 用户界面(User interface): 用户界面包含了地址栏,前进后退按钮,书签菜单等等,除了请求页面之外所有你看到的内容都是用户界面的一部分。
- 浏览器引擎(Browser engine): 浏览器引擎负责让 UI 和渲染引擎协调工作。
- 渲染引擎(Rendering engine): 渲染引擎负责展示请求内容。如果请求的内容是 HTML,渲染引擎会解析 HTML 和 CSS,然后将内容展示在屏幕上。
- 网络组件(Networking): 网络组件负责网络调用,例如 HTTP 请求等,使用一个平台无关接口,下层是针对不同平台的具体实现。
- UI后端(UI backend): UI 后端用于绘制基本 UI 组件,例如下拉列表框和窗口。UI 后端暴露一个统一的平台无关的接口,下层使用操作系统的 UI 方法实现。
- Javascript 引擎(JavaScript engine): Javascript 引擎用于解析和执行 Javascript 代码。
- 数据存储(Data storage): 数据存储组件是一个持久层。浏览器可能需要在本地存储各种各样的数据,例如 Cookie 等。浏览器也需要支持诸如 localStorage,IndexedDB,WebSQL 和 FileSystem 之类的存储机制。
HTML 解析(HTML parsing)
浏览器渲染引擎从网络层取得请求的文档,通常文档会被分成8kB大小的分块传输。
HTML 解析器的主要工作是对 HTML 文档进行解析,生成解析树。
解析树是一颗 DOM 元素以及属性为节点的树。DOM是文档对象模型(Document Object Model)的缩写,它是 HTML 文档的对象表示形式,同时也是 HTML 元素与外界(如Javascript)的接口。树的根部是”Document”对象。整个 DOM 和 HTML 文档几乎是一对一的关系。
解析算法(The parsing algorithm)
HTML不能使用常见的自顶向下或自底向上方法来进行分析。主要原因有以下几点:
- 语言本身的“宽容”特性。
- 浏览器具有容错机制来支持众所周知的无效HTML情况。
- 解析过程是可重入的。对于其他语言来说,源码不会在解析过程中发生变化,但是对于 HTML 来说,动态代码会添加额外的标记,例如脚本元素中包含的 document.write() 方法会在源码中添加内容,也就是说,解析过程实际上会改变输入的内容。
由于不能使用常用的解析技术,浏览器创造了专门用于解析 HTML 的解析器。解析算法在 HTML5 标准规范中有详细介绍,算法主要包含了两个阶段:标记化(tokenization)和树的构建。
解析结束之后(Actions when the parsing is finished)
浏览器开始加载网页的外部资源(CSS,图像,Javascript 文件等)。
此时浏览器把文档标记为可交互的(interactive),浏览器开始解析处于“推迟(deferred)”模式的脚本,也就是那些需要在文档解析完毕之后再执行的脚本。之后文档的状态会变为“完成(complete)”,浏览器会触发“加载(load)”事件。
注意解析 HTML 网页时永远不会出现“无效语法(Invalid Syntax)”错误,浏览器会修复所有错误内容,然后继续解析。
CSS 解析(CSS interpretation)
- 根据 CSS词法和句法 分析CSS文件和 “ 标签包含的内容以及 style 属性的值
- 每个CSS文件都被解析成一个样式表对象(StyleSheet object),这个对象里包含了带有选择器的CSS规则,和对应CSS语法的对象
- CSS解析器可能是自顶向下的,也可能是使用解析器生成器生成的自底向上的解析器
页面渲染(Page Rendering)
- 通过遍历DOM节点树创建一个“Frame Tree”或“Render Tree”,并计算每个节点的各个CSS样式值。
- 通过累加子节点的宽度,该节点的水平内边距(padding)、边框(border)和外边距(margin),自底向上的计算”Frame Tree”中每个节点的首选(preferred)宽度。
- 通过自顶向下的给每个节点的子节点分配可行宽度,计算每个节点的实际宽度。
- 通过应用文字折行、累加子节点的高度和此节点的内边距(padding)、边框(border)和外边距(margin),自底向上的计算每个节点的高度。
- 使用上面的计算结果构建每个节点的坐标。
- 当存在元素使用 floated,位置有 absolutely 或 relatively 属性的时候,会有更多复杂的计算,详见http://dev.w3.org/csswg/css2/ 和 http://www.w3.org/Style/CSS/current-work
创建layer(层)来表示页面中的哪些部分可以成组的被绘制,而不用被重新栅格化处理。每个帧对象都被分配给一个层。 - 页面上的每个层都被分配了纹理。
- 每个层的帧对象都会被遍历,计算机执行绘图命令绘制各个层,此过程可能由CPU执行栅格化处理,或者直接通过D2D/SkiaGL在GPU上绘制。
- 上面所有步骤都可能利用到最近一次页面渲染时计算出来的各个值,这样可以减少不少计算量。
- 计算出各个层的最终位置,一组命令由 Direct3D/OpenGL发出,GPU命令缓冲区清空,命令传至GPU并异步渲染,帧被送到Window Server。
GPU 渲染(GPU Rendering)
- 在渲染过程中,图形处理可能使用通用计算处理器 CPU,也可能使用图形处理器 GPU。
- 当使用 GPU 用于图形渲染计算时,图形驱动软件会把任务分成多个部分,这样可以充分利用 GPU 强大的并行计算能力,用于在渲染过程中进行大量的浮点计算。
Window Server(Window Server)
后期渲染与用户引发的处理(Post-rendering and user-induced execution)
渲染完成后,浏览器根据某些计时机制运行JavaScript代码(比如Google Doodle动画)或与用户交互(在搜索栏输入关键字获得搜索建议)。类似Flash和Java的插件也会运行,尽管目前Google主页里不包含这些内容。这些脚本可以触发网络请求,也可能改变网页的内容和布局,产生又一轮渲染与绘制。