简单聊聊PV和并发

今天有同学问我,PV和并发数怎么换算,所以呢,我简单聊聊它们之间的换算关系。我也是根据自己的经验和网上的一些想法,做了总结,如有不对,希望大家指出,共同学习。

一、先说一下,相关几个概念:

网站流量(traffic)是指网站的访问量,是用来描述访问一个网站的用户数量以及用户所浏览的网页数量等指标,常用的统计指标包括网站的独立用户数量、总用户数量(含重复访问者)、网页浏览数量、每个用户的页面浏览数量、用户在网站的平均停留时间等。

网站访问量的常用衡量标准:独立访客(UV) 和 综合浏览量(PV),一般以日为单位来衡量和计算。

独立访客(UV):指一定时间范围内相同访客多次访问网站,只计算为1个独立访客。

综合浏览量(PV):指一定时间范围内页面浏览量或点击量,用户每次刷新即被计算一次。

网站访问统计分析的基础是获取网站流量的基本数据,根据网上营销新观察的相关文章,网站流量统计指标大致可以分为三类,每类包含若干数量的统计指标。具体的网站流量统计是通过不同的ip登陆网站来计算的,也就是说。一天内同一台机器登陆网站的次数不论是多少,在流量统计中只记为一次有效登陆,这种计算方法可以较为科学的计算出有多少人登陆过该网站,有效的防止了有意的对网站进行刷新从而增加自己网站的点击率。

IP 是使用不同IP上网的人访问你网站的人数,也就是上面的独立访问者数量。 
一般来说是24小时同一IP不重复记录的, 也应该24小时不重复记录。(其实IP也不一定就是独立访问者数量,因为有的用户是公用一个IP的,但大致上可以认为就是今日的独立访问者数量。)

所以PV一定是>=IP的,如一个网站今天的流量统计是100IP 200PV就是说今天有大致100个独立访问者,一共访问了200次页面,平均每个用户访问页面数量是 PV/IP=2 ,一般来说这个数字越大说明网站内容越吸引用户,但也和网站本身的页面有关。

并发:指的是多个事情,在同一时间段内同时发生了。

二、计算

1、PV计算带宽

计算带宽大小需要关注两个指标:峰值流量和页面的平均大小。

具体的计算公式是:网站带宽= PV / 统计时间(换算到S)*平均页面大小(单位KB)* 8

注意:1)、字节的单位是Byte,而带宽的单位是bit,1Byte=8bit,所以转换为带宽的时候,要乘以 8。

2)、这个计算方法是绝对的算法,实际中由于缓存、CDN、白天夜里访问量不同等会有误差。

例子:假设网站的平均日PV:10w 的访问量,页面平均大小0.4 M 

网站带宽 = 10w / (24 *60 * 60)* 0.4M * 8 =3.7 Mbps

在实际的网站运行过程中,我们的网站必须要在峰值流量时保持正常的访问,假设,峰值流量是平均流量的5倍,按照这个计算,实际需要的带宽大约在 3.7 Mbps * 5=18.5 Mbps

2、PV与并发

具体的计算公式是:并发连接数 = (PV / 统计时间 * 页面衍生连接次数 * http响应时间 * 因数) / web服务器数量

解释:

页面衍生连接次数: 一个页面请求,会有好几次http连接,如外部的css, js,图片等,这个根据实际情况而定

http响应时间: 平均一个http请求的响应时间,可以使用1秒或更少

因数: 峰值流量 和平均流量的倍数,一般使用5 ,最好根据实际情况计算后得出

例子:计算10万PV的并发连接数

(100000PV / 86400秒 * 50个派生连接数 * 1秒内响应 * 5倍峰值) / 1台Web服务器 = 289

3、峰值QPS和服务器的计算

原理:每天80%的访问集中在20%的时间里,这20%时间叫做峰值时间

公式:( 总PV数 * 80% ) / ( 每天秒数 * 20% ) = 峰值时间每秒请求数(QPS)

机器:峰值时间每秒QPS / 单台机器的QPS   = 需要的机器 

例子:每天100w PV 的在单台机器上,这台机器需要多少QPS?

( 1000000 * 0.8 ) / (86400 * 0.2 ) = 47 (QPS)

例子:如果一台机器的QPS是38,需要几台机器来支持?

47 / 38=2

实际情况中,会把QPS适当的往上扩大,以防万一。

posted @ 2021-04-27 11:56  板栗+  阅读(733)  评论(0编辑  收藏  举报