如何计算平台的可用性 (如何计算平台期)
本文目录导航:
如何计算平台的可用性?
可用性是评价互联网平台体现最关键的起因之一。
配件缺点、网络疑问或许运行中止服务就等于平台损失支出。
了解和把握平台可用性的计算方法,会无利于业务和技术主管在权衡研发、测试和运维团队的上班业绩规范上达成分歧。
而对客户而言,当他们要求平台的服务时,没有比可用性更关键的度量目的了。
企业中的每团体都应该把可用性作为团体目的的一局部。
技术团队的每个成员都应该知道每个服务终止对可用性的影响。
关于服务终止,人们应该相互质问并且独特致力确保这些疑问尽或许少出现。
作为公司的局部目的,可用性影响着员工的工资、奖金和升职等等,因此他们有渺小的能源去关心这个目的。
在探讨计算可用性的不同方法之前,咱们要求确保对可用性的基本定义有独特的意识。
用互联网的术语说,可用性是指在一个特定的时期范畴内,网站可用的时期长度,即用户可以经常使用该网站的时期除以总的时期。
举个例子,假设测量某个平台一周的可用性,最多可用时期是 7 天 * 24 小时/天 * 60 分钟/小时 = 分钟。
假设网站在这一周内有 分钟是可用的,那么可用性就是 / = 0.9935 。
可用性理论是以百分比示意,所以该平台本周的可用性是 99.35% 。
计算可用性理论有以下几种方法: 对可用性最便捷最间接的度量是配件设备的反常运转时期。
依托SNMP圈套,咱们可以应用捕捉设备缺点时期的监控工具,监控配件基础设备的可用性,并跟踪记载网站配件出疑问的时期。
不论要计算哪个时期范畴的可用性,团队都可以经过检查监控日志,确定疑问主机的数量以及这些疑问的继续时期。
有一个便捷的方法可以计算总的停机时期,即 例如某个网络接入替换机失败,主机没有布置冗余双连,造成衔接它的 12 个网络主机有 1.5 小时无法衔接,该网站有 120 个网络主机,因此总的停机时期计算环节如下: 确定了停机时期就可以计算可用性。
继续上述的例子,假定咱们要度量这周的可用性,而这是本周惟一的终止意外,因此咱们有 – 9 = 分钟的反常运转时期。
可用性是反常运转时期与总时期的百分比,也就是 / = 99.91% 。
如上所述,这是一个十分便捷的计算可用性的方法。
当然,网络主机的体现不必定齐全代表客户的体验。
假设仅仅是由于主机无法用,这并不象征着该网站对客户无法经常使用。
理想上,假设网站的架构正当,繁多配件的缺点或许不会对客户带来任何影响。
然而,这并不象征着咱们可以疏忽度量主机和其余配件的可用性。
相反,设备可用性会影响到服务的可用性,服务自身的可用性是最关键的目的。
可用性的最佳度量将间接相关到股东价值的最大化;反上来又或许对用户体验发生影响,进而影响公司的支出或老本。
因此,经常使用设备或配件可用性作为权衡系统肥壮状况的关键目的,还要求更复杂的以客户为核心的度量目的。
确定可用性的第二个方法是以客户做为“晴雨表”来评价网站的体现。
这种度量的体现方式可以是客服核心接到的用户电话呼入数、电子邮件的数量或许在线论坛的帖子数。
理论,领有完善客服核心的公司,对客户寻求允许的电话和电子邮件会启动实时跟踪。
呼叫核心每天都会统计这些数据,亲密当心接到了多少电话和电子邮件恳求以及多大水平可以满足用户的呼叫服务恳求。
假设服务恳求量突然出现了清楚的尖峰,那理论应该是出现了缺点。
那么如何把呼叫数质变成可用性度量呢?这里有很多方法可以选用,但都是不准确的。
一个便捷的方法是区分统计反常时期段的呼叫数量和服务终止时期的呼叫数量;这两个数值区分代表着 100% 的可用性和 0% 的可用性。
呼叫的总数量减去反常的呼叫数量,从而获取网站服务终止而引发的呼叫数量,再将其转化为网站齐全无法用的时期。
用公式表白为: 举个例子,假定咱们理论每小时接到200个客户的电话。
当网站彻底瘫痪时,通话量会到达每小时1000个。
从上午9点开局,咱们观察到每小时有400个通话出现,这种趋向不时继续到半夜,而后降低到每小时150个。
咱们假定该网站在这段时期内出现了一些疑问,这个疑心最后获取了运维人员的证明。
咱们把从上午9点到半夜的时期标志为一次性宕机。
宕机率计算环节如下: 虽然这个度量确实愈加凑近用户的实在体验,但也存在疑问和不准确性。
首先,疑问出现时,客户不太或许马上打电话。
大少数客服核心要求客户在电话线下等几分钟甚至更长的时期。
许多生产者由于不情愿等而懒得打电话,所以或许只要反响最剧烈的客户才会打。
例如,在 eBay ,实践上受影响客户中只要大概 1% 至 5% 左右的人会打电话咨询。
该统计目的歪曲了实践状况,反响最剧烈的客户,往往是那些最初级的用户。
这个测量目的的另外一个疑问是,很多 Web2.0 和 SaaS 公司没有客户允许核心,他们很少无时机与客户间接接触,很难及时了解能否真正出现了疑问,以及疑问继续的时期和影响。
再有一个疑问是,用户每天在不同时段呼入的状况变动很大。
为了补偿这一起因,必定要有每小时的测量目的来做比拟。
相似前面探讨过的配件度量,客户接触率的度量是跟踪可用性的一个很好的目的,然而咱们不能齐全依赖它来启动可用性的评价。
客户温度或许客户脉搏(无论你想怎样称说),是观察客户群对新的网页规划、性能集成或付款形式如何反响的十分好的方式。
这种反应对确保产品经理专一于客户需求和听取客户意见是十分贵重的。
然而对实在可用性的测量,还要求一些愈加复杂的方法。
测量可用性的第三种方法是监督网站上服务的可用性。
假设网站有缺点隔离泳道来坚持服务的分别,这种测量会愈加容易启动。
你可以经过脚原本监控模拟用户口头某些义务的才干,如登录和运转报表等。
该模拟用户就成为可用性的度量目的。
举个例子,咱们想要监控登录、报表、支付、颁布和注销五个服务,于是区分创立五个脚本,每五分钟运转一次性。
假设任何脚本失败,它就会通知预先定义好的咨询人。
服务复原后,测试脚本会中止发送缺点通知。
经过这种方式,咱们可以经过电子邮件准确地跟踪停机时期,以及哪些服务遭到了影响。
上午 9 点 45 分,咱们开局收到登录服务出现疑问的电子邮件,11 点 15 分中止发送。
这样就测量出登录服务出现 1.5 小时的停机时期。
由于五个服务中有一个出现疑问,所以计算总的停机时期的简双方法是把停机时期除以5,计算环节如下: 这个方法有必定的局限性和缺陷,却是一个相当准确地测量对客户影响时期的方法。
关键局限是该方法只限于有脚本监控的服务。
假设不创立脚本或许不能准确地模拟实在的用户,监控就不那么有效了。
因此咱们无法能监控每个服务,然而应该要笼罩关键的服务。
另外一个局限性是,并不是一切的用户都均等经常使用一切的服务。
例如,只要新用户经常使用注册流程,一切存量用户都经常使用登录流程。
每个业务的权重都不一样。
咱们可以按每个业务的关键性或许经常使用量参与权重,以便更准确地计算出每个业务可用性对客户的影响。
最后,这种方法还有一个局限性就是假设你从网络外部启动运行监控,监控不必定会遭到与客户相反的影响,尤其是当缺点是由网络服务提供商形成的。
话说回来,虽然这种方法在监控网站可用性时有必定的局限性,然而它确实提供了很好的以客户为核心的可用性测量。
第四种确定可用性的测量方法是经常使用第三方监控服务。
这种方法和第三种方法十分相似,但却克制了在外部网络监控的限度,并且还有或许包含更复杂的脚本,以模拟更实在的用户体验。
它们关键的概念基本相反:性能要监控的服务,当出现疑问时,向第三方服务报警咨询人收回警报。
目前,市场上有很多厂商提供这种监控服务,包含 Keynote、Gomez 和 Montastic 等。
有些服务是收费的,有些则是相当低廉的,取决于要求监控的运行的复杂性和多样性。
例如,一些优质的监控服务,其监控从许多不同的网络上动员,同时有才干从计算机上模拟用户,这简直是实在的用户体验。
经常使用第三方监控服务的关键是首先要确定监控要求,包含运行或服务的灵活性,要求在多少个不同的天文位置上监控,这种监控的难度多大等。
有些厂商能够从简直任何地域的互联网提供世界性的监控服务;一些供应商能提供对灵活网页的不凡监控;其余的可以学习什么是反常的行为,在不要求预先设置阈值的状况下,依据统计学的法令提供灵活的警报。
最后一种监控方法是依据业务流量图计算可用性,也是咱们的首选方法。
由于它驳回对业务更无心义的支进去表白平台可用性。
它要求用关键体现目的,照实时支出,来确定可用性对业务的影响。
要做到这一点,咱们必定为每个与企业运营业绩亲密相关的关键目的(KPI)布置好监控。
而后,当出现服务终止时,可以把反常的一天与服务终止那天做对比,以确定影响的水平。
详细方式是计算业务流量图之间的面积之差,这局部代表着服务终止时期。
实线是反常一天的支出变动曲线(这里的支出是 KPI 监控的),虚线是交通终止那天的支出变动曲线。
业务终止从大概下午 4 点开局,并继续到 6 点 40 分网站齐全复原。
这段时期两条曲线之间的面积占比可以用来作为对可用性的影响。
正如你所看到的,可用性的计算并不那么间接了当,或许会比拟复杂。
本文的目的不是要探讨哪种方法是正确的,而是要给出几种选用,让大家从当选用一种或综合几种为自己的组织找出最佳的全体可用性度量。
绝不应该低估在测量可用性方法上取得共识的关键性,由于它对技术团队和团体目的度量亲密相关。
十分有必要花些时期,制定出最准确的度量,使之成为威望的可用性目的。
性能测试的五大目的
性能测试的五大目的包含:并发用户数、照应时期、吞吐量、性能计数器及思索时期。
并发用户数是指在同一时辰同时与主机启动交互的在线用户数量。
这一目的关于评价系统的负载才干至关关键。
例如,一个电商平台在促销优惠时期,假设能允许更多的并发用户,就象征着能够解决更高的开售流量,从而参与营业额。
因此,经过性能测试确定系统能接受的最大并发用户数是确保系统稳固性和可用性的关键。
照应时期是指用户从客户端收回恳求到接纳完主机照应数据的时时期隔。
极速的照应时期能清楚优化用户体验。
以网页阅读为例,假设页面加载速渡过慢,用户或许会感到不浮躁并转向其余网站。
因此,性能测试中照应时期的测量关于优化系统性能、缩小用户期待时期具备关键意义。
吞吐量是指单位时期内系统解决用户的恳求数。
在性能测试中,吞吐量反映了系统解决义务的才干。
以银行的买卖系统为例,假设吞吐量高,那么系统就能在短时期内解决更多的买卖恳求,从而提高服务效率。
因此,提高吞吐量是优化系统全体性能的关键手腕。
性能计数器是用于形容系统或主机形态的一些数据目的,如CPU经常使用率、内存经常使用率等。
这些计数器可以协助咱们剖析和定位系统瓶颈。
例如,假设CPU经常使用率过高,或许象征着系统要求更弱小的计算才干来满足需求。
经过对性能计数器的监控和剖析,咱们可以有效地启动性能调优。
思索时期是指用户在启动操作时每个恳求之间的时时期隔。
在性能测试中,正当的思索时期设置能够模拟出更实在的用户行为形式。
比如,在模拟用户阅读购物网站的行为时,用户或许会在阅读不同商品页面之间有必定的停顿时期,这个时时期隔就是思索时期。
经过调整思索时期,咱们可以更准确地评价系统在实践经常使用场景中的性能体现。
计算机网络性能目的有哪些
计算机网络性能目的关键包含:带宽、吞吐量、时延、时延颤抖、丢包率和网络可用性。
首先,带宽,它示意在单位时期内从网络中的某一点到另一点所能经过的“最高数据率”。
咱们可以将其了解为路线的宽度,宽度越大,同时经过的车辆就越多,数据传输也就越快。
例如,当咱们说一个网络的带宽为100Mbps时,就象征着每秒可以传输100兆比特的数据。
其次,吞吐量,它示意在单位时期内经过某个网络(或信道、接口)的数据量。
与带宽不同,吞吐量更并重于实践传输的数据量,而非最高传输才干。
这就像一条路线在一天内实践经过的车辆数,它不只取决于路线的宽度(带宽),还遭到交通状况、红绿灯等多种起因的影响。
再次,时延,它是指数据(一个报文或分组,甚至比特)从网络(或链路)的一端传送到另一端所需的时期。
时延包含发送时延、流传时延、解决时延和排队时延。
这就像咱们寄出一封信后,要求期待一段时期对刚才干收到,这个时期就是时延。
此外,时延颤抖是指分组时延的变动量,也就是说,假设每个分组的时延都相反,那么时延颤抖就为0。
但在实践网络中,由于各种起因的影响,每个分组的时延或许会有所不同,这时就会发生时延颤抖。
丢包率是指在必定的时期范畴内,传输环节中失落的数据包占总数据包的比率。
丢包率过高会影响网络的传输品质,或许造成数据传输不完整或失败。
最后,网络可用性是指在某个调查时期,系统能够反常运转的概率或时期占有率希冀值。
它是权衡网络性能的关键目的之一,一个高可用性的网络应该能够在各种状况下都能提供稳固、牢靠的服务。
这些性能目的独特选择了计算机网络的全体性能和经常使用体验。
在设计和优化网络时,咱们要求依据实践需求和网络环境来选用适合的性能目的启动重点优化。
文章评论