Ch6-STMT[2].ppt-道客多多_道客多多docduoduo.com

资源描述

1、软件测试方法和技术 - Ch.6集成测试和系统测试,Zhu.K,Kerry Zhu,Zhu.K,第五章回顾,Zhu.K,单元测试的定义与进行单元测试的重要性单元测试的目标与任务静态测试技术的运用动态测试技术的运用调试与评估单元测试的过程与文档管理单元测试的常用工具简介,第六章集成测试和系统测试,Zhu.K,6.1 系统集成的模式与方法 6.2 功能测试 6.3 系统测试 6.4 压力测试、容量测试和性能测试 6.5安全性、可靠性和容错性测试,6.1系统集成的模式与方法,软件集成测试前的准备,人员安排测试计划测试内容集成模式测试方法,Zhu.K,为什么总是集成不起来？,Zhu.K,

2、集成测试的模式,渐增式测试模式与非渐增式测试模式非渐增式测试模式：先分别测试每个模块，再把所有模块按设计要求放在一起结合成所要的程序，如大棒模式。渐增式测试模式：把下一个要测试的模块同已经测试好的模块结合起来进行测试，测试完以后再把下一个应该测试的模块结合进来测试。各自的优缺点,Zhu.K,自顶向下和自底向上集成方法,Zhu.K,驱动程序/驱动模块（driver），用以模拟被测模块的上级模块。驱动模块在集成测试中接受测试数据，把相关的数据传送给被测模块，启动被测模块，并打印出相应的结果。桩程序/桩模块（stub），也有人称为存根程序，用以模拟被测模块工作过程中所调用的模块。桩模块由被测模块调

3、用，它们一般只进行很少的数据处理，例如打印入口和返回，以便于检验被测模块与其下级模块的接口,自顶向下法(Top-down Integration),Zhu.K,自顶向下法的主要优缺点,Zhu.K,自顶向下法(Top-down Integration),自底向上法(Bottom-up Integration),Zhu.K,自底向上法的主要优缺点,自底向上法(Bottom-up Integration),Zhu.K,混合策略(Modified Top-down Integration),Zhu.K,混合法：对软件结构中较上层，使用的是“自顶向下”法；对软件结构中较下层，使用的是“自底向上”法，两者

4、相结合,大棒集成方法(Big-bang Integration),Zhu.K,采用大棒集成方法,先是对每一个子模块进行测试（单元测试阶段），然后将所有模块一次性的全部集成起来进行集成测试。,因为所有的模块一次集成的，所以很难确定出错的真正位置、所在的模块、错误的原因。这种方法并不推荐在任何系统中使用，适合在规模较小的应用系统中使用。,三明治集成方法(Sandwich Integration),Zhu.K,采用三明治方法的优点是：它将自顶向下和自底向上的集成方法有机地结合起来，不需要写桩程序因为在测试初自底向上集成已经验证了底层模块的正确性。采用这种方法的主要缺点是：在真正集成之前每一个独立的

5、模块没有完全测试过。,改善的三明治集成方法,Zhu.K,改进的三明治集成方法，不仅自两头向中间集成，而且保证每个模块得到单独的测试，使测试进行得比较彻底。,几种集成方法性能的比较,Zhu.K,6.2功能测试,Zhu.K,目的和内容,程序安装、启动正常，有相应的提示框、错误提示等每项功能符合实际要求系统的界面清晰、美观菜单、按钮操作正常、灵活，能处理一些异常操作能接受正确的数据输入，对异常数据的输入有提示、容错处理等数据的输出结果准确，格式清晰，可以保存和读取功能逻辑清楚，符合使用者习惯系统的各种状态按照业务流程而变化，并保持稳定支持各种应用的环境能配合多种硬件周边设备软件升级后，能继续支持旧

6、版本的数据与外部应用系统的接口有效,功能测试的方法,等价类划分法边界值分析法错误推测法因果图法组合分析法,Zhu.K,我要测试所有的功能,等价类划分法,Zhu.K,划分好等价类测试：防止遗漏测试案例。,边界值分析法,Zhu.K,例子：排序程序，边界条件有：序列为空；序列仅有一个数据；序列为满，用猜错法补充一下测试用例；序列已经按要求排好序；序列的顺序与要求的顺序恰好相反；序列中的所有数据全部相等。,因为错误最容易发生在边界值附近，所以边界值分析法对于多变量函数的测试很有效，尤其是对于像C/C+数据类型要求不是很严格的语言有利。,错误推测法,Zhu.K,这个错误到底在哪？,因果图法,Z

7、hu.K,因果图法,Zhu.K,混凝土强度为什么不足？,组合分析法,Zhu.K,组合分析是一种基于每对参数组合的测试技术，主要考虑参数之间的影响是主要的错误来源和大多数的错误起源于简单的参数组合。,在产品汉化过程中哪个组合出错了？,6.3 系统测试,压力测试 (Stress test) 容量测试 (Capacity test) 性能测试 (Performance test) 安全测试 (Security test) 容错测试 (Recovery test),Zhu.K,回归测试的目的所做的修改达到了预定的目的，如错误得到了改正，新功能得到了实现，能够适应新的运行环境等；不影响软件原有功能的正

8、确性。回归测试的方法再测试全部用例基于风险选择测试基于操作剖面选择测试再测试修改的部分,回归测试,2000,Zhu.K,回归测试的组织和实施,回归测试,Zhu.K,6.4 压力测试、容量测试和性能测试,Zhu.K,压力测试、容量测试和性能测试的测试目的虽然有所不同，但其手段和方法在一定程度上比较相似，通常会使用特定的测试工具，来模拟超常的数据量、负载等，监测系统的各项性能指标，如CPU和内存的使用情况、响应时间、数据传输量等。,一定要设法破坏它!,性能测试,Zhu.K,看看在各种情况下CPU使用的效率,性能测试概念和目的,性能测试的目的：为了验证系统是否达到用户提出的性能指标，同时发现

9、系统中存在的性能瓶颈，起到优化系统的目的。性能测试指标的来源：用户对各项指标提出的明确需求；如果用户没有提出性能指标则根据用户需求、测试设计人员的经验来设计各项测试指标。（需求+经验）主要的性能指标：服务器的各项指标（CPU、内存占用率等）、后台数据库的各项指标、网络流量、响应时间,性能测试要点,测试环境应尽量与产品运行环境保持一致，应单独运行尽量避免与其他软件同时使用。性能测试一般使用测试工具和测试人员编制测试脚本来完成。性能测试的重点在于前期数据的设计与后期数据的分析。性能测试的用例主要涉及到整个系统架构的问题，所以测试用例一旦生成，改动一般不大，所以做性能测试的重复使用率一般比

10、较高。,性能测试的方法和技巧,两种负载类型 “flat”测试 ramp-up测试对于企业级的系统，性能测试的方法主要有：基准测试性能规划测试渗入测试峰谷测试,两种负载类型,“Flat”测试: 对于一次给定的测试，应该取响应时间和吞吐量的平均值。精确地获得这些值的唯一方法是一次加载所有的用户，然后在预定的时间段内持续运行。,虚拟用户的数量,两种负载类型,Ramp-up测试: 用户是交错上升的（每几秒增加一些新用户）。ramp-up测试不能产生精确和可重现的平均值，这是因为由于用户的增加是每次一部分，系统的负载在不断地变化。其优点是，可以看出随着系统负载的改变，测量值是如何改变的据此选择要

11、运行的flat测试的范围。,Flat测试 “波动”效应,Page Downloaded per Second,系统吞吐量,Flat测试 “波动”效应,Resource Usage,基准测试,同时与服务器通信的连接（或虚拟用户）的数目，每个虚拟用户请求之间间隔时间的长短。,随着服务器上负载的增加，吞吐量会不断攀升，直到到达一个点, 并在这个点上稳定下来,基准测试的关键是要获得一致的、可再现的结果。假定测试的两个指标是服务器的响应时间和吞吐量，会受到负载的影响。而负载又受两个因素影响：,与服务器通信的用户越多，负载就越大。同样，请求之间间隔时间越短，负载也越大。这两个因素的不同组合会产生不同的

12、服务器负载等级.,基准测试 (2),在某一点上，执行队列开始增长，因为服务器上所有的线程都已投入使用，传入的请求不再被立即处理，而是放入队列中，当线程空闲时再处理。,当系统达到饱和点，服务器吞吐量保持稳定后，就达到了给定条件下的系统上限。但是，随着服务器负载的继续增长，响应时间也随之延长，虽然吞吐量保持稳定。,将系统置于相同的高负载下，将请求之间间隔时间设为零。这样服务器会立即超载，并开始构建执行队列。如果请求（虚拟用户）数保持一致，基准测试的结果会非常精确 flat运行是获得基准测试数据的理想模式,基准测试 (3),两个事务的响应时间曲线,性能规划测试,性能规划类型的测试其目标是找出在特定的

13、环境下，给定应用程序的性能可以达到何种程度。例如，如果要以5秒或更少的响应时间支持8,000个当前用户，需要多少个服务器？要确定系统的容量，需要考虑几个因素: 用户中有多少是并发与服务器通信的。每个用户的请求间时间间隔是多少。,如何加载用户以模拟负载状态？最好的方法是模拟高峰时间用户与服务器通信的状况。如果用户负载状态是在一段时间内逐步达到的,选择ramp-up测试，每隔几秒增加x个用户; 如果所有用户是在一个非常短的时间内同时与系统通信，就应该使用flat测试，将所有的用户同时加载到服务器什么是确定容量的最好方法？结合两种负载类型的优点，并运行一系列的测试如：首先使用ramp-up测试确

14、定系统支持的用户范围该范围内不同的并发用户负载进行一系列的flat测试，更精确地确定系统的容量。,性能规划测试 (2),渗入测试,渗入测试是一种比较简单的性能测试。渗入测试所需时间较长，它使用固定数目的并发用户测试系统的总体健壮性。这些测试将会通过内存泄漏、增加的垃圾收集(GC)或系统的其他问题，显示因长时间运行而出现的任何性能降低。建议运行两次测试一次使用较低的用户负载（要在系统容量之下，以便不会出现执行队列），一次使用较高的负载（以便出现积极的执行队列）。,峰谷测试,兼有容量规划ramp-up测试和渗入测试的特征,目标是确定从高负载（例如系统高峰时间的负载）恢复、转为几乎空闲、然后再攀升到

15、高负载、再降低的能力。,性能测试的过程,故障转移测试,Failover 测试:故障转移(Failover)和故障恢复(Failback).服务器的Failover测试的目的: 检查系统是否具备某种灾难性恢复的手段. 当系统局部或全部出错时, 能否在指定时间内修正错误. 具有良好故障恢复的系统, 当遇到软件原因或无法克服的自然原因时, 能够进行故障的转移与恢复. 使用户最低限度的感受到故障的发生.在服务器的Failover测试中, 将包括多种情况, 如: 客户机或服务器掉电; 客户机与服务器网络中断; 服务器相关的程序CRASH; 系统中全部或部分CORE SERVER出现掉电/网络中断情况.,

16、Failover测试的方法和技巧,将测试系统全部对象描绘出来-系统结构图对图中的所有可能发生的故障点设计测试用例.,示例 1,简单的服务器构造,示例 1 （contd）,在这个构造中，当其中一台应用服务器出现故障，连接此应用服务器的两个web服务器将不再获得从负载平衡服务器上请求，这样，所有的负载都会传递到剩余的两台web服务器, 见下图:,示例二：企业级服务器,6.4 压力测试,Zhu.K,在一种需要反常（如长时间的峰值）数量、频率或资源的方式下，执行可重复的负载测试，以检查程序对异常情况的抵抗能力，找出性能瓶颈。从本质上来说，测试者是想要破坏程序。步骤：,测试压力估算测试环境准备

17、问题的分析累积效应,压力测试,Zhu.K,试试这个游戏站点的承受力,压力测试类型,并发性能测试（重点）疲劳强度测试大数据量测试,并发性能测试,考察客户端应用的性能，测试的入口是客户端并发性能测试的过程，是一个负载测试和压力测试的过程。即逐渐增加并发虚拟用户数负载，直到系统的瓶颈或者不能接收的性能点，通过综合分析交易执行指标、资源监控指标等来确定系统并发性能的过程。并发性能测试是负载压力测试中的重要内容。ramp-up测试,疲劳强度测试,通常是采用系统稳定运行情况下能够支持的最大并发用户数或者日常运行用户数，持续执行一段时间业务，通过综合分析交易执行指标和资源监控指标来确定系统处理最大工作量

18、强度性能的过程。疲劳强度测试案例制定的原则是保证系统长期不间断运行的业务量，并且应该尽量去满足该条件。 Flat测试,大数据量测试,独立的数据量测试针对某些系统存储、传输、统计、查询等业务进行大数据量测试综合数据量测试和压力性能测试、负载性能测试、并发性能测试、疲劳性能测试相结合的综合测试方案,容量测试,Zhu.K,容量测试目的是通过测试预先分析出反映软件系统应用特征的某项指标的极限值（如最大并发用户数、数据库记录数等），系统在其极限值状态下还能保持主要功能正常运行。容量测试还将确定测试对象在给定时间内能够持续处理的最大负载或工作量。,度量系统容量举例,查看现有系统中性能与负载间的关系，

19、并确定出现响应时间显著延长的位置 “拐点”。可以确定是否需要增加资源以支持额外的用户。,Zhu.K,系统瓶颈分析举例-1,交易的响应时间如果很长，远远超过系统性能需求，表示耗费CPU的数据库操作，例如排序，执行aggregate functions（例如sum、min、max、count）等较多，可考虑是否有索引以及索引建立的是否合理；尽量使用简单的表联接；水平分割大表格等方法来降低该值。,Zhu.K,系统瓶颈分析举例-2,分段排除错误。测试工具可以模拟不同的虚拟用户来单独访问Web服务器、应用服务器和数据库服务器，这样，就可以在Web端测出的响应时间减去以上各个分段测出的时间就可以知道瓶颈在

20、哪并着手调优。,Zhu.K,系统瓶颈分析举例-3,UNIX资源监控（NT操作系统同理）中指标内存页交换速率（Paging rate），如果该值偶尔走高，表明当时有线程竞争内存。如果持续很高，则内存可能是瓶颈。也可能是内存访问命中率低。“Swap in rate”和“Swap out rate”也有类似的解释。,Zhu.K,系统瓶颈分析举例-4,UNIX资源监控（NT操作系统同理）中指标CPU占用率（CPU utilization），如果该值持续超过95%，表明瓶颈是CPU。可以考虑增加一个处理器或换一个更快的处理器。合理使用的范围在60%至70%。,Zhu.K,系统瓶颈分析举例-5,UNIX

21、资源监控（NT操作系统同理）中指标磁盘交换率（Disk rate），如果该参数值一直很高，表明I/O有问题。可考虑更换更快的硬盘系统、重新部署业务逻辑等，另外设置Tempdb in RAM，减低“max async IO“，“max lazy writer IO“等措施都会降低该值。,Zhu.K,系统瓶颈分析举例-6,SQLServer资源监控中指标缓存点击率（Cache Hit Ratio），该值越高越好。如果持续低于80%，应考虑增加内存。注意该参数值是从SQL Server启动后，就一直累加记数，所以运行经过一段时间后，该值将不能反映系统当前值。,Zhu.K,6.5 安全性测试，可靠性

22、和容错性测试,Zhu.K,安全性测试、可靠性测试和容错性测试的测试目的不同，其手段和方法也不同，但都属于系统测试的范畴，有一定的联系，如软件可靠性要求通常包括了安全性的要求。安全性测试、可靠性测试和容错性测试的技术比较深、实施比较难，但在应用系统中越来越重要。,安全性测试,Zhu.K,根据ISO 8402的定义，安全性是“使伤害或损害的风险限制在可接受的水平内”。,安全性测试,Zhu.K,安全性测试是检查系统对非法侵入的防范能力。安全测试期间，测试人员假扮非法入侵者，采用各种办法试图突破防线。例如：想方设法截取或破译口令；专门开发软件来破坏系统的保护机制；故意导致系统失败，企图趁恢复之机非法

23、进入；试图通过浏览非保密数据，推导所需信息等等。理论上讲，只要有足够的时间和资源，没有不可进入的系统。因此系统安全设计的准则是，使非法侵入的代价超过被保护信息的价值，此时非法侵入者已无利可图。,可靠性测试,Zhu.K,可靠性（Reliability）是产品在规定的条件下和规定的时间内完成规定功能的能力，它的概率度量称为可靠度。软件可靠性是软件系统的固有特性之一，它表明了一个软件系统按照用户的要求和设计的目标，执行其功能的可靠程度。软件可靠性与软件缺陷有关，也与系统输入和系统使用有关。理论上说，可靠的软件系统应该是正确、完整、一致和健壮的。,规定的时间规定的环境条件规定的功能,Web安全性,

24、Zhu.K,可靠性测试结果的评估,成熟性度量可以通过错误发现率DDP（Defect Detection Percentage）来表现。在测试中查找出来的错误越多，实际应用中出错的机会就越小，软件也就越成熟。 DDP=测试发现的错误数量/已知的全部错误数量已知的全部错误数量是测试已发现的错误数量加上可能会发现的错误数量之和。,容错性测试,Zhu.K,容错性测试是检查软件在异常条件下自身是否具有防护性的措施或者某种灾难性恢复的手段。如当系统出错时，能否在指定时间间隔内修正错误并重新启动系统。容错性测试包括两个方面：,输入异常数据或进行异常操作，以检验系统的保护性。如果系统的容错性好的话，系统只给出提示或内部消化掉，而不会导致系统出错甚至崩溃。灾难恢复性测试。通过各种手段，让软件强制性地发生故障，然后验证系统已保存的用户数据是否丢失、系统和数据是否能尽快恢复。,从质量三个纬度看系统测试,Zhu.K,从质量三个纬度看系统测试 (2),Zhu.K,Q & A,Zhu.K,练习,Zhu.K,P.128: 1, 5, 7,

展开阅读全文