保持空杯精神,使用性能剖析,专注于测量服务器的时间花费在哪里,思考1、如何确认服务器是否达到了性能最佳状态,2、某条语句为什么不够快,诊断被用户描述为“停顿、堆积、卡死”的某些间歇性疑难故障;
接下来将介绍一些工具、技巧优化整机性能、优化单条语句执行速度,诊断 解决那些很难观察到的问题,展示如何测量系统并生成剖析报告、如何分析系统的堆栈;
性能:为完成某件任务所需要的时间度量,in other words 性能即响应时间
吞吐量:单位时间内的查询数据(性能定义的倒数)
第一步:弄清楚时间都去哪了,在哪消耗了时间
如果通测量没有找到答案,测量方式错了或不够完善,只测量需要优化的活动
不要在错误的时间启动或停止测试,测量的是聚合后的信息而不是目标活动本身;需要定位和优化子任务
原则:无法测量便无法有效地优化
性能剖析:测量、分析时间花费在哪里的主要方法
1、测量任务所花费的时间;2、对结果统计、排序(重要前排)
可将相似任务分组汇总,通过性能剖析报告获需要的结果;报告会列出all任务,每行记录一个任务:
任务名、执行时间、消耗时间、平均执行时间,执行占全部时间的百分比;按照任务的消耗时间降序排序;
基于执行时间的分析:什么任务的执行时间最长
基于等待的分析:判断任务在什么地方呗阻塞的时间最长
性能剖析中缺失但是重要的信息:
1、值得优化的查询
占总响应时间比重很小的查询不值得优化;成本大于收益、停止优化
2、异常情况
没有显式要优化的也要优化,如执行次数少但每次都特别慢的任务
3、未知的未知
丢失时间:任务总时间与实际测量到的时间的差,即使没有发现也要注意这类问题存在的可能性
4、被掩藏的细节
无法显示all响应时间的分布,更多信息、直方图、百分比、标准差、偏差指数
5、无法再更高层次的堆栈中进行交互式 分析
性能瓶颈的影响因素:
1、外部资源,调用外部web服务或搜索引擎
2、应用需要处理大量数据,分析一个超大的xml文件
3、循环中执行昂贵的操作:滥用正则
4、使用低效的算法:暴力搜索算法
建议:新的项目中应考虑包含性能剖析的代码
铺获MySQL查询到日志文件:
1、慢查询日志:开销低、精度高,大的磁盘空间,长期开启 注意部署日志轮转工具,只在收集负载样本期间开启即可,5.1后微秒级别;
2、通用日志,查询请求到服务器时进行记录,不包含响应时间和执行计划
自顶向下,先生成剖析报告(pt-query-digest),查看特别关注的部分
思考为什么花费这么长时间、如何去优化
查看: show variables like "%pro%";【源】
默认禁用,开启:set profiling=1;然后在服务器执行语句(关闭 set profiling=off;)
语法:
SHOW PROFILE [type [, type] ... ] [FOR QUERY n] [LIMIT row_count [OFFSET offset]] type: ALL --显示所有的开销信息 (北联网教程,专业提供视频软件下载)
……