[转][实战] PHP WorkerMan CPU过高导致的业务延时排查与优化

发布时间：2020-04-17 14:57:04编辑：文明阅读（1558）

WorkerMan介绍

官方项目地址：https://www.workerman.net/features

workerman是一个高性能的PHP socket 服务器框架，workerman基于PHP多进程以及libevent事件轮询库，
PHP开发者只要实现一两个接口，便可以开发出自己的网络应用，例如Rpc服务、聊天室服务器、手机游戏服务器等。

workerman的目标是让PHP开发者更容易的开发出基于socket的高性能的应用服务，
而不用去了解PHP socket以及PHP多进程细节。

workerman本身是一个PHP多进程服务器框架，具有PHP进程管理以及socket通信的模块，
所以不依赖php-fpm、nginx或者apache等这些容器便可以独立运行。

业务场景

终端机通过互联网走TCP协议通过NGinx反向代理服务器与线上PHP服务器中的WorkerMan进程通讯，属于长连接，对实时性要求较高。

系统与应用环境

# uname -r3.10.0-693.11.1.el7.x86_64# cat /etc/centos-releaseCentOS Linux release 7.4

Workerman version:3.5.5
PHP version:5.6.36# php -m[PHP Modules]

event
phpiredis
这里只列出了高并发相关的已经加载的模块

现象

终端机通过扫码形式进行打开，发现在扫码后会有大约5-10秒的延时才开始下一流程工作。体验变得很糟糕。

排查过程

因为终端机是与Workerman通讯的，因此，直接查看此应用的情况

Workerman 实时连接情况

通过htop指令，发现Workerman占用的CPU核心(CPU 1)还是特别高的。

按理说，刚增加的CPU核数，应该可以改善CPU高的问题啊。不过呢，仔细观察，本机的业务分为传统PHP类和Workerman,按照官方的手册讲到的，Workerman并不跟php-fpm有太多的影响。实际中确实也反映出来了，跟Workerman连接的终端会延时，同一时刻，相关的PHP访问却不受影响，除非整个服务器的CPU都超高。

开始把问题瞄向了磁盘IO和网络IO瓶颈上面，不过当我调出相关的性能监控的时候，发现并不是这个原因。虽然说有写日志的行为，在SSD磁盘的上面还是没有压力的。

随即寻求Workman官方技术群主帮助，通过状态页和相关监控系统指令，产生了疑问：
业务有啥耗费cpu的操作么？请求量不大怎么cpu这么高？

通过mpstat查看每个核的CPU状况，发现运行Workerman的CPU核心确实存在CPU高的现象