您的位置:首页 > 新闻 > 会展 > CPU飙升100%怎么办?字节跳动面试官告诉你答案!

CPU飙升100%怎么办?字节跳动面试官告诉你答案!

2024/12/22 15:21:45 来源:https://blog.csdn.net/liuguojiang1128/article/details/139886059  浏览:    关键词:CPU飙升100%怎么办?字节跳动面试官告诉你答案!

小北说在前面

CPU占用率突然飙升是技术人员常遇到的一个棘手问题,它是一个与具体技术无关的普遍挑战。

这个问题可以很简单,也可以相当复杂。

有时候,只是一个死循环在作祟。
有时候,是死锁导致的。
有时候,代码中有不必要的同步块。
有时候,是大量计算密集型任务在运行。
有时候,是线程数过多引起的。
有时候,是频繁的上下文切换。
有时候,是内存不足的问题。
有时候,是频繁的垃圾回收。
有时候,是内存泄漏导致的。
等等。

导致CPU占用率飙升的问题多种多样,不同系统中的不同场景,其原因可能各不相同。

在这里,小北将对这些问题进行系统化、体系化的梳理,帮助大家在实际工作和面试过程中能够清晰、有条理地分析和解决CPU占用率过高的问题

插播一条:真的免费,如果你近期准备面试跳槽,建议在cxykk.com在线刷题,涵盖 1万+ 道 Java 面试题,几乎覆盖了所有主流技术面试题、简历模板、算法刷题。

一、cpu占用很高的3大类型,9大场景

1.1业务类问题

1.1.1 死循环

死循环是指程序在特定条件下进入了一个无限循环,无法跳出,导致CPU资源被完全占用。

例如:我们有一段代码用来检查文件的更新状态,但由于逻辑错误,条件永远无法满足,结果程序进入了死循环。

while (true) {if (file.isUpdated()) {break;}
}
1.1.2 死锁

死锁是指两个或多个线程互相等待对方释放资源,导致所有线程都无法继续执行,CPU资源被消耗殆尽。


发生死锁后,就会存在忙等待或自旋锁等编程问题,从而导致 繁忙等待问题,从而导致 CPU 100%

1.1.3 不必要的代码块

一些冗余、不必要的代码块在运行时占用了大量的CPU资源。

例如,不需要的地方使用synchronized块。

public synchronized void unnecessarySync() {// 执行一些不需要同步的操作
}

在不需要的地方使用synchronized块,会导致线程竞争和上下文切换

1.2、并发类问题

1.2.1 大量计算密集型的任务

大量计算密集型任务在同一时间运行,会导致CPU资源被完全占用。

例如:在数据分析或科学计算中,多个计算密集型任务同时运行

1.2.2 大量并发线程

统中存在大量并发线程,线程切换频繁,导致CPU资源被大量消耗在上下文切换上

例如:Web服务器同时处理大量请求,每个请求都创建一个新线程

解决方案:使用线程池来限制并发线程数量

1.2.3 大量的上下文切换

当系统中存在大量线程时,CPU在不同线程间频繁切换,导致性能下降

例如:一个程序中开启了数百个线程,每个线程都在不断进行I/O操作

for (int i = 0; i < 1000; i++) {new Thread(new IOHandler()).start();
}

线程是很宝贵的资源,开启线程一定要合理的控制线程数量

3、内存类问题

1.3.1 内存不足

当系统内存不足时,就会将磁盘存储作为虚拟内存使用,而虚拟内存的运行速度要慢得多。

例如:直接一次性加载一个非常大的文件到内存中,导致内存不足

byte[] largeData = Files.readAllBytes(Paths.get("largeFile.txt"));

这种过度的分页和交换会导致 CPU 占用率居高不下,因为处理器需要花费更多时间来管理内存访问,而不是高效地执行进程。

解决方案:优化内存使用,采用流式处理避免一次性加载大文件

try (BufferedReader reader = Files.newBufferedReader(Paths.get("largeFile.txt"))) {String line;while ((line = reader.readLine()) != null) {// 处理每一行数据}
}
1.3.2 频繁GC

频繁的垃圾回收(GC)操作会占用大量CPU资源,导致性能下降。

例如:程序中频繁创建和销毁对象,导致GC频繁触发

for (int i = 0; i < 1000000; i++) {String temp = new String("temp" + i);
}

解决方案:优化对象创建和销毁,减少临时对象的生成。

1.3.4 内存泄漏

内存泄漏导致可用内存逐渐减少,最终触发频繁的GC操作,占用大量CPU资源

例如:某个数据结构中不断添加对象,却从未删除,导致内存泄漏

List<Object> list = new ArrayList<>();
while (true) {list.add(new Object());
}

解决方案:定期清理不再使用的对象,使用合适的数据结构

插播一条:真的免费,如果你近期准备面试跳槽,建议在cxykk.com在线刷题,涵盖 1万+ 道 Java 面试题,几乎覆盖了所有主流技术面试题、简历模板、算法刷题。

这么多会导致CPU飙升100%的原因,那么该如何解决呢?
有没有一个标准的套路,可以帮助我快速定位呢?

答案是;当然有

二、CPU 飙升100%的解决思路和方法论

2.1 使用jstack 解决CPU 100%问题


使用jstack 解决 CPU 100%问题,在方法论上要用到的两个核心命令

  • top 命令查看TOP N线程,
  • jstack命令查看堆栈信息
2.1.1 确定Java进程ID

首先,需要找到CPU占用高的Java进程的PID(进程ID)。可以使用 top 或 ps 命令来找到该进程。

top -H -p <PID>
2.1.2 找到占用CPU高的线程ID

在 top 的输出中,按 P 键可以按CPU使用率排序,找到使用CPU最多的线程。
记下这些线程的ID(nid),这些ID是十进制的。

2.1.3 将线程ID转换为十六进制

jstack 输出的线程ID是十六进制的,因此需要将找到的高CPU使用率的线程ID转换为十六进制。可以使用 printf 命令:

printf "%x\n" <thread_id>
2.1.3 使用 jstack 生成线程快照

使用 jstack 命令生成Java进程的线程快照:

jstack -l <PID> > thread_dump.txt
2.1.4 分析线程快照

在生成的 thread_dump.txt 文件中,查找转换后的十六进制线程ID。可以使用 grep 命令:

grep "0x<hex_thread_id>" thread_dump.txt -A 20

这将显示包含该线程ID的线程栈信息。分析这些线程栈,找到可能导致CPU高占用的代码

2.2 使用阿里开源Arthas性能监控工具

Arthas 是一款强大的 Java 诊断工具,能够帮助开发人员快速定位和解决 CPU 100% 的问题

使用arthas解决CPU 100%问题,在方法论上要用到两个核心命令:

  • dashboard 命令查看TOP N线程,
  • thread 命令查看堆栈信息
2.2.1. 安装和启动 Arthas

安装 Arthas
通过 curl 命令下载并安装 Arthas:

curl -O https://arthas.aliyun.com/arthas-boot.jar

注意:在生产环境中,我们一般是选择其中一台机器开启Arthas监控,因为使用 Arthas 对系统性能会有一定影响

2.2.2 启动 Arthas

启动目标 Java 应用程序,然后在终端中运行:

java -jar arthas-boot.jar

Arthas 会显示当前运行的 Java 进程列表,选择要诊断的 Java 进程:例如输入1显示如下

2.2.3 使用 dashboard 命令查看系统概况

连接到目标进程后,使用 dashboard 命令查看系统的整体性能概况,包括 CPU 使用情况

dashboard

2.2.4 使用 thread 命令定位高 CPU 线程

查看线程列表
使用 thread 命令查看所有线程的信息,并找出 CPU 使用率高的线程

thread -n 3

这个命令会显示 CPU 使用率最高的 3 个线程,输出中会包含每个线程的 ID 和名称

2.2.5 查看具体线程的堆栈信息

假设你发现线程 ID 为 8 的线程 CPU 使用率很高,可以进一步查看该线程的堆栈信息:

thread 8

该命令会显示线程 8 的详细堆栈信息,帮助你定位到具体的代码位置

插播一条:真的免费,如果你近期准备面试跳槽,建议在cxykk.com在线刷题,涵盖 1万+ 道 Java 面试题,几乎覆盖了所有主流技术面试题、简历模板、算法刷题。

三、总结

工具的选择建议使用arthas,它还有很多的功能在实际中很有用

感兴趣的同学可以自行前往官网学习了解:https://arthas.aliyun.com/doc/

需要注意的是:大家在面试的时候如果遇到cpu被打满该如何排查这样的问题,千万不要上来就回答使用arthas来定位问题。

在生产环境中出现问题时,我们第一时间要做的是解决问题,所以回答要符合实际场景,不然面试官一听,就知道你是背的八股文。

那么该如何回答呢?

生产中如果出现 CPU 飙升100% 的情况

  1. 先确定前一天或者最近是否有新版本发布或者依赖域的服务有新版本发布,有的话第一时间回滚。
  2. 如果最近或很长一段时间都没有新版本发布,那就先申请紧急扩容,增加机器

最后才是通过文本的这一套套路排查具体的原因分析和解决方案

最后说一句(求关注,求赞,别白嫖我)

最近无意间获得一份阿里大佬写的刷题笔记,一下子打通了我的任督二脉,进大厂原来没那么难。
这是大佬写的, 7701页的BAT大佬写的刷题笔记,让我offer拿到手软

本文,已收录于,我的技术网站 cxykk.com:程序员编程资料站,有大厂完整面经,工作技术,架构师成长之路,等经验分享

求一键三连:点赞、分享、收藏

点赞对我真的非常重要!在线求赞,加个关注我会非常感激!

真的免费,如果你近期准备面试跳槽,建议在cxykk.com在线刷题,涵盖 1万+ 道 Java 面试题,几乎覆盖了所有主流技术面试题、简历模板、算法刷题

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com