当前位置:首页 > 技术文章 > 正文内容

Linux遇到故障不要怕,这10个命令要熟练掌握!

arlanguage3个月前 (02-01)技术文章30

在使用Linux操作系统时,故障和问题的出现是不可避免的。不论是系统崩溃、应用程序挂起,还是硬件设备出现异常,如果你不具备处理这些问题的工具,排查和修复的过程可能会非常耗时,甚至让你感到力不从心。幸好,Linux系统提供了丰富的命令行工具,它们可以帮助你迅速诊断问题,找出症结,并最终解决故障。

对于每个Linux管理员或使用者而言,掌握一些基本的诊断命令是必不可少的。无论你是Linux的新手还是经验丰富的系统管理员,了解并熟练使用以下10个命令,将大大提高你解决问题的效率。本文将详细介绍这10个命令的使用场景和实际操作技巧,帮助你在遇到Linux故障时不再手足无措。

1. dmesg

查看内核消息,排查硬件故障

dmesg(diagnostic message)是一个非常强大的命令,用于查看内核的启动信息和系统事件。它显示的是内核环节的日志,通常用于硬件相关问题的排查。当系统无法识别某个设备,或者出现设备挂载失败的情况时,dmesg通常是你首先需要检查的命令。

  • ? 排查硬件设备问题,如USB设备、磁盘或网络接口。
  • ? 分析系统启动过程中的错误。
dmesg | tail -n 20

该命令将返回dmesg输出的最后20行日志,帮助你快速查看系统的最新错误信息。

如果你需要查看特定设备或模块的日志,可以结合grep进行过滤:

dmesg | grep BUS

这会过滤出所有与BUS设备相关的内核消息,帮助你找到是否有BUS设备识别失败或驱动加载错误的情况。


2. journalctl

系统日志全览,定位服务崩溃

journalctl是一个用于访问和查看由systemd管理的系统日志的工具。它可以帮助你查看详细的系统事件日志,尤其是在系统崩溃或服务启动失败时,日志内容非常关键。通过journalctl,你可以访问整个系统的事件信息,包括内核、服务、应用程序等的输出。

  • ? 调查系统崩溃的根本原因。
  • ? 查看服务启动失败或出现异常的详细日志。
journalctl -xe

这个命令将列出最近的日志信息,并自动过滤出带有“错误”级别(例如警告、错误等)的日志。它通常用于快速定位服务崩溃或系统故障的原因。

你还可以通过指定具体服务来查看日志:

journalctl -u nginx.service

这将显示与nginx服务相关的所有日志,帮助你发现该服务出现问题的详细信息。


3. htop:

实时监控系统资源,找出耗费资源的进程

htoptop命令的增强版本,提供了更友好、直观的界面,能够实时监控系统的CPU、内存使用情况,并展示所有运行的进程信息。它支持交互操作,你可以直接在界面中进行排序、过滤,甚至杀死进程。

  • ? 实时监控系统资源使用情况,定位性能瓶颈。
  • ? 识别高CPU或内存使用的进程。

只需要运行:

htop

你将看到一个彩色的动态界面,显示系统当前的资源使用情况。通过键盘上的方向键,你可以快速查看各个进程的资源消耗情况。你还可以使用F6键按CPU、内存等字段进行排序,帮助你快速找到占用资源最多的进程。


4. ps aux

查看所有正在运行的进程

ps aux命令列出当前系统上所有正在运行的进程,并显示相关的详细信息,包括进程ID(PID)、CPU和内存使用量等。ps命令非常适合用来核实服务是否启动,或者识别哪些进程可能导致系统卡顿或资源消耗过高。

  • ? 查看系统上正在运行的所有进程。
  • ? 查找并终止占用大量资源的进程。
ps aux | grep nginx

这条命令会过滤出与nginx相关的所有进程。如果你的nginx服务无法启动,或者你想确认是否运行,你可以通过ps aux命令来查找它的进程。


5. strace

追踪系统调用,帮助调试进程

strace是一个强大的调试工具,可以追踪进程执行时的所有系统调用(如文件操作、网络请求、内存分配等)。通过分析这些调用,您可以了解程序在执行过程中遇到的问题,并快速定位崩溃或卡顿的原因。

  • ? 调试应用程序崩溃或挂起问题。
  • ? 分析进程在执行时的系统调用和IO操作。
strace -p 

通过将strace附加到进程的PID上,你可以看到该进程执行时的所有系统调用。例如,若一个进程挂起无法结束,strace可以帮助你追踪到具体出问题的地方。


6. lsof

查看打开的文件和网络连接

lsof(List Open Files)命令可以列出当前系统上所有打开的文件和网络连接。它对于解决文件锁、网络连接挂起或进程无法退出等问题非常有用。

  • ? 查看哪些文件或端口被哪些进程占用。
  • ? 解决进程无法正常关闭或文件被锁定的情况。
lsof -i

这个命令将列出当前所有打开的网络连接和监听端口,帮助你识别网络故障或端口冲突等问题。


7. ping

测试网络连通性

ping命令是一个非常基础但重要的网络诊断工具,用于测试本地系统和远程主机之间的网络连通性。它通过发送ICMP请求包并等待响应,帮助你确认网络是否正常工作。

  • ? 检查网络是否正常,是否可以访问外部主机。
  • ? 诊断DNS问题,确认域名是否解析正确。
ping -c 4 baidu.com

该命令将发送4个ICMP包到baidu.com并显示响应时间。如果没有响应,说明网络或DNS可能存在问题。


8. ss

查看网络连接和套接字状态

ss是比netstat更强大、更高效的网络工具,用于查看当前的网络连接、监听端口、套接字状态等。它提供了比netstat更多的详细信息,帮助你深入分析网络问题。

  • ? 排查网络连接、端口占用等问题。
  • ? 查看TCP、UDP连接的详细信息。
ss -lnt

该命令会列出所有正在监听的TCP端口,帮助你发现哪些服务正在占用系统的端口。


9. df

查看磁盘空间使用情况

df命令用于显示文件系统的磁盘空间使用情况,帮助你判断磁盘空间是否不足。磁盘空间不足往往是导致系统性能下降或应用程序崩溃的原因之一。

  • ? 检查磁盘空间,确保系统没有因磁盘满而出现问题。
df -h

该命令会以人类可读的格式显示磁盘的使用情况,如GB、MB等单位,帮助你快速识别哪些分区的空间使用过高。


10. uptime

查看系统负载情况

uptime命令非常简洁,但它提供了非常有用的信息:系统的运行时间,以及过去1分钟、5分钟和15分钟的负载平均值。通过这些数据,你可以判断系统是否过载,或者是否需要进行性能优化。

  • ? 判断系统是否过载,评估是否需要扩展硬件资源。
uptime

你将看到类似如下的输出:

通过负载平均值,你可以直观了解系统的负载情况。如果负载平均值较高,说明系统可能正处于过载状态,处理能力不足,需要优化或增加资源。


总结

  • ? dmesg 让你能查看内核消息和硬件错误。
  • ? journalctl 提供详细的系统日志,帮助你追踪服务崩溃的原因。
  • ? htop 实时监控系统资源,找出导致系统卡顿的进程。
  • ? ps aux 查看当前系统的所有进程,帮助你判断哪些进程占用了过多资源。
  • ? strace 追踪进程的系统调用,帮助你找到程序崩溃的根本原因。
  • ? lsof 查看系统中打开的文件和网络连接,帮助你解决文件锁定和网络连接问题。
  • ? ping 检查网络连接是否正常。
  • ? ss 查看详细的网络连接信息,帮助你排查网络问题。
  • ? df 查看磁盘空间使用情况,确保系统不因磁盘满而崩溃。
  • ? uptime 查看系统负载,判断系统是否过载。

无论是调试程序、分析系统资源,还是检查网络连接或存储空间,这些命令都将成为你在Linux系统中故障排除的强大武器。掌握它们,将让你在面对Linux系统问题时更加游刃有余,轻松应对各种挑战。

扫描二维码推送至手机访问。

版权声明:本文由AR编程网发布,如需转载请注明出处。

本文链接:http://www.arlanguage.com/post/2015.html

分享给朋友:

“Linux遇到故障不要怕,这10个命令要熟练掌握!” 的相关文章

Nginx负载均衡的一些安全配置说明

在之前的几篇文章里,我们都说到了负载均衡,而负载均衡的转发服务器使用了Nginx,但是我们没有详细的对Nginx的安全配置做一个分析,如果对负载均衡的知识比较有兴趣,欢迎订阅我的头条号:一点热,然后再阅读我之前的文章。快速入口java项目如何实现单一的nginx负载均衡关于Nginx的一些安全设置,...

Nginx:为什么高性能?Master&worker如何配合?负载均衡了解吗?

1. Nginx架构及工作流程Nginx真正处理请求业务的是Worker之下的线程。worker进程中有一个ngx_worker_process_cycle()函数,执行无限循环,不断处理收到的来自客户端的请求,并进行处理,直到整个Nginx服务被停止。当一个 worker 进程在 accept()...

到 2024 年了,全球仍有 76.4% 的网站在用「已死」的 PHP!

如今资历稍长的程序员,提到 PHP 可能都会联想到一个梗:“PHP 是最好的语言。”这个梗并非出自别处,正源自于 PHP 自己的官方文档:早在 2001 年 7 月,PHP 文档中就有一句“PHP is the best language for web programming(PHP 是世界上最好...

基于Docker一键LNMP(Nginx+MySQL+PHP7/5+Redis)安装程序

一键部署LNMP环境的目的,该环境特点:完全开源支持多版本PHP切换(PHP5.4、PHP5.6、PHP7.2...)支持绑定任意多个域名支持HTTPS和HTTP/2PHP源代码位于host中MySQL data位于host中所有配置文件可在host中直接修改所有日志文件可在host中直接查看内置完...

Nginx安全相关配置常用教程 nginx安全策略

1. 限制请求速度设置 Nginx、Nginx Plus 的连接请求在一个真实用户请求的合理范围内。比如,如果你觉得一个正常用户每两秒可以请求一次登录页面,你就可以设置 Nginx 每两秒钟接收一个客户端 IP 的请求(大约等同于每分钟30个请求)。limit_req_zone $binary_re...

为什么服务器管理用户都使用宝塔面板?

宝塔面板宝塔面板到底是个什么鬼?为什么这么多站长使用宝塔面板?宝塔Linux面板是提升运维效率的服务器管理软件,支持一键LAMP/LNMP/集群/监控/网站/FTP/数据库/JAVA等100多项服务器管理功能。有30个人的专业团队研发及维护,经过200多个版本的迭代,功能全,少出错且足够安全,已获得...