当前位置:首页 > 技术文章 > 正文内容

如何解决 Linux 系统文件描述符耗尽的问题

arlanguage3个月前 (01-31)技术文章94

文件描述符(File Descriptor) 是 Linux 系统中用于标识打开文件或网络连接的整数句柄。当系统或应用程序打开的文件描述符数量达到上限时,会导致文件无法打开、网络连接失败等问题。以下是文件描述符耗尽的原因分析、诊断方法以及解决方案


一、文件描述符耗尽的常见原因

  1. 应用程序未正确关闭文件或连接
  2. 程序未释放打开的文件或网络连接,导致描述符泄漏。
  3. 并发连接过多
  4. 高并发的网络服务(如 Nginx、Redis、MySQL)打开大量连接,超出文件描述符限制。
  5. 系统全局限制不足
  6. 系统设置的全局文件描述符限制过低,导致资源耗尽。
  7. 单个用户或进程限制不足
  8. 某个用户或进程的文件描述符限制较低,无法满足实际需求。
  9. 恶意攻击或异常流量
  10. DDoS 攻击或异常流量导致服务打开大量网络连接,耗尽文件描述符。

二、文件描述符耗尽的诊断方法

1. 检查系统文件描述符限制

  • 查看系统允许的最大文件描述符数量:
  • bash
  • 复制
  • cat /proc/sys/fs/file-max

2. 检查当前使用的文件描述符数量

  • 查看系统当前打开的文件描述符总数:
  • bash
  • 复制
  • lsof | wc -l
  • 查看每个进程使用的文件描述符数量:
  • bash
  • 复制
  • lsof -u <用户名>

3. 检查具体进程的文件描述符使用

  • 列出某个进程打开的文件描述符:
  • bash
  • 复制
  • lsof -p
  • 检查某个进程的文件描述符限制:
  • bash
  • 复制
  • cat /proc//limits

4. 检查文件描述符泄漏

  • 使用 lsof 查找未释放的文件:
  • bash
  • 复制
  • lsof | grep deleted
    • 如果程序删除了文件但未关闭文件描述符,会占用资源。

5. 检查网络连接

  • 检查打开的网络连接数量:
  • bash
  • 复制
  • netstat -an | grep ESTABLISHED | wc -l

三、解决文件描述符耗尽的问题

1. 增加系统级别的文件描述符限制

(1) 临时增加文件描述符限制

  • 修改系统级限制(立即生效但重启失效):
  • bash
  • 复制
  • echo 1000000 > /proc/sys/fs/file-max
  • 验证更改:
  • bash
  • 复制
  • cat /proc/sys/fs/file-max

(2) 永久增加文件描述符限制

  • 编辑 /etc/sysctl.conf,添加以下配置:
  • bash
  • 复制
  • fs.file-max = 1000000
  • 使配置生效:
  • bash
  • 复制
  • sysctl -p

2. 增加用户级别的文件描述符限制

(1) 修改 ulimit 临时值

  • 查看当前用户的文件描述符限制:
  • bash
  • 复制
  • ulimit -n
  • 临时修改文件描述符限制(当前会话有效):
  • bash
  • 复制
  • ulimit -n 65535

(2) 修改用户的永久限制

  • 编辑 /etc/security/limits.conf 文件,添加以下内容:
  • bash
  • 复制
  • <用户名> soft nofile 65535 <用户名> hard nofile 65535
  • 如果使用的是 systemd 服务,还需修改 PAM 配置: 编辑 /etc/pam.d/common-session 和 /etc/pam.d/common-session-noninteractive,添加:
  • bash
  • 复制
  • session required pam_limits.so

3. 修改系统服务的文件描述符限制

(1) 配置 Systemd 服务

  • 如果应用是通过 systemd 启动的,需要修改对应服务的配置: 编辑服务文件(如 /etc/systemd/system/<服务名>.service):
  • bash
  • 复制
  • [Service] LimitNOFILE=65535
  • 重载 systemd 配置并重启服务:
  • bash
  • 复制
  • systemctl daemon-reexec systemctl restart <服务名>

(2) 配置 Shell 脚本启动的服务

  • 如果服务通过脚本启动,可以在脚本中添加:
  • bash
  • 复制
  • ulimit -n 65535

4. 优化应用程序

(1) 修复资源泄漏

  • 检查应用程序是否正确关闭文件和网络连接(例如,通过代码审查或日志分析)。

(2) 调整连接池大小

  • 如果应用程序使用连接池(如数据库连接池),限制连接池的最大大小以减少文件描述符占用。

(3) 增加多线程或异步处理

  • 优化程序的资源管理,减少文件描述符的占用时间。

5. 优化网络服务

(1) 关闭不必要的连接

  • 使用 netstat 或 ss 检查大量空闲的网络连接,并优化网络超时设置(如 keep-alive 参数)。

(2) 增加网络文件描述符

  • 对于高并发服务(如 Nginx、Redis),增加文件描述符限制: Nginx
    编辑 nginx.conf:
  • bash
  • 复制
  • worker_rlimit_nofile 65535;
  • Redis
    编辑 redis.conf:
  • bash
  • 复制
  • maxclients 10000

6. 应对恶意攻击

(1) 限制每个 IP 的连接数

  • 使用防火墙(如 iptables)限制单个 IP 的连接数:
  • bash
  • 复制
  • iptables -A INPUT -p tcp --syn --dport 80 -m connlimit --connlimit-above 50 -j DROP

(2) 启用 DDoS 防护

  • 使用工具(如 fail2ban)限制恶意 IP 的连接。

(3) 配置反向代理

  • 使用反向代理(如 Nginx)分担流量压力。

四、预防措施

  1. 定期监控文件描述符使用情况
  2. 使用 lsof 或 netstat 定期检查系统和应用的文件描述符使用状况。
  3. 优化系统和应用配置
  4. 确保系统及应用的文件描述符限制满足实际需求。
  5. 使用负载均衡或分布式架构分担流量。
  6. 设置报警机制
  7. 使用监控工具(如 Prometheus、Zabbix)监控文件描述符使用情况,设置报警阈值。
  8. 做好资源回收
  9. 定期检查并清理未关闭的文件或连接。

五、总结

文件描述符耗尽通常是由于系统资源不足或程序异常引起的,通过以下步骤可以有效解决问题:

  1. 排查问题:检查文件描述符使用情况,找到耗尽的原因(如应用程序、网络连接)。
  2. 调整限制:增加系统、用户或进程级的文件描述符限制。
  3. 优化应用:修复资源泄漏、优化连接池或网络服务配置。
  4. 防止攻击:使用防火墙、反向代理等手段应对恶意流量。

通过科学的诊断和配置调整,可以避免文件描述符耗尽对系统和应用的影响,保障服务的稳定性和高效性。

扫描二维码推送至手机访问。

版权声明:本文由AR编程网发布,如需转载请注明出处。

本文链接:http://www.arlanguage.com/post/1376.html

分享给朋友:

“如何解决 Linux 系统文件描述符耗尽的问题” 的相关文章

一个比 Nginx 还简单的 Web 服务器

企业级的 Web 服务器非常多,Nginx、Tomcat、Apache、IIS、FastAPI、Flask 等。今天松哥再给大家介绍一个开源的 Web 服务器,这款服务器具备自动 HTTPS 功能和高度可配置性,它的名字是:Caddy。Caddy 是一个 Go 编写的 Web 服务器,类似于 Ngi...

16《Nginx 入门教程》Nginx防盗链配置

百度百科的解释如下:盗链是指服务提供商自己不提供服务的内容,通过技术手段绕过其它有利益的最终用户界面(如广告),直接在自己的网站上向最终用户提供其它服务提供商的服务内容,骗取最终用户的浏览和点击率。受益者不提供资源或提供很少的资源,而真正的服务提供商却得不到任何的收益。盗链在如今的互联网世界无处不在...

Nginx Lua编程基础

Lua是一门脚本动态语言,并不太适合做复杂业务逻辑的程序开发,但是,在高并发场景下,Nginx Lua编程是解决性能问题的利器。Nginx Lua编程主要的应用场景如下:API网关:实现数据校验前置、请求过滤、API请求聚合、AB测试、灰度发布、降级、监控等功能,著名的开源网关Kong就是基于Ngi...

Linux系统非root用户下安装Nginx

通常使用Nginx或者Apache作为Web服务器时,默认监听80端口,因此默认会使用root用户去安装,而且,使用yum命令安装时,通常会安装到默认的路径下,默认路径通常是root用户才有执行权限的。如果不需要使用Nginx监听1024以下的端口,且对权限和网络管理比较严格时,能用非root权限解...

如何在 NGINX 中创建自定义 404 错误页面

每次NGINX在尝试处理客户端请求时遇到错误,它都会返回一个错误。每个错误都包含一个HTTP响应代码和一个简短描述。错误通常通过简单的默认HTML页面显示给用户。幸运的是,您可以配置NGINX以向您的站点或 Web 应用程序的用户显示自定义错误页面。这可以使用 NGINX 的 error_page指...

nginx检查提示“unknown directive &quot;stream&quot; in /etc/*/nginx.conf”

yum安装nginx检查时提示“unknown directive "stream" in /etc/nginx/nginx.conf”yum安装nginx,在配置反代时,出现错误:nginx -tnginx: [emerg] unknown directive "strea...