文章
2025
案例-授权和walsender跑不动
·3160 字·7 分钟
分析GRANT授权操作导致walsender卡死的问题:大量授权产生海量pg_class变更记录,逻辑解码处理invalidation消息时因pathman插件哈希表遍历消耗过高CPU
pg数据库运维经验2024
·13779 字·28 分钟
2024年PostgreSQL运维经验总结,涵盖执行计划突变、统计信息收集策略、连接池、vacuum、WAL、分区表等常见运维问题的快速诊断与解决思路
PG停库逻辑和walsender阻止停库问题分析
·12191 字·25 分钟
深入源码分析PG停库流程与信号机制,排查walsender阻止fast shutdown的根因:逻辑复制walsender在等待消费端反馈时无法响应SIGTERM信号
PG起库逻辑和spill导致起库慢问题分析
·9405 字·19 分钟
深入分析PG起库流程中startup进程读取千万级spill文件导致启动缓慢的问题,通过源码解析LSN结构与spill文件命名规则定位根因
2024
读书笔记——DDIA-v2 设计数据密集型应用(第二版)
·14391 字·29 分钟
《设计数据密集型应用》读书笔记:系统梳理OLTP/OLAP、云原生、数据湖仓等核心概念,摘录分布式数据系统的精辟洞见
PostgreSQL案例:planning time超长问题分析
·3780 字·8 分钟
分析planning time超长(近1秒)和planning shared hit超100万的问题,根因是pg_statistic表膨胀导致CatCacheMiss时缓存了大量死元组数据