分析数据库OOM后起库失败报错pre-existing shared memory block的问题,深入解析PG三种共享内存类型及SysV共享内存残留的清理与定位方法
2025年PostgreSQL运维经验总结,聚焦CPU、内存、IO、WAL、autovacuum、锁、分区表、连接池、统计信息等核心运维主题的实战技巧与问题处理
分析新分区无主键导致UPDATE失败的案例:分区表在逻辑复制发布下缺少replica identity,PG11的发布机制与分区创建流程配合不当导致新分区无主键无索引
分析同一行高并发更新导致大量行锁和LWLock LockManager等待的问题,通过压测验证行锁绕过fastpath机制是LWLock竞争加剧的根因
分析统计信息n_distinct严重不准的原因,深入源码解析Haas-Stokes DISTINCT预估算法及其在样本量远小于总行数时的估算偏差问题
分析添加索引后性能反而下降的案例:新建索引导致优化器选择不同执行路径,配合generic plan缓存使analyze无法更新已缓存的错误计划
分析GRANT授权操作导致walsender卡死的问题:大量授权产生海量pg_class变更记录,逻辑解码处理invalidation消息时因pathman插件哈希表遍历消耗过高CPU
2024年PostgreSQL运维经验总结,涵盖执行计划突变、统计信息收集策略、连接池、vacuum、WAL、分区表等常见运维问题的快速诊断与解决思路
深入源码分析PG停库流程与信号机制,排查walsender阻止fast shutdown的根因:逻辑复制walsender在等待消费端反馈时无法响应SIGTERM信号
深入分析PG起库流程中startup进程读取千万级spill文件导致启动缓慢的问题,通过源码解析LSN结构与spill文件命名规则定位根因