waiting for subops from××, sub_op_commit_rec 返回时间过长

在有大量io的情况下,遇到osd slow request,查看了ceph daemon perf dump、dump_historic_ops等相关的数据,发现waiting for subops from××,到sub_op_commit_rec的时间比较长,应该是在等待写入副本。但是查看副本对应的osd的监控数据,发现也是类似的问题,也是在等待其他osd写入副本。

到这里,看起来是网络或磁盘io的速度不够导致osd写入不够及时,但是通过节点上的atop/iostat/ifperf等查看,系统资源并没有使用满。

应该如何继续定位问题呢?

请先 登录 后评论

1 个回答

bruins

但是查看副本对应的osd的监控数据,发现也是类似的问题,也是在等待其他osd写入副本。

---- 
这个就不对了,你看副本的osd的dump_history_ops的输出时,要看subop requst的信息,里面找哪两个event之间的时间长!
请先 登录 后评论
  • 1 关注
  • 0 收藏,168 浏览
  • sdkfzv 提出于 2019-04-26 11:56

相似问题