查询报tablet找不到错误

首页版块访问AI主站注册发帖

查询报tablet找不到错误

百度用户#0762194095 发布于2021-05 浏览:3939 回复:13

查询报tablet找不到错误

快速回复

doris be机器宕机后重启后，查询报Failed to get scan range, no queryable replica found in tablet的错误
以下是查询时fe的日志截图：

通过SHOW PROC '/dbs/13055/180479/partitions/180440/186440/186624';
查看tablet状态是DECOMMISSION状态

通过curl -X POST "http://xxx/api/restore_tablet?tablet_id=186624\&schema_hash=359114830" 尝试修复
返回"msg": "tablet already exists, can not restore."
应该是元数据丢失了的问题

哪位大佬帮忙看看，出现有几次了

技术问答

个赞

共13条回复最后由用户已被禁言回复于2021-05

#14用户已被禁言回复于2021-05

看不明白

#13百度用户#0762194095回复于2021-05

对#12 IamStrangers回复

不是这个问题，该问题还没有对应的issue，不过争取近期修复吧

好的

#12IamStrangers回复于2021-05

对#11 百度用户#0762194095回复

是对应[BUG] Colocate balance falls into endless loop when all be crash #5037这个issue吗 https://github.com/apache/incubator-doris/issues/5037 想跟踪下，看什么时候修复。

展开

不是这个问题，该问题还没有对应的issue，不过争取近期修复吧

#11百度用户#0762194095回复于2021-05

对#10 IamStrangers回复

目前存在一个已知bug，就是colocate表的副本在DECOMMISSION状态可能无法恢复，这个问题之后会修复。

展开

是对应[BUG] Colocate balance falls into endless loop when all be crash #5037这个issue吗

https://github.com/apache/incubator-doris/issues/5037

想跟踪下，看什么时候修复。

#10IamStrangers回复于2021-05

对#9 百度用户#0762194095回复

嗯，感谢大佬的解答。之后再出现时我试试，因为刚才我再查了下竟然不会报错了，这也太神奇了，感觉像是修复或者平衡完。。。可是这也太久了。。

展开

目前存在一个已知bug，就是colocate表的副本在DECOMMISSION状态可能无法恢复，这个问题之后会修复。

#9百度用户#0762194095回复于2021-05

对#8 IamStrangers回复

这很有可能是colocation 功能的一个bug。。。目前可能的一个解决方案是先将这tablet对应的table从colocation group中移除（将colocate_with 属性置空即可）。然后该tablet应该会触发副本修复逻辑。等副本状态都正常后，再重新将这个tbl加入colocation group。

展开

#8IamStrangers回复于2021-05

对#7 百度用户#0762194095回复

[图片] 大佬，上面是show proc "/cluster_balance" 的结果，怎么看是否在进行修复或者均衡任务

展开

#7百度用户#0762194095回复于2021-05

对#5 IamStrangers回复

两个副本都处于 decommission 状态的确是不正常的，还需要通过 show proc "/cluster_balance" 查看这个tabet是否在进行修复或者均衡任务，进一步排查

展开

大佬，上面是show proc "/cluster_balance" 的结果，怎么看是否在进行修复或者均衡任务

#6百度用户#0762194095回复于2021-05

使用了 colocation group。version查了是相同的

#5IamStrangers回复于2021-05

对#3 百度用户#0762194095回复

SystemDecommissioned都是false，没有true的。用的是0.14.7版本

展开

两个副本都处于 decommission 状态的确是不正常的，还需要通过 show proc "/cluster_balance" 查看这个tabet是否在进行修复或者均衡任务，进一步排查

#4IamStrangers回复于2021-05

对#3 百度用户#0762194095回复

SystemDecommissioned都是false，没有true的。用的是0.14.7版本

展开

是否使用了 colocation group？

还有，可以通过 show proc 语句在partitions 那一级，看下 partition 的 visible version 和各个 replica 的version 是否相同？

#3百度用户#0762194095回复于2021-05

SystemDecommissioned都是false，没有true的。

用的是0.14.7版本

#2IamStrangers回复于2021-05

restore_tablet 不是干这个的，不要随便用。。。

show backends 看下 SystemDecommissioned 这一列是否有 true。有true 说明正在有节点做decomission下线处理。

还有，你用的是啥版本？

快速回复

TOP

操作指南

常见问答

平台公告

经验交流

技术专区

文字识别

人脸识别

语音技术

PaddlePaddle

EasyDL

BML

EasyData

AI Studio

UNIT

人体分析

图像搜索

图像识别

内容审核

自然语言处理

机器人视觉

视频技术

增强现实

知识图谱

智能创作

智能呼叫中心

文心

EdgeBoard

DuerOS

EasyEdge

度目硬件

百度AI市场

Doris

AI赛事

百度之星大赛

AI Studio人工智能竞赛

语言与智能技术竞赛

千言数据集

集思广益

共享工具

头脑风暴

成果展示

智能客服