昨天凌晨被电话吵醒,一套客户的套 11gR2 RAC 异常,正常启动后很快 crash 掉下来,并伴随相关 ora-00600 错误。
通过 alert log 发现以下信息:
从以上信息可以看出,smon 进程在对 object 进行事务 rollback 事务(如114、16)出现异常,导致 smon 正常工作无法进行,导致工作失败 smon 进程 dead,最后 pmon 该过程终止了实例。
在这里,我们以最初的事务(114、16)为例进行分析。
通过查看 trace 我们发现事务信息异常,如下:
从 trace 我们可以看到内容 smon 进程 rollback 当发现事务回滚时访问时 uba 地址与所需信息不匹配或相关信息不正确,即 undo block 信息可能异常。 XID 和 UBA 结构解释如下:
xid:0×0072.010.0006fa20
0072: 转换后的回滚段编号为114,说明事务使用的回滚段为114号
010:事务槽号(slot),转换后为16,说明对应 undo segment header 中的 transaction table 记录中的 index 是16
0006fa20:序号(同一事务可能有多个 SCN,用于区分一个事务中的多个操作)
uba:0x3288715c.1195.20
3288715c:undo block 地址,为16进制,转换为10进制为 847802716,即(202/553308)
1195:sequence number
20:undo record 编号
根据之前的信息判断,Oracle 利用 undo block 对事务进行 rollback 时,发现 undo block 相应的记录是错误的,所以抛出 ora-00600 [ktubko_1] 错误。我们知道 Oracle 中的事务,必须保持其完整性,即一个事务要么成功,要么失败,不能只完成其中的部分操作(如果一个事务涉及到多个操作的 话)。那么,事务中的一些操作能否实现呢? rollback 呢? 如果这个 case 在中间,部分操作可以实现 rollback,那么就可以顺利打开数据库。当然,我在这里的处理方法是通过 100513 event 来屏蔽 Smon 进程的 rollback 操作,open 然后维护相关的 Index。
我们知道 smon 回滚一个事务时,如果涉及多个操作,如何保证回滚的顺序? ?其实是根据 undo chain 来的。当 rollback 到 rci 0点结束事务 rollback。 这里举个测试例子,针对分区表带索引的操作。 当分区表的数据操作时,必然会维护 Index,因此同一个操作,在 undo record 中应该有2个 record 记录,我们来测试一下是否只能回滚这个事务的部分操作。以下是我的测试例子。不要随便玩生产库。~~~~
分区表 delete 例如,操作非常简单,因为客户在这里遇到的情况是 insert,下面我来看看 insert 的情况。
既然我们知道 Oracle 是根据 rci 如果进行回滚,则涉及两个操作,第一个是 Rec 0×34 是针对 index 的操作。第2个操作是 Rec 0×这是针对这个的 index 分区表的操作。 我们知道这是一个完整的事务,所以我们能否实现第一个回滚操作,因为后面 record 可能存在问题或异常,导致问题或异常 smon 不能正常完成。 若只能实现部分回滚事务,则可顺利打开数据库。
实际上,实现这一点很简单。我们只需要修改它 rci 当然,这种操作实际上牺牲了事务的完整性.
对我们来说,关键是:0a160f33 正确的顺序是:330f160a 其中,33表示rci值,0f 是 slot,16是opcode,0a 表示 Layer 编号值。 让我们试试能否满足我们的需求:
我们可以看到数据库打开顺利。 你会发现我们一开始就在我们面前 insert 如果你走路,你可以通过全表扫描找到一个记录。 Index 就不行。因为 Index 中的记录被 smon 进程 rollback 掉了。注意,如果在最初的操作中,如果没有 flush buffer_cache,然后可能没有写记录。 table 还是找不到。
然而,在这种情况下,如果你检查表格,会出现以下类似的错误。我们的正确做法是,将 Index 建议重建 drop,然后 create。 当然,下面你去看看。 trace,您可以看到以下内容:
显然,在牺牲了事务的完整性之后,这一点 table 和 Index 信息不一致。当然,我们所要做的就是重构 Index 即可。
若有针对性 table 数据可能丢失,需要权衡。
文章来源:【love wife & love life —Roger 的 Oracle 技术博客】
配图来源:http://core0.staticworld.net/images/article/2014/09/it_leaders_from_marketing-100453420-primary.idge.jpg