节点2上crsd无法启动，数据库和监听无法自动启动，比如ocrconfig、ocrcheck以及srvct

在11.2中，CRSD进程不再是RAC中最关键的进程之一。

如果对10g RAC比较熟悉，应该清楚CRSD进程的重要性，Oracle在操作系统启动后，就是通过启动这个进程然后启动整个CLUSTER以及数据库的。

在11.2的RAC中，Oracle调整了ASM，使得OCR和VOT可以存储在ASM磁盘组中。ASM是CLUSTER所支持的一个组件，而CLUSTER启动所需的OCR和VOT却要放在ASM中，这其实要解决一个先有鸡还是先有蛋的问题。最终Oracle通过OHASD进程的方式解决了这个问题，而整个CLUSTER和ASM的架构也发生了重大的变化，OHASD进程取代了CRSD进程变成了RAC环境中最关键的进程。

而CRSD进程的重要性已经低到难以置信的地步，前两天在一个客户的11.2 RAC环境中发现，即使一个节点的CRSD进程没有启动，仍然可以手工启动数据库，且数据库可以正常访问。

导致的问题原因应该是节点2上访问OCR和VOT所在的磁盘组出现了错误，导致CRSD在多次尝试获取OCR中存储的信息失败后自动退出，从而使得节点2无法正常的启动。不过这时节点2上除了CRSD进程外，其他的CLUSTER进程已经完全启动，ASM实例也可以启动，这时可以手工启动节点2上的数据库。

节点2上ASM的alert有如下的错误信息：

<code>Reconfiguration started (old inc 10, new inc 12)</code>

<code>List of instances:</code>

<code> </code><code>1 2 (myinst: 1) </code>

<code> </code><code>Global Resource Directory frozen</code>

<code> </code><code>Communication channels reestablished</code>

<code> </code><code>Master broadcasted resource </code><code>hash</code> <code>value bitmaps</code>

<code> </code><code>Non-</code><code>local</code> <code>Process blocks cleaned out</code>

<code> </code><code>LMS 0: 0 GCS shadows cancelled, 0 closed, 0 Xw survived</code>

<code> </code><code>Set master node info </code>

<code> </code><code>Submitted all remote-enqueue requests</code>

<code> </code><code>Dwn-cvts replayed, VALBLKs dubious</code>

<code> </code><code>All grantable enqueues granted</code>

<code> </code><code>Submitted all GCS remote-cache requests</code>

<code> </code><code>Fix write </code><code>in</code> <code>gcs resources</code>

<code>Reconfiguration complete</code>

<code>IPC Send timeout detected. Sender: ospid 3173 [oracle@rac1 (PING)]</code>

<code>Receiver: inst 2 binc 429480538 ospid 3190</code>

<code>NOTE: [ocrcheck.bin@rac1 (TNS V1-V3) 21461] opening OCR </code><code>file</code>

<code>MEMORY_TARGET defaulting to 1128267776.</code>

<code>* instance_number obtained from CSS = 1, checking </code><code>for</code> <code>the existence of node 0... </code>

<code>* node 0 does not exist. instance_number = 1 </code>

<code>Starting ORACLE instance (normal)</code>

<code>WARNING: Waited 15 secs </code><code>for</code> <code>write IO to PST disk 0 </code><code>in</code> <code>group 1.</code>

<code>WARNING: Waited 15 secs </code><code>for</code> <code>write IO to PST disk 0 </code><code>in</code> <code>group 2.</code>

<code>WARNING: Waited 15 secs </code><code>for</code> <code>write IO to PST disk 0 </code><code>in</code> <code>group 3.</code>

<code>WARNING: Waited 15 secs </code><code>for</code> <code>write IO to PST disk 0 </code><code>in</code> <code>group 4.</code>

<code>WARNING: Waited 15 secs </code><code>for</code> <code>write IO to PST disk 0 </code><code>in</code> <code>group 5.</code>

<code>WARNING: Waited 15 secs </code><code>for</code> <code>write IO to PST disk 0 </code><code>in</code> <code>group 6.</code>

应该就是这个原因导致ocrd进程报错并退出。数据库可以正常打开，节点2上数据库和监听无法自动启动，vip也存在问题。此外节点2上需要ocr信息的工具都无法使用，比如ocrconfig、ocrcheck以及srvctl等。

目前还是没有解决，如有遇到的朋友可以

本文转自xiaocao1314051CTO博客，原文链接： http://blog.51cto.com/xiaocao13140/1935102，如需转载请自行联系原作者

节点2上crsd无法启动，数据库和监听无法自动启动，比如ocrconfig、ocrcheck以及srvct

继续阅读

set define off关闭替代变量功能

报错：'mysql' 不是内部或外部命令，也不是可运行的程序或批处理文件。

Linxu常用命令技巧汇总

ERROR 1 (HY000): Can't create/write to file '/tmp/#sql_4188_1.MYI' (Errcode: 28)

艰难安装LDAP,SSL认证

《Linux命令行与Shell脚本编程大全第2版.布卢姆》pdf

MySQL的4种隔离级别？出现问题

XX系统实施过程问题总结

无组件上传图片到数据库中，最完整解决方案

【MySQL数据库】数据库索引事务1.索引2.事务

neo4j之cypher使用文档

NOSQL安全攻击

mybatis_入门程序Mybatis入门

登录plsql 报错 the account is locked --用户被锁

SequoiaDB巨杉数据库C++驱动概述

Oracle 批量查询传入List 返回List