12.5. 中断

12.5. 中断
上一页	第 12 章通用访问方法SCSI控制器	下一页

中断例程的确切类型依赖于SCSI控制器所连接到的外围总线的类型（PCI， ISA等等）。

SIM驱动程序的中断例程运行在中断级别splcam上。因此应当在驱动程序中使用splcam()来同步中断例程与驱动程序剩余部分的活动（对于能察觉多处理器的驱动程序，事情更要有趣，但此处我们忽略这种情况）。本文档中的伪代码简单地忽略了同步问题。实际代码一定不能忽略它们。一个较笨的办法就是在进入其他例程的入口点处设splcam()，并在返回时将它复位，从而用一个大的临界区保护它们。为了确保中断级别总是会被恢复，可以定义一个包装函数，如：

static void xxx_action(struct cam_sim *sim, union ccb *ccb) { int s; s = splcam(); xxx_action1(sim, ccb); splx(s); } static void xxx_action1(struct cam_sim *sim, union ccb *ccb) { ... process the request ... }

这种方法简单而且健壮，但它存在的问题是中断可能会被阻塞相对很长的事件，这会对系统性能产生负面影响。另一方面， spl()函数族有相当高的额外开销，因此大量很小的临界区可能也不好。

中断例程处理的情况和其中细节严重依赖于硬件。我们考虑 “典型(typical)”情况。

首先，我们检查总线上是否遇到了SCSI复位（可能由同一SCSI总线上的另一SCSI控制器引起）。如果这样我们丢弃所有入队的和断开连接的请求，报告事件并重新初始化我们的SCSI控制器。初始化期间控制器不会发出另一个复位，这对我们十分重要，否则同一SCSI总线上的两个控制器可能会一直来回地复位下去。控制器致命错误/挂起的情况可以在同一地方进行处理，但这可能需要发送RESET信号到SCSI总线来复位与SCSI 设备的连接状态。

int fatal=0; struct ccb_trans_settings neg; struct cam_path *path; if( detected_scsi_reset(softc) || (fatal = detected_fatal_controller_error(softc)) ) { int targ, lun; struct xxx_hcb *h, *hh; /* 丢弃所有入队的CCB */ for(h = softc->first_queued_hcb; h != NULL; h = hh) { hh = h->next; free_hcb_and_ccb_done(h, h->ccb, CAM_SCSI_BUS_RESET); } /* 要报告的协商的干净值 */ neg.bus_width = 8; neg.sync_period = neg.sync_offset = 0; neg.valid = (CCB_TRANS_BUS_WIDTH_VALID | CCB_TRANS_SYNC_RATE_VALID | CCB_TRANS_SYNC_OFFSET_VALID); /* 丢弃所有断开连接的CCB和干净协商 */ for(targ=0; targ <= OUR_MAX_SUPPORTED_TARGET; targ++) { clean_negotiations(softc, targ); /* report the event if possible */ if(xpt_create_path(&path, /*periph*/NULL, cam_sim_path(sim), targ, CAM_LUN_WILDCARD) == CAM_REQ_CMP) { xpt_async(AC_TRANSFER_NEG, path, &neg); xpt_free_path(path); } for(lun=0; lun <= OUR_MAX_SUPPORTED_LUN; lun++) for(h = softc->first_discon_hcb[targ][lun]; h != NULL; h = hh) { hh=h->next; if(fatal) free_hcb_and_ccb_done(h, h->ccb, CAM_UNREC_HBA_ERROR); else free_hcb_and_ccb_done(h, h->ccb, CAM_SCSI_BUS_RESET); } } /* 报告事件 */ xpt_async(AC_BUS_RESET, softc->wpath, NULL); /* 重新初始化可能花很多时间，这种情况下应当由另一中断发信号 * 指示初始化否完成，或在超时时检查 - 但为了简单我们假设 * 初始化真的很快 */ if(!fatal) { reinitialize_controller_without_scsi_reset(softc); } else { reinitialize_controller_with_scsi_reset(softc); } schedule_next_hcb(softc); return; }

如果中断不是由控制器范围的条件引起的，则很可能当前硬件控制块出现了问题。依赖于硬件，可能有非HCB相关的事件，此处我们指示不考虑它们。然后我们分析这个HCB发生了什么：

struct xxx_hcb *hcb, *h, *hh; int hcb_status, scsi_status; int ccb_status; int targ; int lun_to_freeze; hcb = get_current_hcb(softc); if(hcb == NULL) { /* 或者丢失(stray)的中断，或者某些东西严重错误， * 或者这是硬件相关的某些东西 */ 进行必要的处理; return; } targ = hcb->target; hcb_status = get_status_of_current_hcb(softc);

首先我们检查HCB是否完成，如果完成我们就检查返回的SCSI状态。

if(hcb_status == COMPLETED) { scsi_status = get_completion_status(hcb);

然后看这个状态是否与REQUEST SENSE命令有关，如果有关则简单地处理一下它。

if(hcb->flags & DOING_AUTOSENSE) { if(scsi_status == GOOD) { /* autosense成功 */ hcb->ccb->ccb_h.status |= CAM_AUTOSNS_VALID; free_hcb_and_ccb_done(hcb, hcb->ccb, CAM_SCSI_STATUS_ERROR); } else { autosense_failed: free_hcb_and_ccb_done(hcb, hcb->ccb, CAM_AUTOSENSE_FAIL); } schedule_next_hcb(softc); return; }

否则命令自身已经完成，把更多注意力放在细节上。如果这个CCB 没有禁用auto-sense并且命令连同sense数据失败，则运行REQUEST SENSE 命令接收那些数据。

hcb->ccb->csio.scsi_status = scsi_status; calculate_residue(hcb); if( (hcb->ccb->ccb_h.flags & CAM_DIS_AUTOSENSE)==0 && ( scsi_status == CHECK_CONDITION || scsi_status == COMMAND_TERMINATED) ) { /* 启动auto-SENSE */ hcb->flags |= DOING_AUTOSENSE; setup_autosense_command_in_hcb(hcb); restart_current_hcb(softc); return; } if(scsi_status == GOOD) free_hcb_and_ccb_done(hcb, hcb->ccb, CAM_REQ_CMP); else free_hcb_and_ccb_done(hcb, hcb->ccb, CAM_SCSI_STATUS_ERROR); schedule_next_hcb(softc); return; }

属于协商事件的一个典型事情：从SCSI目标（回答我们的协商企图或由目标发起的）接收到的协商消息，或目标无法协商（拒绝我们的协商消息或不回答它们）。

switch(hcb_status) { case TARGET_REJECTED_WIDE_NEG: /* 恢复到8-bit总线 */ softc->current_bus_width[targ] = softc->goal_bus_width[targ] = 8; /* 报告事件 */ neg.bus_width = 8; neg.valid = CCB_TRANS_BUS_WIDTH_VALID; xpt_async(AC_TRANSFER_NEG, hcb->ccb.ccb_h.path_id, &neg); continue_current_hcb(softc); return; case TARGET_ANSWERED_WIDE_NEG: { int wd; wd = get_target_bus_width_request(softc); if(wd <= softc->goal_bus_width[targ]) { /* 可接受的回答 */ softc->current_bus_width[targ] = softc->goal_bus_width[targ] = neg.bus_width = wd; /* 报告事件 */ neg.valid = CCB_TRANS_BUS_WIDTH_VALID; xpt_async(AC_TRANSFER_NEG, hcb->ccb.ccb_h.path_id, &neg); } else { prepare_reject_message(hcb); } } continue_current_hcb(softc); return; case TARGET_REQUESTED_WIDE_NEG: { int wd; wd = get_target_bus_width_request(softc); wd = min (wd, OUR_BUS_WIDTH); wd = min (wd, softc->user_bus_width[targ]); if(wd != softc->current_bus_width[targ]) { /* 总线宽度改变了 */ softc->current_bus_width[targ] = softc->goal_bus_width[targ] = neg.bus_width = wd; /* 报告事件 */ neg.valid = CCB_TRANS_BUS_WIDTH_VALID; xpt_async(AC_TRANSFER_NEG, hcb->ccb.ccb_h.path_id, &neg); } prepare_width_nego_rsponse(hcb, wd); } continue_current_hcb(softc); return; }

然后我们用与前面相同的笨办法处理auto-sense期间可能出现的任何错误。否则，我们再一次进入细节。

if(hcb->flags & DOING_AUTOSENSE) goto autosense_failed; switch(hcb_status) {

我们考虑的下一事件是未预期的连接断开，这个事件在ABORT或 BUS DEVICE RESET消息之后被看作是正常的，其他情况下是非正常的。

case UNEXPECTED_DISCONNECT: if(requested_abort(hcb)) { /* 中止影响目标和LUN上的所有命令，因此将那个目标和LUN上的 * 所有断开连接的HCB也标记为中止 */ for(h = softc->first_discon_hcb[hcb->target][hcb->lun]; h != NULL; h = hh) { hh=h->next; free_hcb_and_ccb_done(h, h->ccb, CAM_REQ_ABORTED); } ccb_status = CAM_REQ_ABORTED; } else if(requested_bus_device_reset(hcb)) { int lun; /* 复位影响那个目标上的所有命令，因此将那个目标和LUN上的 * 所有断开连接的HCB标记为复位 */ for(lun=0; lun <= OUR_MAX_SUPPORTED_LUN; lun++) for(h = softc->first_discon_hcb[hcb->target][lun]; h != NULL; h = hh) { hh=h->next; free_hcb_and_ccb_done(h, h->ccb, CAM_SCSI_BUS_RESET); } /* 发送事件 */ xpt_async(AC_SENT_BDR, hcb->ccb->ccb_h.path_id, NULL); /* 这是CAM_RESET_DEV请求本身，它完成了 */ ccb_status = CAM_REQ_CMP; } else { calculate_residue(hcb); ccb_status = CAM_UNEXP_BUSFREE; /* request the further code to freeze the queue */ hcb->ccb->ccb_h.status |= CAM_DEV_QFRZN; lun_to_freeze = hcb->lun; } break;

如果目标拒绝接受标签，我们就通知CAM，并返回此LUN的所有命令：

case TAGS_REJECTED: /* 报告事件 */ neg.flags = 0 & ~CCB_TRANS_TAG_ENB; neg.valid = CCB_TRANS_TQ_VALID; xpt_async(AC_TRANSFER_NEG, hcb->ccb.ccb_h.path_id, &neg); ccb_status = CAM_MSG_REJECT_REC; /* 请求后面的代码冻结队列 */ hcb->ccb->ccb_h.status |= CAM_DEV_QFRZN; lun_to_freeze = hcb->lun; break;

然后我们检查一些其他情况，处理(processing)基本上仅限于设置CCB状态：

case SELECTION_TIMEOUT: ccb_status = CAM_SEL_TIMEOUT; /* request the further code to freeze the queue */ hcb->ccb->ccb_h.status |= CAM_DEV_QFRZN; lun_to_freeze = CAM_LUN_WILDCARD; break; case PARITY_ERROR: ccb_status = CAM_UNCOR_PARITY; break; case DATA_OVERRUN: case ODD_WIDE_TRANSFER: ccb_status = CAM_DATA_RUN_ERR; break; default: /*以通用方法处理所有其他错误 */ ccb_status = CAM_REQ_CMP_ERR; /* 请求后面的代码冻结队列 */ hcb->ccb->ccb_h.status |= CAM_DEV_QFRZN; lun_to_freeze = CAM_LUN_WILDCARD; break; }

然后我们检查是否错误严重到需要冻结输入队列，直到它得到处理方可解冻，如果是这样那么就这样来处理：

if(hcb->ccb->ccb_h.status & CAM_DEV_QFRZN) { /* 冻结队列 */ xpt_freeze_devq(ccb->ccb_h.path, /*count*/1); * /* 重新入队这个目标/LUN的所有命令，将它们返回CAM */ for(h = softc->first_queued_hcb; h != NULL; h = hh) { hh = h->next; if(targ == h->targ && (lun_to_freeze == CAM_LUN_WILDCARD || lun_to_freeze == h->lun) ) free_hcb_and_ccb_done(h, h->ccb, CAM_REQUEUE_REQ); } } free_hcb_and_ccb_done(hcb, hcb->ccb, ccb_status); schedule_next_hcb(softc); return;

这包括通用中断处理，尽管特定处理器可能需要某些附加处理。

上一页	上一级	下一页
12.4. 异步事件	起始页	12.6. 错误总览