17.6. OAI配置管理

OAI-PMHOpen Archives Initiative Protocol for Metadata Harvesting)协议是机构知识库常用的数据共享和互操作的协议,简称OAI协议。协议中提供数据的一方称为数据提供方,而请求数据的一方称为数据收割方。CSpace系统既可以作为数据提供方,也可以被其他支持OAI接口的系统进行数据收割。数据提供方和收割方的相关配置可以在后台管理控制区的OAI配置管理中进行。

OAI配置管理分为OAI接口管理和OAI收割管理两个部分,OAI接口管理是指本系统作为OAI协议的数据提供方时的接口配置,主要是对元数据的格式和开放进行设置,目前支持oai_dccas_dc元数据格式。

1oai_dc元数据开放和映射

可以选择是否开放oai_dc的元数据格式以供第三方系统进行收割,其中,对于元数据不公开的条目(即匿名用户不可以访问元数据的条目)和非本机构专题的条目,也可以选择元数据开放或者不开放。

 

管理员可以对oai_dc的元数据格式的字段进行映射管理,将CSpace系统内部的元数据字段映射为oai_dc格式的元数据字段。元数据字段列表如下图所示,系统元数据字段名称对应元数据字段管理中各字段的elementqualifier的组合,加上dc的前缀,当qualifier为空的时候,不写或者用*号代替,如作者的系统元数据字段名称为dc.contributor.author,标题的系统元数据字段名称为dc.title.*oai_dc元数据格式采用的是DC元数据标准,包括了titlecreator15个基本的核心元素。

 

管理员可以对各个字段的映射进行编辑或删除操作,也可以增加新的元数据字段映射,编辑页面如下图所示,通常不需要修改映射字段,只需修改对应的系统元数据字段即可。

 

2cas_dc元数据开放和映射

cas_dc元数据格式目前限制开放,通过授权IP地址进行控制,默认的授权IP段为210.77.64.*,即中科院兰州文献情报中心的内部IP段,多个IP地址段用英文逗号分割。授权IP的第三方系统除了可以通过OAI接口获取cas_dc元数据格式的条目数据,还可以通过REST APISolr接口获取作者、全文和访问数据。管理员可以选择是否开放作者数据收割、是否开放全文收割、是否开放访问数据收割,如下图所示:

 

管理员可以对cas_dc的元数据格式的字段进行映射管理,将CSpace系统内部的元数据字段映射为cas_dc格式的元数据字段。元数据字段列表如下图所示,系统元数据字段名称对应元数据字段管理中各字段的elementqualifier的组合,加上dc的前缀,当qualifier为空的时候,不写或者用*号代替,如作者的系统元数据字段名称为dc.contributor.author,标题的系统元数据字段名称为dc.title.*cas_dc元数据格式是CSpace系统在DC元数据标准的基础上扩展而成的一套元数据标准,支持更多的元数据字段,字段名称与CSpace系统基本相同。

 

 

管理员可以对各个字段的映射进行编辑或删除操作,也可以增加新的元数据字段映射,编辑页面如下图所示,映射字段名称与系统元数据字段类似,不同的是前面没有dc前缀。

 

3OAI收割管理

OAI收割管理是指CSpace系统作为OAI协议的数据收割方时需要进行的配置,管理对象是那些开启了OAI收割的专题(见专题管理中的OAI管理),进行收割时间和频率上的管理。如下图所示,管理员可以选择是否开启自动收割;选择收割任务的启动时间,是立即启动还是指定某个时间点;可以选择收割的周期,即收割任务的启动频率,单位为天。页面下方列出了开启OAI收割的专题,点击操作列的编辑按钮,进入该专题的编辑页面。