OAI-PMH
O Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH) é um protocolo desenvolvido pela Open Archives Initiative [en] que define um mecanismo para coleta de registros de metadados em repositórios.[1][2]
Este protocolo, dá uma opção simples de técnica para servidores de dados fazerem sua avaliação de serviço para metadados, baseado nas normas abertas do Hypertext Transfer Protocol (HTTP) e Extensible Markup Language (XML).[1][2]
O metadado colhido pode ser em qualquer formato, definido de acordo por uma comunidade (ou por qualquer conjunto discreto de dados e provedores de dados), embora não qualificado o Dublin Core é um provedor especifico para interoperabilidade de nível básico. Assim, metadados de muitas fontes podem ser reunidos em um banco de dados, e serviços podem ser fornecidos baseados na coleta central, ou dados “agregados”.
A ligação entre os metadados e os conteúdos relacionados não são definidos pelo protocolo OAI. Isto é importante perceber, que o OAI-PMH não constitui uma pesquisa em dados, ele simplesmente faz com que seja possível trazer os dados em um só lugar. Para os provedores de serviços, a aproximação da coleta deve ser combinada com outros mecanismos.
Muitas promessas são vistas para o uso do protocolo dentro da abordagem de um arquivo aberto. O suporte para novos padrões para comunicação científica é o benefício potencial mais divulgado. Talvez mais prontamente realizáveis sejam os objetivos das metas de pavimentação “recursos escondidos” e baixo custo na interoperabilidade.
Embora o OAI-PMH é tecnicamente muito simples, a construção coerente dos serviços que devem atender aos requisitos dos usuários é complexa. O protocolo OAI-PMH poderia fazer parte da infra-estrutura da web, como tomadas – para – concessão como o protocolo HTTP é agora. Uma combinação de sua relativa simplicidade e sucesso comprovado por implementadores no início de um contexto de serviço implicam aceitação generalizada por organizações de pesquisa, editoras e "instituições de memória".
O OAI-PMH, atualmente na versão 2.0, utiliza XML sobre HTTP.
Introdução Específica
[editar | editar código-fonte]Iniciativa de Arquivos Abertos (OAI) (Open Archives Initiative) OAI é uma iniciativa para aumentar e promover normas de interoperabilidade que visa facilitar a disseminação eficiente de conteúdo.
Arquivos (Archives)
[editar | editar código-fonte]O termo “arquivos” do nome Open Archives Initiative reflete a origem da OAI nas comunidades e-prints onde, o termo arquivo é geralmente aceito como um sinônimo para repositório de arquivos acadêmicos. Os profissionais de arquivamento têm justificáveis observações na estrita definição de um arquivo dentro de seus domínios, com conotações de preservação dos valores de longo prazo, autorizações legais e políticas institucionais.
O OAI usa o termo arquivos em um sentindo mais amplo: como um repositório de informação armazenada. Linguagem e termos nunca são incontroversos e o OAI respeitosamente solicita a satisfação do profissional de arquivamentos com esse uso mais amplo do arquivo. O Protocolo de Colheita de Metadados – OAI Protocol for Metadata Harvesting (OAI-PMH) é um protocolo leve para a colheita e disseminação de metadados entre servidores.
Protocolo – Protocol
[editar | editar código-fonte]Um protocolo é um conjunto de regras para definir a comunicação entre sistemas. File Transfer Protocol (FTP) e HTTP são exemplos de outros protocolos usados para comunicação entre sistemas na Internet.
Colheita – Harvesting
[editar | editar código-fonte]No contexto OAI, colheita refere-se especificamente à coleção de metadados para um número de repositórios distribuídos em um armazenamento de dados combinados.
Servidor de Dados - Data Provider
[editar | editar código-fonte]Um Servidor de Dados mantém um ou mais repositórios (servidores web) que suportam o OAI-PMH com um meio de exposição de metadados.
Servidor de Serviços - Service Provider
[editar | editar código-fonte]Uma questão nos Servidores de Serviços OAI-PMH é que os pedidos de provedores de dados utilizam os metadados com uma base para a construção de serviços acrescentando valores.
Principais Pressupostos
[editar | editar código-fonte]Eles são 2 grupos de ‘participantes’: Servidores de Dados e Servidores de Serviços.
Servidores de Dados - Data Providers (repositórios de arquivos abertos) Provê acesso livre aos metadados, e talvez, mas não necessariamente, oferece acesso livre a todos os textos de outros recursos. OAI-PMH prevê uma fácil implementação, baixa barreira a soluções aos servidores de dados.
Servidores de Serviços - Service Providers Usam as interfaces dos servidores de dados OAI para coletar e arquivar metadados. Note que isto significa que não há pedido de pesquisa ao vivo nos servidores de dados; sim, os serviços são baseados na coleta de dados via OAI-PMH. Servidores de serviços podem selecionar determinados subconjuntos do Servidor de dados (e.g., pelo conjunto hierárquico ou de data/hora). Servidores de Serviços oferecem (adiciona valores) serviços básicos e coleta de metadados, e eles podem enriquecer os metadados colhidos.
Visão geral do modelo e estrutura.
[editar | editar código-fonte]Pedidos de argumentos são emitidos como parâmetros GET e POST. O OAI-PMH suporta seis tipos de pedidos enquanto que as respostas são identificadas na sintaxe XML. OAI-PMH suporta qualquer formato de metadado codificado em XML. Dublin Core é o formato mínimo especificado para base de interoperabilidade.
Mensagens de erros são baseadas em http.
[editar | editar código-fonte]Servidores de dados podem definir um conjunto lógico de hierarquia para suportar níveis de granularidade de coleta dos servidores de serviços. Marcações por datas são definida pela ultima alteração do metadado, e assim providencia mais suporte a granularidade de coleta. OAI-PMH suporta fluxo de controle.
7 definições chaves (metadados)
[editar | editar código-fonte]Coleta – Harvester
[editar | editar código-fonte]Aplicação cliente emite pedido OAI-PMH
Repositório - Repository
[editar | editar código-fonte]rede acessa servidor capaz de processar corretamente a requisição OAI-PMH.
Recursos - Resource
[editar | editar código-fonte]Objeto de metadados é “sobre”, constituído de recursos não é definido no OAI-PMH – recursos podem ser digitais ou não digitais.
Item
[editar | editar código-fonte]Componente de um repositório a partir do qual os metadados podem ser disseminados; tem uma identificação única.
Registros - Record
[editar | editar código-fonte]metadado em um formato especifico para metadados
Identificação - Identifier
[editar | editar código-fonte]chave única para um item no repositório.
Conjunto - Set
[editar | editar código-fonte]construtor opcional para agrupar itens em um repositório.
Detalhes do Protocolo
[editar | editar código-fonte]Registros
[editar | editar código-fonte]Um registro é o metadado de um recurso em um formato especifico. Um registro tem três partes: o cabeçalho e metadado, ambos obrigatórios e uma declaração “sobre” opcional. Cada um deles é composto de vários componentes a seguir: Cabeçalho (obrigatório)
- identificador (obrigatório: somente 1)
- data/hora (obrigatório: somente 1)
- setSpec elementos (conjunto de elementos de identificação) (opcional: 0,1 ou mais)
- atributo de status para exclusão de item
Metadado (obrigatório) Codificação XML, metadados com especificação da origem, espaço para nome dos repositórios com suporta Dublin Core, pode suportar outros formatos.
Sobre (opcional) about (optional) demonstrações corretas ascendência correta
Data e Hora
[editar | editar código-fonte]Uma data/hora é a data da ultima modificação do recurso do metadado. Marcação de ata é uma característica obrigatória de todo item. Tem duas possibilidade de nível de granularidade.
YYYY-MM-DD ou YYYY-MM-DDThh:mm:ssZ.
[editar | editar código-fonte]A função da data / hora é fornecer informações sobre os metadados que permite a coleta seletiva usando de argumento. São aplicados em mecanismos de alteração incremental. Ele dá tanto a data de criação, última modificação ou supressão. Exclusão é coberto com três níveis de suporte: não, persistente, transitório.
Esquema de metadados
[editar | editar código-fonte]OAI-PMH suporta disseminações de múltiplos formatos de metadados para um repositório. As propriedades do metadado são:
- id string para especificar o formato(prefixo metadado)
- esquema metadado URL (XML esquema para testar a validação)
- XML namespace URL (identificador global para o formato do metadado)
Repositórios não qualificado devem ser capazes de disseminar Dublin Core. Mais formatos de metadados arbitrários podem ser definidos e transportados através do OAI-PMH. Qualquer metadados retornados deve cumprir com uma especificação de namespace XML. O Dublin Core Metadata Element Set contém 15 elementos. Todos os elementos são opcionais, e todos os elementos podem ser repetidos.
Veja também
[editar | editar código-fonte]Ligações externas
[editar | editar código-fonte]- Especificação do protocolo
- Guia do static-repository
- OAIbiblio Simple (phpoai).
- [3] (DublinCore).
Articles/Artigos
- Lynch, C.A. Metadata Harvesting and the Open Archives Initiative. ARL Bimonthly Report 217, August 2001
- Van de Sompel, Herbert, Krichel, T., Nelson, M. L. and others. The UPS Prototype: An Experimental End-User Service across E-Print Archives. D-Lib Magazine, vol.6, no. 2. February 2000.
- Van de Sompel, H., Lagoze, C. The Santa Fe Convention of the Open Archives Initiative. D-Lib Magazie, vol.6, no.2. February 2000.
Web sites
- OAI Web site
- Open Archives Initiative (OAI) - official site
- Open Archives Forum (OA-Forum Web site)
- OAI-PMH protocol specification
- OAI general mailing list
- OA-Forum expert reports and reviews of organisational and technical issues
- OAI-PMH protocol specification
- OAI-PMH implementation guidelines
- OAI tools
- OAI general mailing list
- OAI implementers discussion list
- Review of Technical Issues
- OA-Forum Information Resource
- Dublin Core