Normalização dos metadados das fontes de informação

De Wiki.bireme.org/pt
Ir para: navegação, pesquisa

Este documento tem como finalidade propor um formato unificado para os metadados das fontes de informação que serão apresentados em portais temáticos e regionais da BVS utilizando o sistema de pesquisa integrada.


Conversão dos registros

Os registros das fontes de informação deverão ser convertidos do suporte atual (ISIS, XISIS, etc) para um formato neutro em XML seguindo o schema proposto a seguir:


<?xml version="1.0" encoding="iso-8859-1"?>
  <add>
     <doc>
        <field name="db"></field>
     </doc>
  </add>
< ! -- XML gerado em: 12/04/2012 as 18:09:10-->

Schema básico das fontes BVS

<?xml version="1.0" encoding="iso-8859-1"?>
  <add>
    <doc>
      <field name="cc">BR275.1</field>
      <field name="id">lil-619594</field>
      <field name="db">LILACS</field>
      <field name="ur">http://scielo.iec.pa.gov.br/scielo.php?script=sci_arttext&pid=S1679-49742012000100002&lng=pt&nrm=iso&tlng=pt</field>
      <field name="au">Freitas, Lúcia Rolim Santana de</field>
      <field name="au">Garcia, Leila Posenato</field>
      <field name="ti">Evolução da prevalência do diabetes e deste associado à hipertensão arterial no Brasil: análise da Pesquisa Nacional por Amostra de Domicílios, 1998, 2003 e 2008</field>
      <field name="ti">Evolution of prevalence of diabetes and associated hypertension in Brazil: analysis of National Household Sample Survey, 1998, 2003 and 2008</field>
      <field name="ta">Epidemiol. serv. saúde</field>
      <field name="ta">Epidemiologia e serviços de saúde</field>
      <field name="ta">Epidemiol. Serv. Saúde (Online)^i2237-9622</field>
      <field name="is">2237-9622</field>
      <field name="pg">7 - 19</field>
      <field name="vi">21</field>
      <field name="cp">BR</field>
      <field name="ct">Humanos</field>
      <field name="ct">Masculino</field>
      <field name="ct">Feminino</field>
      <field name="ct">Adulto</field>
      <field name="da">201203</field>
      <field name="entry_date">2012-05-02</field>
      <field name="fo">Epidemiol. serv. saúde;21(1): 7-19, jan.-mar. 2012. graf, tab.</field>
      <field name="ip">1</field>
      <field name="la">pt</field>
      <field name="la_ab">pt</field>
      <field name="la_ab">en</field>
      <field name="mh">Humanos</field>
      <field name="mh">Masculino</field>
      <field name="mh">Feminino</field>
      <field name="mh">Adulto</field>
      <field name="mh">Hipertensão</field>
      <field name="mh">Diabetes Mellitus/prevenção & controle</field>
      <field name="mh">Diabetes Mellitus/epidemiologia</field>
      <field name="mh">Prevalência</field>
      <field name="mh">Estudos Transversais</field>
      <field name="type">article</field>
      <field name="ab_pt">Objetivo: estimar a prevalência do diabetes e deste associado à hipertensão para os estados brasileiros e o Distrito Federal, em 2008, e descrever sua evolução temporal segundo variáveis sociodemográficas e sua distribuição no Brasil e grandes regiões, em 1998, 2003 e 2008. Métodos: foi realizado estudo transversal com microdados da Pesquisa Nacional por Amostra de Domicílios nos anos selecionados; foram calculados os coeficientes de prevalência brutos e padronizados por sexo e faixa etária, para toda a população e para subgrupos das variáveis sociodemográficas estudadas. Resultados: no Brasil, o coeficiente de prevalência padronizado de diabetes elevou-se de 2,9 por cento em 1998 para 4,3 por cento em 2008, enquanto para o diabetes associado à hipertensão, elevou-se de 1,7 por cento para 2,8 por cento no mesmo período. As regiões Centro-Oeste e Nordeste registraram aumento mais acentuado dos coeficientes, embora, em 2008, os coeficientes mais elevados tenham sido registrados nas regiões Sudeste e Sul. Conclusão: a prevalência de diabetes e hipertensão associada está crescendo rapidamente no Brasil.(AU)</field>
      <field name="ab_en">Objective: to estimate the prevalence of diabetes, and associated hypertension for Brazilian states and Federal District, in 2008, and describe its temporal trends according to sociodemographic variables and its distribution in Brazil and regions, in 1998, 2003 and 2008. Methods: cross-sectional study with microdata from the National Household Sample Survey in the selected years; crude and age-and-sex standardized prevalence rates were calculated for the entire population and for subgroups of the sociodemographic variables. Results: in Brazil, the standardized prevalence rate of diabetes increasedfrom 2.9 per cent in 1998 to 4.3  pre cent 2008; for diabetes associated to hypertension, this ratio rose from 1.7 per cent to 2.8 per cent over the same period. These increases were statistically significant for Brazil, as well as for all rates and categories of the studied variables. Conclusion: the prevalence of diabetes and associated hypertersion is growing rapidly in Brazil.(AU)</field>
      <field name="afiliacao_autor">Freitas, Lúcia Rolim Santana de; Instituto de Pesquisa Econômica Aplicada. Brasília. Brasil</field>
      <field name="afiliacao_autor">Garcia, Leila Posenato; Instituto de Pesquisa Econômica Aplicada. Brasília. Brasil</field>
    </doc>
    <doc>
      <field name="cc">BR1273.1</field>
      <field name="au">Fundação Oswaldo Cruz. Departamento de Arquivo e Documentação</field>
      <field name="bvs">regional</field>
      <field name="cp">BR</field>
      <field name="da">200900</field>
      <field name="db">LILACS</field>
      <field name="entry_date">2010-11-17</field>
      <field name="fo">Rio de Janeiro; Fiocruz; 2009. 132 p. ilus, tab.</field>
      <field name="id">lil-563898</field>
      <field name="la">pt</field>
      <field name="la_ab">pt</field>
      <field name="lo">BR1273.1; 027.1, F981fun</field>
      <field name="pg">132</field>
      <field name="ti">Fundo Carlos Chagas: inventário</field>
      <field name="ti">Carlos Chagas fund: inventory</field>
      <field name="type">monography</field>
      <field name="ab_pt">Traz a público a inventário do fundo Carlos Chagas no ano em que se comemora o centenário de uma das mais significativas contribuições científicas de nosso país para o conhecimento biomédico e para a saúde pública: a descoberta da doença de Chagas. A organização do fundo e a publicação deste inventário integram os esforços empreendidos pela Fundação Oswaldo Cruz para celebrar a descoberta de Carlos Chagas, que inaugurou uma tradição de pesquisa vigente até os dias atuais, e que no último século registrou significativos avanços científicos e tecnológicos, sobretudo no que se refere ao controle da transmissão da doença pela via vetorial e por transfusão de sangue, possibilitando a redução de novos casos. Não obstante tais desenvolvimentos, frutos de um esforço coletivo, esta silenciosa e negligenciada parasitose permanece a desafiar a imaginação de cientistas e governantes dos países em desenvolvimento, nos quais milhões de pacientes chagásicos não dispõem de medicamentos seguros e eficazes.(AU)</field>
      <field name="mh">Saúde Pública/história</field>
      <field name="mh">Arquivos</field>
      <field name="mh">Doença de Chagas/história</field>
      <field name="mh">Cadastro</field>
      <field name="mh">Brasil</field>
     </doc>
  </add>
< ! -- XML gerado em: 12/04/2012 as 18:09:10-->

Tabela de conversão para bases de dados que utilizam a metodologia LILACS

Name Campos LILACS para a exportar para iAHX
cc 01 - Código do Centro
id 02 - Número de Identificação
lo 03 - Localização do Documento
db 04 - Base de Dados
ur 08 - Endereço Eletrônico
ur_"tipo" 08 - Endereço Eletrônico ex. ur_AUDIO
au 10 - Autor Pessoal (nível analítico)
au 11 - Autor Institucional (nível analítico)
ti/ti_"la" 12 - Título (nível analítico)
ti_"la" 13 - Título Traduzido para o Inglês (nível analítico)
pg 14 - Páginas (nível analítico)
au 16 - Autor Pessoal (nível monográfico)
au 17 - Autor Institucional (nível monográfico)
ti/ti_"la" 18 - Título (nível monográfico)
ti_"la" 19 - Título Traduzido para o Inglês (nível monográfico)
pg 20 - Páginas (nível monográfico)
vi 21 - Volume (nível monográfico)
au 23 - Autor Pessoal (nível coleção)
au 24 - Autor Institucional (nível coleção)
ti/ti_"la" 25 - Título (nível coleção)
ti_"la" 26 - Título traduzido para o inglês (nível coleção)
ntv 27 - Número Total de Volumes (nível coleção)
ta 30 - Título (nível série)
vi 31 - Volume (nível série)
ip 32 - Número do Fascículo (nível série)
is 35 - ISSN
la 40 - Idioma do Texto
la_ab 41 - Idioma do Resumo
th_le 49 - Tese, Dissertação - Orientador
th_in 50 - Tese, Dissertação - Instituição à qual se apresenta
th_ti 51 - Tese, Dissertação - Título Acadêmico
cn_in 52 - Evento - Instituição Patrocinadora
cn_na 53 - Evento - Nome
cn_dt 54 - Evento - Data
cn_da 55 - Evento - Data Normalizada
cn_cy 56 - Evento - Cidade
cn_co 57 - Evento - País
pr_in 58 - Projeto - Instituição Patrocinadora
pr_na 59 - Projeto - Nome
pr_nu 60 - Projeto - Número
pu 62 - Editora
ed 63 - Edição
dp 64 - Data de Publicação
da 65 - Data Normalizada
cy 66 - Cidade de Publicação
cp 67 - País de Publicação
isbn 69 - ISBN
pt 71 - Tipo de Publicação
ct 76 - Descritor Pré-Codificado
ab/ab_"la" 83 - Resumo
mh 87 - Descritor Primário
mh 88 - Descritor Secundário
fo 30/31/32/14/64/38/13 - Fonte
type Tipo
afiliacao_autor 10/16 - Afiliação do autor
Descritores_Locais 653 - Descriptores locales
entry_date 84 - Fecha de transferencia para la base de datos

Pontos de verificação

Os seguintes pontos deverão ser válidos para os arquivos resultantes do processo de conversão:

  1. Documento XML bem formado (conforme http://www.w3.org/TR/REC-xml/) e ser válido de acordo com o Schema descrito neste documento.
  2. Caracteres devem ser convertidos/codificados em UTF-8.
  3. Os descritores/qualificadores devem ser armazanados no formato codificado DeCS.
  4. Cada documento convertido deverá possuir elemento contendo o identificador único e a fonte.
  5. No elemento <doc> gerado após a conversão devem estar presentes todos os elementos que serão apresentando no formato de saída da interface de pesquisa
  6. Para cada opção de refinar por grupo (cluster) que se deseje apresentar na interface de pesquisa deve estar presente um elemento (field) no XML resultante da conversão.