Sitemap

De Wiki.bireme.org/pt
Revisão de 15h05min de 10 de outubro de 2014 por Fabio.brito (Discussão | contribs) (Resultado)

(dif) ← Edição anterior | Revisão atual (dif) | Versão posterior → (dif)
Ir para: navegação, pesquisa

O que é um sitemap

Um Sitemap é um arquivo em que é possível listar as páginas de seu site para informar o Google e os outros mecanismos de pesquisa sobre a organização do conteúdo do site. Rastreadores da Web de mecanismos de pesquisa, como o Googlebot, leem esse arquivo para rastrear seu site de forma mais inteligente.

Objetivo da aplicação iahx_sitemap

O iahx_sitemap é uma aplicação desenvolvida utilizando shell script e python, para criar arquivos XML com indicação em forma de link para cada documento existente no iahx a fim de disponibilizar para a ferramenta de busca do Google.

Como instalar e configurar o iahx_sitemap

Obs.: A instação foi realizado sobre Linux Ubuntu

Criar o virtualenv

# instalar virtualenv
sudo apt-get install python-virtualenv
virtualenv IAHX_Sitemaps

Instalar modulo requests do python

sudo apt-get install python-pip
sudo pip install requests

Instalar tidy - ferramenta para checar arquivos HTML e XML

sudo apt-get install tidy

Mover para o diretório e baixar a aplicação

~/IAHX_Sitemaps $ git clone https://github.com/bireme/iahx_sitemap.git

Dar permissão de execução

cd ~/IAHX_Sitemaps
chmod 775 bin/activate
chmod 775 iahx_sitemap/sitemap.sh
chmod 775 iahx_sitemap/tpl/2-XMLs.sh
chmod 775 iahx_sitemap/tpl/createSitemap.sh

Configuração para seu iahx

Editar o arquivo abaixo e configurar conforme seu ambiente
~/IAHX_Sitemaps/iahx_sitemap/tpl/getConfig.inc

Exemplo de execução

cd ~/IAHX_Sitemaps/iahx_sitemap
./sitemap.sh

Resultado

cd ~/IAHX_Sitemaps/iahx_sitemap/sitemap

Cada diretório possui basicamente 1 arquivo XML de index, um ou mais subdiretórios com um ou mais arquivo XML
contendo os links para cada registro de documento na BVS.

Disposição exemplo:

~/IAHX_Sitemaps/iahx_sitemap/sitemap/bvsms/
                                         ├── bvsms
                                         │   └── bvsms_1.xml
                                         └── bvsms_Sitemap_index.xml

Onde bvsms_Sitemap_index.xml temos:

<?xml version="1.0" encoding="UTF-8"?>
    <sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
        <sitemap>
            <loc>http://pesquisa.bvsalud.org/bvsms/sitemap/bvsms/bvsms_1.xml</loc>
            <lastmod>2014-10-02</lastmod>
        </sitemap>
    </sitemapindex>

Onde bvsms_1.xml temos:

<?xml version="1.0" encoding="utf-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://pesquisa.bvsalud.org/bvsms/resource/pt/oai-bvs-ms-ms-36578</loc>
<lastmod>2014-10-02</lastmod>
<changefreq>weekly</changefreq>
</url>
<url>
<loc>http://pesquisa.bvsalud.org/bvsms/resource/pt/oai-bvs-ms-ms-36577</loc>
<lastmod>2014-10-02</lastmod>
<changefreq>weekly</changefreq>
</url>
...

O resultado deverá ser copiado para uma área pública de seu website, e posteriormente deverá ser criado o vínculo na ferramenta do Google para o sitemap disponível em http://www.google.com.br/webmasters/

Disponibilizando o resultado no Google Webmasters

Abaixo segue relato do que foi realizado para cadastrar os sitemaps

- Acessar http://www.google.com.br/webmasters/ Clicar no botão
"Faça login nas Ferramenteas do Google para webmasters"

- Para criar um novo sitemap clicar no botão "ADICIONAR UM SITE"

- Cadastrar a URL

Ex.: pesquisa.bvsalud.org/FI

Aparecerá um procedimento solicitando para criar um arquivo com "chave" do google, para posteriormente ser colocado
no PATH do iahx da FI em questão

Ex.: Para criação de FI portal foi utilizado:
Criação : pesquisa.bvsalud.org/portal

Clicar no botão "VALIDAR", aparecerá uma página web com um conteúdo, que deve ser copiado num arquivo de mesmo nome

Ex.: google856f8530b3523466.html

O arquivo "chave" deverá ser copiado para o diretório web da aplicação
Feito a criação e cópia do arquivo, clicar no botão "VALIDAR" para ativar o sitemap.
Obs.: Poderá ser validado outra hora.

Com o sitemap validado criar os links para os arquivos index

Acessar "-> Rastreamento", "-> Sitemaps", e clicar no botão "ADICIONAR/TESTAR SITEMAP"

Aparecerá um formulário para completar a URL, colocar sitemap/arquivo_index.html

Ex.: No caso da FI CidSaude do portal foi utilizado:
http://pesquisa.bvsalud.org/portal/  [ [   sitemap/CidSaude_Sitemap_index.xml  ] ]

Clicar em "Enviar Sitemap"