Sitemap
Índice
O que é um sitemap
Um Sitemap é um arquivo em que é possível listar as páginas de seu site para informar o Google e os outros mecanismos de pesquisa sobre a organização do conteúdo do site. Rastreadores da Web de mecanismos de pesquisa, como o Googlebot, leem esse arquivo para rastrear seu site de forma mais inteligente.
Objetivo da aplicação iahx_sitemap
O iahx_sitemap é uma aplicação desenvolvida utilizando shell script e python, para criar arquivos XML com indicação em forma de link para cada documento existente no iahx a fim de disponibilizar para a ferramenta de busca do Google.
Como instalar e configurar o iahx_sitemap
Obs.: A instação foi realizado sobre Linux Ubuntu
Criar o virtualenv
# instalar virtualenv sudo apt-get install python-virtualenv virtualenv IAHX_Sitemaps
Instalar modulo requests do python
sudo apt-get install python-pip sudo pip install requests
Mover para o diretório e baixar a aplicação
~/IAHX_Sitemaps $ git clone https://github.com/bireme/iahx_sitemap.git
Dar permissão de execução
cd ~/IAHX_Sitemaps chmod 775 bin/activate chmod 775 iahx_sitemap/sitemap.sh chmod 775 iahx_sitemap/tpl/2-XMLs.sh chmod 775 iahx_sitemap/tpl/createSitemap.sh
Configuração para seu iahx
Editar o arquivo abaixo e configurar conforme seu ambiente ~/IAHX_Sitemaps/iahx_sitemap/tpl/getConfig.inc
Exemplo de execução
cd ~/IAHX_Sitemaps/iahx_sitemap ./sitemap.sh
Resultado
cd ~/IAHX_Sitemaps/iahx_sitemap/sitemap
Cada diretório possui basicamente 1 arquivo XML de index, um ou mais subdiretórios com um ou mais arquivo XML
contendo os links para cada registro de documento na BVS.
Disposição exemplo:
bvsms/ ├── bvsms │ └── bvsms_1.xml └── bvsms_Sitemap_index.xml
Onde bvsms_Sitemap_index.xml temos:
transfer@ts01dx:/home/repository/sitemap/bvsms> more bvsms_Sitemap_index.xml <?xml version="1.0" encoding="UTF-8"?> <sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <sitemap> <loc>http://pesquisa.bvsalud.org/bvsms/sitemap/bvsms/bvsms_1.xml</loc> <lastmod>2014-10-02</lastmod> </sitemap> </sitemapindex>
Onde bvsms_1.xml temos:
transfer@ts01dx:/home/repository/sitemap/bvsms> more bvsms/bvsms_1.xml <?xml version="1.0" encoding="utf-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>http://pesquisa.bvsalud.org/bvsms/resource/pt/oai-bvs-ms-ms-36578</loc> <lastmod>2014-10-02</lastmod> <changefreq>weekly</changefreq> </url> <url> <loc>http://pesquisa.bvsalud.org/bvsms/resource/pt/oai-bvs-ms-ms-36577</loc> <lastmod>2014-10-02</lastmod> <changefreq>weekly</changefreq> </url> ...
O resultado deverá ser copiado para uma área pública de seu website, e posteriormente deverá ser criado o vínculo na ferramenta do Google para o sitemap disponível em http://www.google.com.br/webmasters/
Disponibilizando o resultado no Google Webmasters
Abaixo segue relato do que foi realizado para cadastrar os sitemaps
- Acessar http://www.google.com.br/webmasters/
Clicar no botão
"Faça login nas Ferramenteas do Google para webmasters"
- Para criar um novo sitemap clicar no botão "ADICIONAR UM SITE"
- Cadastrar a URL
Ex.: pesquisa.bvsalud.org/FI
Aparecerá um procedimento solicitando para criar um arquivo com "chave" do google, para posteriormente ser colocado
no PATH do iahx da FI em questão
Ex.: Para criação de FI portal foi utilizado: Criação : pesquisa.bvsalud.org/portal
Clicar no botão "VALIDAR", aparecerá uma página web com um conteúdo, que deve ser copiado num arquivo de mesmo nome
Ex.: google856f8530b3523466.html
O arquivo "chave" deverá ser copiado para o diretório web da aplicação
Feito a criação e cópia do arquivo, clicar no botão "VALIDAR" para ativar o sitemap.
Obs.: Poderá ser validado outra hora.
Com o sitemap validado criar os links para os arquivos index
Acessar "-> Rastreamento", "-> Sitemaps", e clicar no botão "ADICIONAR/TESTAR SITEMAP"
Aparecerá um formulário para completar a URL, colocar sitemap/arquivo_index.html
Ex.: No caso da FI CidSaude do portal foi utilizado: http://pesquisa.bvsalud.org/portal/ [ [ sitemap/CidSaude_Sitemap_index.xml ] ]
Clicar em "Enviar Sitemap"