Jump to content

Melhorias aos Resultados das Pesquisas Globais

From mediawiki.org
This page is a translated version of the page Cross-wiki Search Result Improvements and the translation is 96% complete.

Uma nova meta

O departamento Discovery está examinando a possibilidade de fornecer resultados de pesquisa de outros projetos da Wikimedia com o mesmo idioma (comumente chamados de pesquisas globais).

Por exemplo, se você estivesse no Wikivoyage francês e pesquisasse por “leite”, seriam apresentados artigos correspondentes da Wikipédia francesa e de outros projetos da Wikimedia em francês (ex.: Wikcionário e Wikiquote).

Nesta página, tentaremos resumir algumas das nossas ideias. Convidamos todos os colaboradores a discutir abertamente na página de discussão sobre essa potencial mudança.

A ideia relaciona-se um pouco com o novo recurso que o departamento Discovery (sob o projeto Pesquisa) implantou em 2016. Esse recurso exibe resultados de outras edições da Wikipédia se for determinado que o(a) usuário(a) possa ter usado um termo em outro idioma e se a pesquisa retornar menos que 2 resultados. O tópico desta página – uma nova exibição dos resultados de pesquisa através de wikiprojetos do mesmo idioma – estará em adição ao novo recurso de detecção de idioma, não em substituição.

A justificativa

A maneira da qual a pesquisa funciona nos projetos da Wikimedia é esta: cada projeto tem um índice de pesquisa. Isso significa que atualmente não há como pesquisar através de todos os projetos por resultados relevantes ao mesmo tempo. No entanto, o idioma sempre será o mesmo numa pesquisa, e alguns visitantes podem estar interessados em informações que poderiam estar nos projetos irmãos de mesmo idioma.

O fornecimento de resultados de pesquisas globais (e no mesmo idioma) dará mais informações aos visitantes, maior visibilidade aos outros projetos e aumentará o número de resultados para visitantes, que inclui o potencial para pesquisas que sempre retornem resultados.

Exibir resultados de pesquisa a mais entre os projetos não apenas aumentará a visibilidade aos projetos irmãos como também aumentará o descobrimento de mais artigos de interesse, e possivelmente até trazer novos colaboradores.

Por que ainda não fizemos isso?

Página de resultados de uma pesquisa na Wikipédia inglesa.

Por que não ter um só índice para pesquisar em todos os projetos e em todos os idiomas?

  • Podemos responder como “tecnicamente complexo”: o tamanho do índice de resultados seria quase em terabytes. Por exemplo, o índice de artigos no banco de dados da Wikipédia inglesa tem cerca de 200 gigabytes. A rapidez no fornecimento de resultados seria impactada se usássemos um índice para todo o banco de dados.
  • Outra razão para essa separação entre idiomas justifica-se por não ser muito útil pesquisar um tópico em todos os idiomas. Pesquisar por “Paris” e ver o mesmo artigo em português, inglês e francês não ajudaria muito na descoberta de informações.

Os projetos ingleses são bem grandes:

  • O índice da Wikipédia inglesa para todos os artigos tem cerca de 200 GB
  • O Wikinotícias inglês tem cerca de 15 GB
  • O Wikisource inglês tem cerca de 6 GB

Isso poderá impactar vários fluxos de trabalho existentes, por exibir resultados de pesquisa adicionais.

  • Isso possivelmente afetaria robôs, colaboradores, pesquisadores, leitores, etc.

O plano

No primeiro trimestre (julho – setembro de 2016), a equipe de Engenharia continuou a trabalhar nesses quatro passos:

Primeiro

  • Combinar os índices de mesmo idioma (T139498) Incompleto Parcialmente concluído
  • Pedir ajuda da comunidade – incluindo o tema dessa página. (T137312) Yes Concluído
  • As equipes de Pesquisa e de Design da WMF criarão simulações de como os novos resultados serão exibidos. Yes Concluído

Segundo

No final do próximo trimestre (outubro – dezembro de 2016), a equipe comparará a satisfação com a pesquisa. Isso será feito:

  • após o índice global estar pronto para vários idiomas pré-selecionados (T121541) Yes Concluído
  • após testes A/B para coletar dados em tempo real com os quais serão analizados (T121546) N Cancelado
  • e concluir as simulações para testes front-end em Cross-wiki Search Result Improvements/Testing Yes Concluído
  • enquanto também criar uma instância no Labs para pré-testes. (T151344) Yes Concluído

Terceiro

Neste trimestre (janeiro – março de 2017), iremos:

  • começar os testes A/B para a front-end do novo recurso para análise e comentários da comunidade. (T145917) Em andamento Em andamento
  • continuar a desenvolver e melhorar o backend desse recurso Em andamento Em andamento
  • O primeiro teste A/B/C foi feito, mas não mostrou-se muito conclusivo (T149806) Yes Concluído
  • Um segundo teste A/B será executado, após a correção de um pequeno bug na interface e a adição de quatro outras Wikipédias ao teste, de um total de oito. (T160004) Incompleto Parcialmente concluído

Quarto

Abril – junho de 2017:

  • análise conclusiva do segundo teste A/B para os novos resultados da página de pesquisa (T160008) Incompleto Parcialmente concluído
  • lançar uma nota às esplanadas anunciando a implantação (T162276) Em andamento Em andamento
  • lançar uma postagem no blog sobre a pesquisa
  • implantar em todas as Wikipédias

Exemplos atuais da pesquisa

Já há algumas soluções feitas pela comunidade que divulgam outros projetos da Wikimedia e artigos no mesmo idioma. Abaixo, uma pequena lista de exemplos:

Páginas de resultados de pesquisa para alguns idiomas:

External Search Gadget:

Como esses resultados adicionais seriam exibidos?

O surgimento destes resultados está aberto para discussão, e temos esboços suficientes abaixo com mais possibilidades de design. Abaixo há alguns exemplos de como os novos resultados poderiam parecer, baseando-se em soluções existentes em algumas wikis:

Ajude-nos a escolher a solução

Por favor, diga o que você acha!

  • Dois trimestres serão necessários, pelo menos, para fazer a arquitetura e o design da implementação técnica.
  • A equipe gostaria de fazer alguns testes e mostrá-los para a comunidade no final de 2016.

As perguntas

A equipe tem várias perguntas, e isto é o que gostaríamos de saber da comunidade:

  1. Como esses novos resultados de pesquisa devem ser exibidos?
    1. Os resultados de qualquer wiki em que você esteja devem ser exibidos primeiro e depois ter a opção de mostrar mais de outros wikis?
    2. Deveriam os resultados adicionais serem misturados com os resultados locais da Wiki?
    3. Exibir os resultados adicionais ao lado (ou ao final) da página?
    4. Ter uma opção para desativar esses outros resultados relevantes?
      • Esta poderia ser uma palavra chave para pesquisa ou talvez um botão para o visitante clicar
      • Ou algo semelhante à keyword local:, que pesquisa por imagens locais, não no Commons.
    5. Os resultados adicionais seriam melhor exibidos como uma lista ou um design de grade?
    6. Incluir metadados relevantes (imagens e/ou descrições curtas) com os resultados?
    7. Exibir o tamanho do arquivo (p. ex. 848 bytes (104 palavras)) e a data de criação/modificação?
    8. Devemos indicar que clicar em um resultado o levará para outro projeto wiki?

Quantos resultados de otros Wikis deveríamos mostrar - 1, 2, 3, ou mais?

    1. Deveríamos limitar o método existente de exibição de resultados do wiki em que você pesquisou?
      • Atualmente, até 10 000 resultados são exibidos de forma paginada, mas testes indicam que geralmente apenas os 3 primeiros são úteis.
  1. Esses novos resultados de pesquisa devem funcionar em todos os projetos da Wikimedia?
    1. Por exemplo, se você estiver no Wikiquote, gostaria de ver resultados relevantes do Wikivoyage, da Wikipédia e do Wikinotícias?
    2. Ou, se na Wikipédia, apenas gostaria de ver resultados de outras wikis?
  2. Esses outros resultados relevantes seriam úteis e estimulariam uma exploração profunda ao tópico?
    1. É “chato” ver resultados de outras wikis?
    2. Reciprocamente, estimularia o usuário ter mais conhecimento?
    3. Quanto “peso” damos para os resultados interwiki?
  3. Contribuições serão estimuladas pela exibição de resultados adicionais de outras wikis?
    1. P. ex.: se pesquisar por Piazza del Duomo e não ver um artigo no Wikivoyage sobre a praça (digamos que você esteja no Wikiquote), isso estimularia você a começar um artigo sobre ela?
  4. Devemos limitar o número de idiomas pesquisados?
    1. P. ex.: apenas usar os 50 idiomas principais para implementar o recurso?
    2. Ou, apenas usar os idiomas aos quais estamos detectando filas?

See also: Explore similar, Wiktionary widget, thumbnail icons in search results

Etiquetas no Phabricator:

Notas de discussão:

Após levar em consideração os comentários da comunidade e as recomendações da equipe de design, iremos iniciar os testes A/B. Veja esta página para mais informações.

Esta página foi criada para encorajar usuários a testarem o recurso, através de uma página auto-guiada com exemplos para aqueles que não são tão técnicos e aqueles são um pouco mais experientes.