QueroLerBot

Bot para driblar os paywalls no Twitter

Como o Bot funciona ?

Quando uma pessoa marca o @QueroLerBot em um Tweet com uma URL, o bot irá procurar pelo conteúdo do artigo baseado nas classes do elemento HTML do conteúdo, previamente coletados, no arquivo "news_classes.json". O nome da classe pode variar no mesmo site, dependendo da página. Com o conteúdo coletado, ele envia para o graph.org, onde ficará armazenado. Para evitar fazer o mesmo processo para os mesmos artigos, tanto a url do artigo quanto a url do conteúdo no graph.org, ficam salvos num simples banco de dados sqlite. Assim, quando o bot é acionado, a primeira coisa que ele faz é verificar se o artigo já existe na db.

Como rodar ? (sem nix)

Faça o download ou clone o repositório:

git clone https://github.com/gp2112/QueroLerBot.git

Usando o pip:

 pip install .

Coloque seus tokens e keys da api do twitter nas variáveis de ambientes especificadas:

export QUEROLER_CONSUMER_KEY='sua consumer_key'
export QUEROLER_CONSUMER_SECRET='sua consumer_secret'
export QUEROLER_ACCESS_KEY='sua access_key'
export QUEROLER_ACCESS_SECRET='sua access_secret'

Rode

querolerbot

Como contribuir ?

Sinta-se a vontade para contribuir com o que quiser. Umas ideias pra contribuir são:

Simplificar ao máximo a interação com o usuário
Adicionar novas classes de conteúdo para dar suporte a novos sites em news_classes.json
Adicionar mensagens legais na tupla succ_msgs em app.py.
Organizar mais o código, deixar limpo,

Como achar as classes de conteúdo nos sites?

Na página do artigo, selecione algum trecho do conteúdo do artigo e inspecione o elemento. Agora só buscar pelo elemento "pai" e coletar sua classe. Feito isso, adicione o endereço do site e sua classe no news_classes.json, seguindo o modelo dos outros. Segue um exemplo abaixo com um artigo do Globo:

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

QueroLerBot

Como o Bot funciona ?

Como rodar ? (sem nix)

Como contribuir ?

Como achar as classes de conteúdo nos sites?

Files

README.md

Latest commit

History

README.md

File metadata and controls

QueroLerBot

Como o Bot funciona ?

Como rodar ? (sem nix)

Como contribuir ?

Como achar as classes de conteúdo nos sites?