Skip to content

Latest commit

 

History

History
6 lines (4 loc) · 165 Bytes

File metadata and controls

6 lines (4 loc) · 165 Bytes

Todo list

  • 爬取新浪新闻列表页面,并解析出新闻链接
  • 将链接的新闻页内容文字保存到数据库
  • 使用结巴分词提取关键字