Skip to content

Latest commit

 

History

History

Folders and files

NameName
Last commit message
Last commit date

parent directory

..
 
 
 
 
 
 
 
 

README.md

Python3 爬取教育网站的URL的语料库

用到requests库获请求URL,获取HTML

方法一:用re正则表达式解析HTML

方法二:用BeautifulSoup解析HTML

保存抓取的数据(文本形式保存)