Name		Name	Last commit message	Last commit date
parent directory ..
result		result
README.md		README.md
craw_education.py		craw_education.py
test.py		test.py

README.md

Python3 爬取教育网站的URL的语料库

用到requests库获请求URL，获取HTML

方法一：用re正则表达式解析HTML

方法二：用BeautifulSoup解析HTML

保存抓取的数据（文本形式保存）