import os import time import requests import pandas as pd import random from fake_useragent import UserAgent from lxml import etree from urllib.parse import urlencode class SteamCsgo: def __init__(self, start, save_file_path, page_num): # ç¡®è®¤èµ·å§‹çˆ¬å–å€¼ ç¬¬å‡ ä¸ªå•†å“ self.start = start # ç¡®è®¤è¦çˆ¬å¤šå°‘é¡µ self.page_num = page_num # ç¡®è®¤å˜å‚¨ä½ç½® self.save_file_path = save_file_path # åˆå§‹åŒ–æ•°æ®åˆ—è¡¨ self.item_datas = [] # å®šä¹‰urlå‰å¤´ self.base_url = 'https://steamcommunity.com/market/search/render/?query=&' def get_page(self): count = 0 for page in range(self.page_num): params = { 'start': self.start + 100 * page, 'count': 400, 'search_descriptions': 0, #'sort_column': 'price', 'sort_dir': 'asc', 'appid': 730 } current_url = 'https://steamcommunity.com/market/search/render/?query=&' + urlencode(params) try: requests.DEFAULT_RETRIES = 5 # å¢žåŠ é‡è¯•è¿žæŽ¥æ¬¡æ•° s = requests.session() s.keep_alive = False # å…³é—å¤šä½™è¿žæŽ¥ res = requests.get(url=current_url, headers=self.init_headers()) if res.status_code == 200: count = count + 1 if count % 10 == 0: time.sleep(60) print('å·²æˆåŠŸèŽ·å–ç¬¬{}é¡µ'.format(page + 1)) page_info = res.json() self.parse_page(page_info) self.save_to_csv() time.sleep(random.random() * 15) else: print('å¤±è´¥') except requests.ConnectionError as e: print(e) print('{}é¡µèŽ·å–å¤±è´¥'.format(page)) return None def parse_page(self, page_info): page_html = page_info['results_html'].replace('\r', '').replace('\n', '').replace('\t', '') tree = etree.HTML(page_html) for i in tree.xpath('//a[@class="market_listing_row_link"]'): info = {} info['é¥°å“åç§°'] = i.xpath('.//span[@class="market_listing_item_name"]/text()')[0] # åç§° info['é¥°å“ä»·æ ¼'] = i.xpath('.//span[@class="normal_price"]/text()')[0] # èµ·ä»· info['å½“å‰åœ¨å”®æ•°é‡'] = i.xpath('.//span[@class="market_listing_num_listings_qty"]/@data-qty')[0] # å½“å‰åœ¨å”®æ•°é‡ self.item_datas.append(info) # å˜å‚¨åˆ°csv def save_to_csv(self): df = pd.DataFrame(self.item_datas) df = df.reindex(columns=['é¥°å“åç§°', 'é¥°å“ä»·æ ¼', 'å½“å‰åœ¨å”®æ•°é‡']) if os.path.exists(self.save_file_path) and os.path.getsize(self.save_file_path): df.to_csv(self.save_file_path, mode='a', encoding='utf-8', header=None, index=False) else: df.to_csv(self.save_file_path, mode='a', encoding='utf-8', index=False) print('å·²åˆ›å»º' + self.save_file_path) self.item_datas = [] # ç”Ÿæˆéšæœºua def init_headers(self): headers = { 'User-Agent': UserAgent().random, 'Accept-Language': 'zh-CN', # 'Referer': 'https: // steamcommunity.com / market / search?appid = 730' } return headers if __name__ == '__main__': S = SteamCsgo(6500, './CsgoSteam.csv', 1000) S.get_page()