1000点以上の商品を含むSheinデータセットのサンプルです。データセットは Bright Data API を使用して抽出されました。
product_name: 商品の名称またはタイトルdescription: 商品のテキスト説明initial_price: 商品の元の価格または開始価格final_price: 割引やプロモーション適用後の現在の価格または最終価格currency: 価格が表示されている通貨in_stock: 商品が現在在庫ありかどうかを示します(True/False)color: 商品で利用可能な色size: 商品で利用可能なサイズreviews_count: 商品に対して顧客が付けたレビュー数または評価数main_image: 商品を代表するメイン画像category_url: 商品カテゴリに関連付けられたURLまたはリンクurl: 商品ページへのURLまたはリンクcategory_tree: 商品が属するカテゴリの階層ツリー構造country_code: 販売国または原産国を示す国コードdomain: 商品が掲載されているドメインまたはWebサイトimage_count: 商品に関連付けられた画像の総数image_urls: 商品に関連する画像を指すURLmodel_number: 商品に関連付けられたモデル番号(SKU)offers: 商品に関連する特別オファーや取引に関する情報other_attributes: 商品の追加属性または特徴product_id: 商品に関連付けられた一意の識別子またはコードrating: 商品に対して顧客が付けた平均評価related_products: 現在の商品に関連する他の商品に関する情報root_category: 商品が属するルート(最上位)カテゴリtop_reviews: 商品の上位または注目レビューcategory: 商品が属する具体的なカテゴリbrand: 商品に関連付けられたブランドまたはブランド名all_available_sizes: 各商品の利用可能な全サイズのリスト
ほかにも多数あります。
これは「Shein Products (public data)」データセットから派生したサンプルサブセットであり、 当該データセットには 32,800,000点以上の商品 が含まれます。
利用可能なデータセットファイル形式: JSON, NDJSON, JSON Lines, CSV, or Parquet. Optionally, files can be compressed to .gz。
データセット配信タイプのオプション: Email, API download, Webhook, Amazon S3, Google Cloud storage, Google Cloud PubSub, Microsoft Azure, Snowflake, SFTP。
更新頻度: Once, Daily, Weekly, Monthly, Quarterly, or Custom basis。
抽出されたデータポイントに追加できるデータエンリッチメント: Based on request.
商品レビューや評価を掘り下げて消費者の意見を把握し、提供内容が市場の期待と整合していることを確認します。Sheinデータセットを使用して、特定の商品やブランド全体に対する顧客センチメントを理解し、商業戦略の改善に役立てます。 在庫の欠品領域を見つけ、特定商品の需要増加を検知し、消費者トレンドを特定します。Sheinデータセットにより、企業は在庫管理における戦略的意思決定を行い、在庫水準を最適化し、サプライチェーンを効率化できます。 競合の提供内容に含まれる類似商品やカテゴリを特定し、堅牢な価格戦略を構築します。Sheinデータセットを活用して最適価格を判断し、価格ギャップを見つけ、リアルタイムの市場データに基づくダイナミックプライシングモデルを実装できます。Bright Initiativeは、さまざまな環境・社会課題を推進する主要な学術部局・研究者、NGOおよびNPOに対して、Bright Dataの Web Scraper APIs と すぐに使えるデータセット へのアクセスを提供しています。申請は こちら から提出できます。