足球分析预测网(FIFA World Cup)官方网站

全球运动鞋销售与消费者行为数据集

本数据集是涵盖2018至2026年的全球运动鞋零售综合数据集，聚焦多品牌运动鞋销售动态、定价策略与消费者行为，整合6个全球知名运动鞋品牌的真实化数据，覆盖全球多个国家。数据集包含超3万条记录，涵盖订单、品牌、定价、消费者、销售渠道等多维度核心字段，专为探索性数据分析、销售预测及机器学习任务设计，可全面支撑趋势分析、需求预测、消费者洞察等研究，为零售行业决策提供真实、全面的标准化数据支撑。

消费

图像

表格

137

零售商店产品销售模拟数据集

本数据集专为零售分析、机器学习与深度学习实验而设计，是一个合成但贴近现实的模拟数据集。它包含1.5万行数据，模拟了一个虚构零售连锁店的每日产品级销售快照，涵盖定价、促销、门店客流量、竞争情况、库存水平及顾客行为等11个具有非线性依赖关系的数值特征。该数据集通过引入相关性、季节性与复杂交互，真实模拟了销售动态，非常适合用于回归预测、自监督学习、特征工程探索以及异常检测等任务。

消费

图像

表格

224

销售订单数据集

本数据集通过整合客户档案、产品属性（类别、品牌、规格）、多层级的门店与区域地理位置信息，以及销售额、利润率、折扣金额等核心财务指标，系统地构建了零售交易的多维度全景视图。它旨在为深入的探索性数据分析提供坚实基础，使分析者能够有效揭示跨产品线与地域的销售周期性规律、不同客群的购买偏好与价值贡献结构、高利润产品的驱动因素，并识别潜在的市场细分机会，为库存优化、精准营销及区域战略提供数据驱动的决策支持。

金融

图像

表格

226

奥运国家绩效效率数据集

本数据集是一个整合了奥运成绩与社会经济指标的国家级面板数据，涵盖1960-2016年各夏季奥运会参与国。其核心在于通过每运动员奖牌数等效率指标，结合世界银行提供的同期人口、人均GDP等数据，构建了一个公平评估不同规模国家奥运产出的分析框架。本数据集为探究国家资源投入与体育产出的关系、识别高效体育体系、构建奖牌预测模型提供了结构严谨、干净可用的数据基础，是体育经济学与数据科学交叉研究的理想工具。

其他

图像

表格

192

AI开发者工作效率多维度分析数据集

本数据集包含1000条完整记录与13个特征变量，旨在量化分析影响程序员效率的多维因素。数据高度模拟了现代开发者的真实工作场景，核心变量包括传统的编码时长、代码行数和Bug数量，并纳入了AI使用时长、认知负荷、睡眠时长与压力水平等关键影响因子。该数据集结构纯净、无缺失值、规模适中，是进行相关性研究、回归分析与生产力预测模型构建的理想资源，适用于探究技术工具与个体状态如何共同塑造开发效率。

其他

图像

表格

154

消费者购物行为预测数据集

本数据集完整记录了客户的国家、年龄、薪资与购买决策信息，为数据科学实践提供了典型样本。它适用于从数据清洗（如处理缺失薪资、编码国家变量）到探索性分析（如洞察不同年龄段购买力）的全流程学习。在此基础上，数据可直接用于构建分类模型（如逻辑回归、决策树），以客户特征预测购买行为，帮助初学者掌握监督式机器学习从特征工程、模型训练到评估优化的完整流程。其结构清晰、规模适中，是理想的入门实践材料。

消费

图像

表格

182

社交媒体使用模式与成瘾影响数据集

本数据集为合成生成的匿名数据集，旨在分析社交媒体使用行为与个人健康、福祉及生产力的关联。它模拟了全球不同年龄与国家用户的数字习惯，核心变量涵盖使用时长、平台偏好、夜间使用等行为指标，以及成瘾水平、焦虑抑郁评分、睡眠质量与生产力影响等心理与功能指标。数据集以成瘾评分为目标变量，构建了从行为到结果的完整分析链，在保护隐私的前提下模拟现实趋势，适用于探索性分析、模式挖掘、心理健康相关性研究及预测建模。

社会治理

图像

表格

175

小麦经济数据集

本数据集源自美国农业部经济研究局的权威调查，系统整理了美国小麦生产自1998、2004年等历史基准年份至今的纵向经济数据。它不仅提供了全国层面的趋势，更以细分维度详细呈现了不同产区的运营成本、间接成本以及总收益价值。该数据集以其精细的成本结构分解和长期的跨区域可比性，为农业政策的效果评估、生产投资的效益分析、农场管理的成本优化以及相关的学术经济研究提供了极为宝贵且可靠的量化基础。

农业

文本

图像

表格

201

多维度阅读表现与影响因素分析数据集

本数据集是一个结构化、多源整合的教育研究数据集，收录了不同群体在阅读上的表现结果，并关联了丰富的人口统计学特征与关键背景环境因素。数据旨在探究年龄、性别、教育背景、家庭语言环境、阅读资源可及性和数字设备使用习惯等多元变量，如何单独或交互地影响个体的阅读理解能力、阅读速度及阅读兴趣水平。本数据集不仅适用于教育研究者进行差异分析与相关性研究，也为数据科学家构建回归或分类预测模型提供了高质量的基准数据。

教育

图像

表格

107

动物健康状况风险评估数据集

本数据集旨在通过临床症状对动物健康状况进行风险评估。它涵盖了从鸟类到哺乳动物在内的多类物种，每条记录包含五种观察到的症状描述，核心目标为构建一个能根据症状特征预测动物健康状况是否处于危险状态的二元分类模型。数据集中的文本型症状描述存在自然语言的不规范性，同时样本可能存在类别不平衡问题，这为机器学习实践者提供了处理现实数据、构建鲁棒分类器的典型学习场景，适用于动物福利与健康监测领域的研究与应用探索。

其他

图像

表格

183

开发者工作压力仿真数据集

本数据集是一个完全合成的仿真数据集，旨在模拟影响软件开发人员工作压力水平的多种现实因素。通过整合工作时长、睡眠时间、代码缺陷、项目截止日期等10个关键特征，数据集构建了符合真实逻辑的压力模型，目标变量为0-100的连续压力评分。其价值在于模拟了特征间的非线性交互效应，准确反映了压力形成的复杂机制，适用于进行压力预测建模、特征重要性分析与交互研究，也是机器学习处理非线性与混合类型数据的优质教学案例。

其他

图像

表格

232

新冠长期健康影响综合研究模拟数据集

本数据集为研究新冠长期健康影响的合成数据集，聚焦于模拟不同严重程度感染者在康复后面对的长期健康挑战，核心指标包括疲劳、呼吸问题、心理健康与恢复时长。它整合了人口统计学信息、感染严重度、住院史、生活习惯及衍生的长期新冠风险等级，构建了从急性感染到后遗症的完整分析链条。该数据集在保护隐私的前提下模拟真实世界模式，适用于探索性数据分析、风险分类预测建模以及公共卫生与临床医学领域的教学研究。

其他

图像

表格

207

个人消费行为模拟分析数据集

本数据集是一个使用Python完全合成生成的个人消费记录模拟数据集，包含1000余条记录，高度模拟现实世界个人财务行为。其字段覆盖消费日期、金额、消费类别及支付方式等。数据通过受控随机化方法生成，在确保高度现实性的同时实现了完全匿名化处理与隐私安全保证。该数据集结构清晰、主题明确，旨在为探索性数据分析、消费模式可视化、预算管理洞察及构建消费预测机器学习模型提供一个理想且无风险的研究与练习平台。

消费

图像

表格

239

眼部健康综合评估模拟数据集

本数据集包含10000条记录的合成数据，旨在分析数字生活习惯与生理因素对眼部健康的影响。它通过模拟真实行为模式，构建眼健康综合评分指标，整合了屏幕使用参数、户外活动、基础生理与心理状态等特征。数据聚焦于量化屏幕时间、亮度等数字生活变量，和年龄、户外光照等因素如何共同作用于视觉健康。其结构完整、特征清晰，适用于回归预测、相关性分析与特征重要性研究，为健康科技与行为分析领域提供高质量模拟数据资源。

其他

图像

表格

199

电商企业销售与利润分析数据集

本数据集收录了某电商企业2022-2024年超3500笔的交易记录。数据涵盖电子产品、配件和办公用品三大核心品类并细分为北东南西四个主要销售区域。每条记录不仅包含销售额与数量，还有每笔交易产生的净利润，使分析超越收入层面，深入透视不同产品、区域及时间维度的真实盈利能力和成本结构。其旨在通过多维度分析，揭示驱动利润的关键因素与潜在运营问题，为企业的定价策略、库存管理和区域资源调配提供坚实的数据支持。

消费

图像

表格

243

电商交易与利润趋势分析数据集

本数据集系统记录了从2022年1月至2024年12月为期三年的电商平台交易明细数据。它涵盖了订单时间、产品类别与名称、销售区域、销售数量、销售额及利润等核心业务维度，形成了一个可用于深入分析销售动态、产品表现与区域业绩的完整数据基础。该数据集旨在支持多角度的时间序列趋势预测、产品组合效益评估、区域市场策略制定以及整体财务表现分析，为电商运营决策提供数据驱动的洞察。

消费

图像

表格

356

零售易腐品管理数据集

本数据集是一个包含10万条记录的合成零售数据集，全面模拟易腐商品从采购、存储到销售或报废的全链路管理。数据覆盖10个商品品类，时间跨度两年，并包含多家门店与供应商信息。它整合了产品详情、存储环境、需求模式、损耗风险及财务结果等42个特征变量，完整刻画影响易腐品利润与浪费的核心因素。它专为构建损耗预测、智能补货、需求预测及动态定价优化模型而设计，是零售运营分析与供应链数据科学的综合性实践平台。

消费

图像

表格

277

全球人工智能就业影响追踪数据集

本数据集提供了一个覆盖2010至2025年、80多个国家及多元行业的合成职位数据库，旨在填补追踪人工智能对就业长期影响的全球数据空白。它包含5000条记录，每条均整合了AI采用信号、技能需求、薪资动态、自动化风险及行业成熟度等多维指标。该数据集基于真实市场趋势模拟生成，为研究人员分析AI职位增长时序、量化技能薪资溢价、评估岗位替代风险以及进行技能聚类，提供了一个全面、安全且结构化的研究与实践平台。

人力资源

图像

表格

226

电影推荐评分数据集

本数据集是一个广泛应用于推荐系统研究和实践的基准数据集，收录了海量用户对电影的显式评分记录。其核心数据包括用户ID、电影ID、评分值及时间戳，构建了标准的“用户-物品”交互矩阵。该数据集清晰体现了用户偏好稀疏性、评分分布偏差及时序效应等核心挑战。其旨在为开发和评估协同过滤、矩阵分解、深度学习推荐等算法提供一个标准化、可复现的实验平台，是推荐系统入门学习与前沿算法研究的理想数据资源。

其他

图像

表格

229

粉底色号多样性分析数据集

本数据集用于量化分析粉底液产品的色号多样性及包容性。它采集自美国、尼日利亚、日本与印度市场的头部品牌，通过提取官方色板的十六进制颜色值，并转换为CIE Lab明度值，将色彩转化为可量化数据。数据包含8个预设分组，除地区畅销榜外，特别设置了由BIPOC创始人创立的品牌组别，以探究创始人背景对色彩包容性的影响。该数据集为美妆行业的多样性研究、产品设计与社会文化分析提供了结构化支持。

其他

图像

表格

206

诺贝尔奖得主历史数据集

本数据集提供了1901-2016年所有诺贝尔奖得主的完整、结构化的记录。它收录了在化学、文学、生理学或医学等六大领域的获奖者信息。每条记录包含获奖年份、类别和获奖者姓名等基础信息，以及获奖年龄、性别、国别、所属机构和获奖原因等多维数据。该数据集为分析科学与社会领域中的获奖趋势、地理分布、机构贡献、多样性变迁以及学科演变提供了独一无二的数据基础，是历史研究、科学社会学分析与数据科学教学的宝贵资源。

教育

图像

表格

286