本数据源自2.5亿参数神经网络血液检测分析平台,汇总了2025-2026年间覆盖10个国家、共264.4万份血液检测分析。每条记录代表一个国家在某个月的宏观健康快照,包含8类疾病/风险状态的流行率、5级风险分层分布以及平台使用量指标。数据完全匿名且仅发布国家级汇总统计。其为全球流行病学对比、疾病风险预测建模、医学大语言模型微调及公共卫生教育提供了稀缺的、高质量的真实世界基准资源。
医疗
表格
图&网络
本数据集是一个整合了全球权威监测机构记录的、覆盖长达两百年的5.0级以上大地震的综合性目录。数据结合了早期历史档案与现代仪器记录,收录了每次地震事件的发生时间、经纬度坐标、震级、深度、定位误差等参数。它旨在为分析全球地震活动的长期时空演变规律、识别地震危险区、研究震级-深度关系以及评估历史数据的完整性提供一套干净、结构化且跨时代可比的数据基础,是地球物理学、灾害风险评估及数据可视化领域的宝贵资源。
其他
图像
表格
本数据集是一个覆盖全球12个城市2014-2024年的逐日气象观测数据合集。其包含了每日的平均温度、相对湿度、降雨量及风速等核心气象要素,形成了长期、连续且标准化的高质量时间序列。其价值在于为研究者与分析师提供了一个可立即用于分析全球气候模式、城市热岛效应、极端天气事件频率以及长期气候变化趋势的基准数据集。本数据集适用于探索性数据分析、时间序列预测建模、跨区域气候对比研究以及相关的机器学习项目。
其他
图像
表格
本数据集收录了NASA“每日天文图说”项目超30年的11186条完整元数据。每条记录包含精选天文图片或视频的高质量链接、专业天文学家撰写的详细科学解释、标题及发布日期等信息。数据集融合了科学视觉内容与专业文本描述,不仅覆盖了深空天体、太阳系与太空任务等主题,更因其权威的来源、超长的时间跨度与标准化的结构,成为进行天文教育、科学传播研究、自然语言处理以及多模态计算机视觉模型训练的独特而珍贵的资源。
制造
图像
表格
图&网络
本数据集是一个融合了家庭日用电量与对应天气观测指标的时间序列数据集,时间跨度为四年。用电量数据足球分析预测网自家庭用电量数据集,天气特征取自官方气象数据。数据集以日为观测单元,每条记录整合了当天的用电总量与多项关键气象变量,清晰地构建了天气条件与能源消耗之间的关联框架。该数据集结构规整、时间连续,为时间序列回归、能源需求预测、特征工程探索以及经典机器学习模型评估而设计,是研究气候敏感型能源需求的理想资源。
能源
图像
表格
本数据集包含2600条记录的合成数据,高度模拟在线外卖平台的每日订单的真实场景,完整覆盖从下单到完成的流程。其核心变量包括顾客年龄、餐厅类型、配送时长、支付方式及订单状态等。数据在高度还原现实业务逻辑的同时确保完全匿名与隐私安全。其结构规整、特征明确,适用于探索性数据分析、配送时间预测、订单状态分类及客户行为洞察,是数据科学初学者和实践者接触业务分析、时序模式挖掘与机器学习建模的理想入门材料。
消费
图像
表格
本数据集是一个适用于自然语言处理任务的高质量、已标注的新闻文章集合。它包含了超过20万篇新闻文章,每篇文章都带有标题、简短的摘要、作者、发布日期,以及多类别主题标签。数据集已经过系统的清洗与预处理,移除了重复项与缺失记录,并标准化了文本与日期格式。其规模庞大、类别多样、文本结构清晰的特点,使其成为进行多类别文本分类、主题建模、新闻摘要生成等任务的理想基准数据,尤其适合用于教育、研究和算法开发。
其他
图像
表格
本数据集收录了全球销量超10万份的电子游戏详细销售记录。数据通过爬取权威游戏销量统计网站获取,并经过清洗。每条记录包含游戏名称、发行平台、发行年份、类型等属性,并拆分了全球四大市场的销售额及全球总销售额。其时间跨度数十年,覆盖主机、掌机及PC等平台,为分析游戏市场趋势、平台竞争格局、地域偏好差异和经典游戏商业成功因素提供了全面、结构化的一手数据,是游戏产业研究、商业分析及数据可视化项目的宝贵资源。
其他
图像
表格
本数据集收录了截至最新统计时注册的超27.1万辆电动汽车的详细记录。数据覆盖车型年份自1997-2024年,不仅包含车辆制造商、型号、车型年份、电动类型、EPA续航里程等属性,更整合了车辆注册地的地理位置、所属县市、邮编及人口普查区等丰富的时空与地理信息。其完整的数据质量和独特的地理空间维度,使其成为分析区域电动汽车采用模式、评估基础设施需求、研究政策影响以及进行市场趋势预测的权威且宝贵的资源。
消费
图像
表格
本数据集收录截至2026年全球1000余个最具影响力网站的跨行业、跨区域流量与参与度快照。它融合了传统流量排名与行为层级的参与度指标(如跳出率、平均会话时长),并引入搜索兴趣指数及综合衡量用户留存与交互深度的参与度得分。数据还标注了网站的主托管国家,使其能够支撑全球视野下的数字注意力竞争格局分析、区域用户行为对比以及搜索热度与流量相关性研究。它是数字营销、用户体验与互联网趋势研究的稀缺资源。
其他
图像
表格
本数据集是一个行为模拟数据,旨在对比短时小睡与咖啡因摄入对个体警觉性、情绪及自评生产力的即时影响。数据模拟学生、职场人士与自由职业者的干预反应,包含干预前后测评分、睡眠时长及副作用等指标。基于前后测与对照设计。其可支持针对哪种策略更有效的因果推断及策略效果比较。其变量丰富、结构清晰,适用于假设检验、回归预测、分类建模及行为科学实证研究,是数据科学学习者与生产力研究者开展证据驱动分析实践的优质素材。
其他
图像
表格
本数据集涵盖2000-2025年全球主要科技公司年度劳动力数据,跨越互联网泡沫至AI爆发等完整经济周期。以“公司-年度”为单元,整合员工总数、新招聘、公开裁员、净变化、雇佣与流失率等核心人力指标,并配以营收、股价及美国宏观指标,构建微观决策与宏观周期联动分析链。数据源自官方年报及公开裁员公告,估算值已明确标注。为研究科技行业就业韧性、人才流动周期与经济冲击传导提供长时序、跨主体标准数据资产。
人力资源
图像
表格
本数据集源自矿区植被恢复对比实验,系统评估裸地、草地、杨树人工林、混交林四种类型对土壤细菌群落及生态系统功能的影响。通过16S rRNA测序获取细菌多样性、物种组成与功能预测,同步测定土壤理化性质与胞外酶活性,并基于主成分分析构建综合土壤肥力指数。数据集包含4处理×重复样本,覆盖从群落组成到生态系统功能的多层级观测指标,为揭示植被恢复下土壤微生物响应机制、指导矿区生态修复提供高价值实证数据。
其他
图像
表格
本数据集是为超市购物行为分析与关联规则挖掘实践而创建的合成数据,旨在帮助学习者掌握发现商品间关联规律的方法。数据模拟了超市的3000笔购物交易,涵盖超过11900件商品记录。其采用标准的事务清单格式,每行记录一笔交易中的一件商品及其对应顾客。该数据集可使学习者能够无缝实践从数据预处理、频繁项集挖掘到关联规则生成与评估的全套流程,是掌握Apriori等经典算法,并深入理解购物行为模式的理想入门资源。
消费
图像
表格
本数据集是一个综合性的客户参与度与流失分析数据集,包含了全球某电子商务/订阅平台上5万名客户的行为、人口统计和交易数据。它涵盖了25个不同特征,提供了客户互动与参与模式的360度全景视图,专门设计用于客户流失预测、用户细分和客户生命周期价值分析等任务。该数据集捕捉了跨网站、移动应用、电子邮件和社交媒体等多渠道的客户交互,并包含一个二元目标变量(是否流失),非常适合用于监督学习的分类任务构建与分析。
消费
图像
表格
图&网络
本数据集是一个包含3万条记录的大规模合成数据集,旨在高度模拟真实的车辆生态驾驶行为与燃油效率模式。它基于车辆远程信息处理、车载诊断及CAN总线传感器等标准数据源,生成了行程级的驾驶指标。该数据集为机器学习建模、统计分析与算法基准测试提供了可靠且易于获取的替代方案,尤其适用于环保驾驶研究、燃油消耗预测及驾驶行为分析等领域。
交通
图像
表格
本数据集收录了Google Play商店的真实用户评论,包含评论文本、星级评分、有用性投票、开发者回复及用户地域等多维度信息。每条记录完整呈现了用户反馈、情感倾向与互动数据及官方响应的互动闭环。本数据集专为自然语言处理、情感分析、用户满意度研究及产品体验优化而设计,为量化应用质量、挖掘用户痛点、评估开发者互动效果提供了高质量的文本与结构化数据基础,是进行意见挖掘与客户洞察的宝贵资源。
其他
图像
表格
本数据集聚焦于医疗健康这一经济关键领域,旨在深入剖析驱动个人保险成本的核心因素。它收录了1338位美国居民的个人健康数据,清晰展示了年龄、身体质量指数(BMI)、吸烟习惯及家庭规模等变量如何最终影响其医疗账单金额。该数据集干净、结构清晰,是初学者练习回归分析(预测具体费用数字)和进行数据可视化的理想材料,非常适合用于预测建模与影响因子分析。
医疗
文本
表格
图&网络
本数据集是一个模拟生成的个人可持续行为研究数据集,包含1400条模拟用户单日活动记录。数据涵盖交通、能源、饮食、数字消费、废弃物及环保行动六大维度,通过量化整合计算出每目的碳足迹当量及低、中、高影响等级。本数据集旨在模拟现实世界中的个人环境行为模式,为构建碳足迹预测模型、分析关键减排行为、进行环境政策模拟以及开展公众环保意识研究提供结构化的数据支撑,是环境科学与数据科学交叉研究的实用工具。
其他
图像
表格
本数据集是一个合成生成的日度面板数据集,旨在分析远程办公中员工的工作行为模式与倦怠风险、工作效率的关联。数据整合了约1800条员工单日记录,涵盖工作时长、屏幕时间、会议、休息、睡眠等客观行为指标,以及任务效率、倦怠评分与风险等级等关键结果变量。通过模拟混合办公场景,本数据集为构建倦怠风险预警模型、优化工作安排及开展人力资源分析提供了结构化仿真数据,是组织行为与健康数据科学交叉研究的实用工具。
其他
图像
表格
本数据集提供了世界卫生组织发布的全球酒精消费统计,涵盖了2000-2022年间188个国家的年度人均酒精消费量。数据以“国家-年份”的结构完整呈现,并包含了置信区间等元数据。它记录了15岁及以上人群每年消费的纯酒精升数,经过系统清洗与标准化,是分析全球及区域酒精消费长期趋势、评估公共卫生政策成效、进行跨国比较以及开展时间序列建模的理想基础数据,适用于全球健康研究、政策制定与数据科学教育等多个领域。
其他
文本
图像
表格
本数据源自2.5亿参数神经网络血液检测分析平台,汇总了2025-2026年间覆盖10个国家、共264.4万份血液检测分析。每条记录代表一个国家在某个月的宏观健康快照,包含8类疾病/风险状态的流行率、5级风险分层分布以及平台使用量指标。数据完全匿名且仅发布国家级汇总统计。其为全球流行病学对比、疾病风险预测建模、医学大语言模型微调及公共卫生教育提供了稀缺的、高质量的真实世界基准资源。
医疗
表格
图&网络
本数据集是一个整合了全球权威监测机构记录的、覆盖长达两百年的5.0级以上大地震的综合性目录。数据结合了早期历史档案与现代仪器记录,收录了每次地震事件的发生时间、经纬度坐标、震级、深度、定位误差等参数。它旨在为分析全球地震活动的长期时空演变规律、识别地震危险区、研究震级-深度关系以及评估历史数据的完整性提供一套干净、结构化且跨时代可比的数据基础,是地球物理学、灾害风险评估及数据可视化领域的宝贵资源。
其他
图像
表格
本数据集是一个覆盖全球12个城市2014-2024年的逐日气象观测数据合集。其包含了每日的平均温度、相对湿度、降雨量及风速等核心气象要素,形成了长期、连续且标准化的高质量时间序列。其价值在于为研究者与分析师提供了一个可立即用于分析全球气候模式、城市热岛效应、极端天气事件频率以及长期气候变化趋势的基准数据集。本数据集适用于探索性数据分析、时间序列预测建模、跨区域气候对比研究以及相关的机器学习项目。
其他
图像
表格
本数据集收录了NASA“每日天文图说”项目超30年的11186条完整元数据。每条记录包含精选天文图片或视频的高质量链接、专业天文学家撰写的详细科学解释、标题及发布日期等信息。数据集融合了科学视觉内容与专业文本描述,不仅覆盖了深空天体、太阳系与太空任务等主题,更因其权威的来源、超长的时间跨度与标准化的结构,成为进行天文教育、科学传播研究、自然语言处理以及多模态计算机视觉模型训练的独特而珍贵的资源。
制造
图像
表格
图&网络
本数据集是一个融合了家庭日用电量与对应天气观测指标的时间序列数据集,时间跨度为四年。用电量数据足球分析预测网自家庭用电量数据集,天气特征取自官方气象数据。数据集以日为观测单元,每条记录整合了当天的用电总量与多项关键气象变量,清晰地构建了天气条件与能源消耗之间的关联框架。该数据集结构规整、时间连续,为时间序列回归、能源需求预测、特征工程探索以及经典机器学习模型评估而设计,是研究气候敏感型能源需求的理想资源。
能源
图像
表格
本数据集包含2600条记录的合成数据,高度模拟在线外卖平台的每日订单的真实场景,完整覆盖从下单到完成的流程。其核心变量包括顾客年龄、餐厅类型、配送时长、支付方式及订单状态等。数据在高度还原现实业务逻辑的同时确保完全匿名与隐私安全。其结构规整、特征明确,适用于探索性数据分析、配送时间预测、订单状态分类及客户行为洞察,是数据科学初学者和实践者接触业务分析、时序模式挖掘与机器学习建模的理想入门材料。
消费
图像
表格
本数据集是一个适用于自然语言处理任务的高质量、已标注的新闻文章集合。它包含了超过20万篇新闻文章,每篇文章都带有标题、简短的摘要、作者、发布日期,以及多类别主题标签。数据集已经过系统的清洗与预处理,移除了重复项与缺失记录,并标准化了文本与日期格式。其规模庞大、类别多样、文本结构清晰的特点,使其成为进行多类别文本分类、主题建模、新闻摘要生成等任务的理想基准数据,尤其适合用于教育、研究和算法开发。
其他
图像
表格
本数据集收录了全球销量超10万份的电子游戏详细销售记录。数据通过爬取权威游戏销量统计网站获取,并经过清洗。每条记录包含游戏名称、发行平台、发行年份、类型等属性,并拆分了全球四大市场的销售额及全球总销售额。其时间跨度数十年,覆盖主机、掌机及PC等平台,为分析游戏市场趋势、平台竞争格局、地域偏好差异和经典游戏商业成功因素提供了全面、结构化的一手数据,是游戏产业研究、商业分析及数据可视化项目的宝贵资源。
其他
图像
表格
本数据集收录了截至最新统计时注册的超27.1万辆电动汽车的详细记录。数据覆盖车型年份自1997-2024年,不仅包含车辆制造商、型号、车型年份、电动类型、EPA续航里程等属性,更整合了车辆注册地的地理位置、所属县市、邮编及人口普查区等丰富的时空与地理信息。其完整的数据质量和独特的地理空间维度,使其成为分析区域电动汽车采用模式、评估基础设施需求、研究政策影响以及进行市场趋势预测的权威且宝贵的资源。
消费
图像
表格
本数据集收录截至2026年全球1000余个最具影响力网站的跨行业、跨区域流量与参与度快照。它融合了传统流量排名与行为层级的参与度指标(如跳出率、平均会话时长),并引入搜索兴趣指数及综合衡量用户留存与交互深度的参与度得分。数据还标注了网站的主托管国家,使其能够支撑全球视野下的数字注意力竞争格局分析、区域用户行为对比以及搜索热度与流量相关性研究。它是数字营销、用户体验与互联网趋势研究的稀缺资源。
其他
图像
表格
本数据集是一个行为模拟数据,旨在对比短时小睡与咖啡因摄入对个体警觉性、情绪及自评生产力的即时影响。数据模拟学生、职场人士与自由职业者的干预反应,包含干预前后测评分、睡眠时长及副作用等指标。基于前后测与对照设计。其可支持针对哪种策略更有效的因果推断及策略效果比较。其变量丰富、结构清晰,适用于假设检验、回归预测、分类建模及行为科学实证研究,是数据科学学习者与生产力研究者开展证据驱动分析实践的优质素材。
其他
图像
表格
本数据集涵盖2000-2025年全球主要科技公司年度劳动力数据,跨越互联网泡沫至AI爆发等完整经济周期。以“公司-年度”为单元,整合员工总数、新招聘、公开裁员、净变化、雇佣与流失率等核心人力指标,并配以营收、股价及美国宏观指标,构建微观决策与宏观周期联动分析链。数据源自官方年报及公开裁员公告,估算值已明确标注。为研究科技行业就业韧性、人才流动周期与经济冲击传导提供长时序、跨主体标准数据资产。
人力资源
图像
表格
本数据集源自矿区植被恢复对比实验,系统评估裸地、草地、杨树人工林、混交林四种类型对土壤细菌群落及生态系统功能的影响。通过16S rRNA测序获取细菌多样性、物种组成与功能预测,同步测定土壤理化性质与胞外酶活性,并基于主成分分析构建综合土壤肥力指数。数据集包含4处理×重复样本,覆盖从群落组成到生态系统功能的多层级观测指标,为揭示植被恢复下土壤微生物响应机制、指导矿区生态修复提供高价值实证数据。
其他
图像
表格
本数据集是为超市购物行为分析与关联规则挖掘实践而创建的合成数据,旨在帮助学习者掌握发现商品间关联规律的方法。数据模拟了超市的3000笔购物交易,涵盖超过11900件商品记录。其采用标准的事务清单格式,每行记录一笔交易中的一件商品及其对应顾客。该数据集可使学习者能够无缝实践从数据预处理、频繁项集挖掘到关联规则生成与评估的全套流程,是掌握Apriori等经典算法,并深入理解购物行为模式的理想入门资源。
消费
图像
表格
本数据集是一个综合性的客户参与度与流失分析数据集,包含了全球某电子商务/订阅平台上5万名客户的行为、人口统计和交易数据。它涵盖了25个不同特征,提供了客户互动与参与模式的360度全景视图,专门设计用于客户流失预测、用户细分和客户生命周期价值分析等任务。该数据集捕捉了跨网站、移动应用、电子邮件和社交媒体等多渠道的客户交互,并包含一个二元目标变量(是否流失),非常适合用于监督学习的分类任务构建与分析。
消费
图像
表格
图&网络
本数据集是一个包含3万条记录的大规模合成数据集,旨在高度模拟真实的车辆生态驾驶行为与燃油效率模式。它基于车辆远程信息处理、车载诊断及CAN总线传感器等标准数据源,生成了行程级的驾驶指标。该数据集为机器学习建模、统计分析与算法基准测试提供了可靠且易于获取的替代方案,尤其适用于环保驾驶研究、燃油消耗预测及驾驶行为分析等领域。
交通
图像
表格
本数据集收录了Google Play商店的真实用户评论,包含评论文本、星级评分、有用性投票、开发者回复及用户地域等多维度信息。每条记录完整呈现了用户反馈、情感倾向与互动数据及官方响应的互动闭环。本数据集专为自然语言处理、情感分析、用户满意度研究及产品体验优化而设计,为量化应用质量、挖掘用户痛点、评估开发者互动效果提供了高质量的文本与结构化数据基础,是进行意见挖掘与客户洞察的宝贵资源。
其他
图像
表格
本数据集聚焦于医疗健康这一经济关键领域,旨在深入剖析驱动个人保险成本的核心因素。它收录了1338位美国居民的个人健康数据,清晰展示了年龄、身体质量指数(BMI)、吸烟习惯及家庭规模等变量如何最终影响其医疗账单金额。该数据集干净、结构清晰,是初学者练习回归分析(预测具体费用数字)和进行数据可视化的理想材料,非常适合用于预测建模与影响因子分析。
医疗
文本
表格
图&网络
本数据集是一个模拟生成的个人可持续行为研究数据集,包含1400条模拟用户单日活动记录。数据涵盖交通、能源、饮食、数字消费、废弃物及环保行动六大维度,通过量化整合计算出每目的碳足迹当量及低、中、高影响等级。本数据集旨在模拟现实世界中的个人环境行为模式,为构建碳足迹预测模型、分析关键减排行为、进行环境政策模拟以及开展公众环保意识研究提供结构化的数据支撑,是环境科学与数据科学交叉研究的实用工具。
其他
图像
表格
本数据集是一个合成生成的日度面板数据集,旨在分析远程办公中员工的工作行为模式与倦怠风险、工作效率的关联。数据整合了约1800条员工单日记录,涵盖工作时长、屏幕时间、会议、休息、睡眠等客观行为指标,以及任务效率、倦怠评分与风险等级等关键结果变量。通过模拟混合办公场景,本数据集为构建倦怠风险预警模型、优化工作安排及开展人力资源分析提供了结构化仿真数据,是组织行为与健康数据科学交叉研究的实用工具。
其他
图像
表格
本数据集提供了世界卫生组织发布的全球酒精消费统计,涵盖了2000-2022年间188个国家的年度人均酒精消费量。数据以“国家-年份”的结构完整呈现,并包含了置信区间等元数据。它记录了15岁及以上人群每年消费的纯酒精升数,经过系统清洗与标准化,是分析全球及区域酒精消费长期趋势、评估公共卫生政策成效、进行跨国比较以及开展时间序列建模的理想基础数据,适用于全球健康研究、政策制定与数据科学教育等多个领域。
其他
文本
图像
表格