数据集是大规模的模拟数据集,筛选后提供一个平衡的 5 万样本数据集。数据集涵盖材料属性、器件结构等多方面 48 个特征,用于可再生能源等研究。适用于机器学习模型训练、特征分析等任务,助力钙钛矿太阳能电池效率提升与结构优化,推动可再生能源领域发展。
能源
文本
表格
数据集围绕尼泊尔易受水文气象灾害的背景构建,以 2021 年梅拉姆奇洪水事件为契机开发,旨在为早期灾害预测系统提供支撑。数据源于尼泊尔 BIPAD 门户和 NASA POWER API,涵盖日降水量、土壤湿度等关键特征。适用于训练随机森林模型,助力提升滑坡和洪水灾害的预警能力,保护生命与基础设施。
社会治理
文本
表格
数据集聚焦 12 个非洲城市,为解决蛇咬伤问题而构建。数据集引入城市蛇类迁徙风险指数(USDRI),结合四种机制评估风险。数据源于 iNaturalist、GBIF 等,涉及蛇类目击、物种、医院距离等信息。适用于研究蛇类迁徙与城市发展关系,助力制定蛇咬伤预防策略,提升非洲城市蛇类安全管理水平。
社会治理
文本
表格
数据集拥有超 100 万高质量教育问答对话,专为训练 AI 聊天机器人、教育辅助工具和语言模型打造。数据覆盖 8 个教育类别,涵盖中小学及大学多样学术科目,答案经严格验证,采用便于使用的 CSV 格式,还会定期更新。适用于 AI 教育应用开发、语言模型优化等,助力提升 AI 教育服务质量。
其他
文本
表格
数据集包含 20万条标本观测记录,涉及100多种水生生物,覆盖地球各大水生生物群落。数据涵盖分类学、栖息地、生态学等多方面,源于多个权威生物数据库。适用于物种分类、保护状态预测、生物多样性研究等,助力水生生态研究与海洋保护。
其他
文本
表格
数据集涵盖一家美国全国性糖果经销商从工厂到客户的销售及地理空间运输信息。包含客户与工厂位置、销售订单与目标、产品细节等数据。适用于分析运输路线效率、产品利润率及优化产品线布局,助力经销商提升物流效率、降低成本、提高利润。
消费
文本
表格
数据集源于一家虚构的计算机硬件销售公司的 B2B 销售管道。它涵盖客户账户、产品、销售团队和销售机会等信息,可用于评估销售团队及个人表现、分析销售趋势和产品赢单率等。通过这些分析,能帮助企业优化销售策略、提升业绩、合理分配资源。
消费
文本
表格
数据集源自官方公开政府数据,涵盖 2020年至2024年洛杉矶市的详细犯罪报案记录。数据包含犯罪类型、地点、时间、受害者信息及案件状态等。适用于探索性数据分析、可视化展示,可构建机器学习模型用于犯罪预测、分类和趋势分析,也有助于研究犯罪时间规律、地理分布,洞察城市安全状况。
社会治理
文本
表格
数据集源于 NASA 的 NeoWS API,涵盖 1900 年 1 月 1 日至 2026 年 4 月 4 日的小行星信息,共 41 列 23,447 条记录。数据可用于搜索特定小行星或按与地球最近接近日期查找。适用于天文学研究,如分析小行星轨道特征、潜在危险性,助力了解小行星动态及对地球的潜在影响。
其他
文本
表格
数据集涵盖 3000 款有线和无线耳机产品,包含来自制造商数据表及零售平台的 30 项特征数据,无缺失值。数据涉及 50 多个品牌,发布年份在 2016 - 2024 年,价格 20 - 2000 美元不等。适用于探索性数据分析、机器学习、数据可视化及市场研究等场景,助力挖掘耳机市场规律与趋势。
消费
文本
表格
数据集聚焦一家欧洲银行 10,000 名客户的账户信息,涵盖信用评分、账户余额、产品信息及客户是否流失等关键数据。可用于分析客户流失原因、预测流失可能性、研究客户总体特征、比较不同国籍客户行为差异以及对客户进行细分等场景,为银行制定客户关系管理策略提供有力数据支持。
金融
文本
表格
该数据集聚焦 2010 - 2024 年中国 42 个城市生活成本与薪资对比,数据源于中国国家统计局工资报告及 Numbeo 等。涵盖城市层级、人口、工资、生活成本等多方面信息,可用于分析中国城市经济发展、居民生活负担、探究工资增长与通货膨胀关系、各层级城市发展差异等,为研究中国城市经济社会状况提供有力数据支持。
社会治理
文本
表格
该数据集为虚构视频流媒体平台 MavenFlix 的订阅记录,涵盖 2022 年 9 月至 2023 年 9 月约 2900 名订阅者信息。每条记录包含客户订阅的关键数据,如订阅费用、创建与取消日期、订阅间隔及支付状态。适用于分析平台订阅趋势、客户留存等情况,助于了解平台运营状况和用户行为。
其他
文本
表格
数据集涵盖 1957 年至 2024 年轨道与亚轨道太空发射的完整历史,包含 7500 次发射等丰富信息,分属 5 个时代,涉及 92 种火箭、35 个发射场等。数据集含 5 个文件,记录发射、组织、火箭等详细数据。适用于分析发射成功率、成本变化、国家竞争等太空领域相关研究。
其他
文本
表格
数据集源自暗能量光谱仪数据发布,包含 5 万个经光谱确认的天文天体记录,涵盖恒星、星系和类星体,跨度达 124 亿光年。数据集含 51 列,覆盖天球坐标、光谱红移等多方面数据,且在三个光谱类别上平衡。适用于多类光谱分类、光度红移回归等数据科学研究,助力探索宇宙天体奥秘与宇宙学研究。
教育
文本
表格
数据集模拟大型零售公司固定资产登记册,含 10 万项资产的财务、运营及审计相关属性。可用于探索性数据分析、机器学习、财务建模以及审计与风险分析等场景。为研究零售企业固定资产管理,挖掘财务与审计信息提供有力数据支持,助力企业优化资产管理策略。
消费
文本
表格
数据集结合真实与合成数据,模拟碳定年实际状况,用于估算考古及环境样本年代。数据集含原始实验室测量值与反映测量噪声、污染等变化的合成样本。通过多个特征,适用于借助回归模型预测样本年代、处理嘈杂科学数据、开展特征工程及研究测量影响等场景,为碳定年相关研究及模型评估提供实用数据。
教育
文本
表格
该数据聚焦劳动力管理(WFM),构建端到端数据管道与 KPI 仪表板。针对企业 WFM 数据来源多样、队列名杂乱等常见问题,利用 Python、PySpark 等技术,从多数据源获取数据,经清洗、标准化等处理,生成适合预测、KPI 验证及自动化的 SQL 主数据集,可用于需求预测、Power BI 可视化等场景,展示数据工程全流程概念与实践。
教育
文本
表格
生物&化学
数据集聚焦黄金这一重要宏观经济资产的定价行为。借助先进统计与可视化技术,可全面探索黄金市场动态。涵盖市场结构可视化、波动聚集性等多个关键分析主题,应用交互式蜡烛图等多种可视化技术。适用于研究人员在制定策略前,通过可视化分析挖掘黄金市场隐藏结构,洞察市场动态与金融稳定状况。
金融
文本
表格
分子相互作用流形与活性悬崖数据集,完全合成且达科研级别,用于模拟化学空间特性。与传统分子数据集不同,它采用多视角、关系型且具流形感知的表示法,融合多种特征于统一框架。适用于药物发现、分子相似性学习等高级机器学习任务,其独特架构弥补了学术与现实药物发现数据间差距,推动模型应对复杂场景。
教育
文本
图像
表格
数据集包含 33502 个工业电气符号,以 33500 张 EPLAN IEC、NFPA、GB 电气符号的 PNG 图像形式呈现,附带完整技术元数据和 AI 生成的视觉描述。适用于自动化工程中电气符号的自动分类、电气原理图的工业 OCR、相关模型微调以及技术文档的视觉检索增强生成等场景。
制造
文本
图像
表格
数据集是大规模的模拟数据集,筛选后提供一个平衡的 5 万样本数据集。数据集涵盖材料属性、器件结构等多方面 48 个特征,用于可再生能源等研究。适用于机器学习模型训练、特征分析等任务,助力钙钛矿太阳能电池效率提升与结构优化,推动可再生能源领域发展。
能源
文本
表格
数据集围绕尼泊尔易受水文气象灾害的背景构建,以 2021 年梅拉姆奇洪水事件为契机开发,旨在为早期灾害预测系统提供支撑。数据源于尼泊尔 BIPAD 门户和 NASA POWER API,涵盖日降水量、土壤湿度等关键特征。适用于训练随机森林模型,助力提升滑坡和洪水灾害的预警能力,保护生命与基础设施。
社会治理
文本
表格
数据集聚焦 12 个非洲城市,为解决蛇咬伤问题而构建。数据集引入城市蛇类迁徙风险指数(USDRI),结合四种机制评估风险。数据源于 iNaturalist、GBIF 等,涉及蛇类目击、物种、医院距离等信息。适用于研究蛇类迁徙与城市发展关系,助力制定蛇咬伤预防策略,提升非洲城市蛇类安全管理水平。
社会治理
文本
表格
数据集拥有超 100 万高质量教育问答对话,专为训练 AI 聊天机器人、教育辅助工具和语言模型打造。数据覆盖 8 个教育类别,涵盖中小学及大学多样学术科目,答案经严格验证,采用便于使用的 CSV 格式,还会定期更新。适用于 AI 教育应用开发、语言模型优化等,助力提升 AI 教育服务质量。
其他
文本
表格
数据集包含 20万条标本观测记录,涉及100多种水生生物,覆盖地球各大水生生物群落。数据涵盖分类学、栖息地、生态学等多方面,源于多个权威生物数据库。适用于物种分类、保护状态预测、生物多样性研究等,助力水生生态研究与海洋保护。
其他
文本
表格
数据集涵盖一家美国全国性糖果经销商从工厂到客户的销售及地理空间运输信息。包含客户与工厂位置、销售订单与目标、产品细节等数据。适用于分析运输路线效率、产品利润率及优化产品线布局,助力经销商提升物流效率、降低成本、提高利润。
消费
文本
表格
数据集源于一家虚构的计算机硬件销售公司的 B2B 销售管道。它涵盖客户账户、产品、销售团队和销售机会等信息,可用于评估销售团队及个人表现、分析销售趋势和产品赢单率等。通过这些分析,能帮助企业优化销售策略、提升业绩、合理分配资源。
消费
文本
表格
数据集源自官方公开政府数据,涵盖 2020年至2024年洛杉矶市的详细犯罪报案记录。数据包含犯罪类型、地点、时间、受害者信息及案件状态等。适用于探索性数据分析、可视化展示,可构建机器学习模型用于犯罪预测、分类和趋势分析,也有助于研究犯罪时间规律、地理分布,洞察城市安全状况。
社会治理
文本
表格
数据集源于 NASA 的 NeoWS API,涵盖 1900 年 1 月 1 日至 2026 年 4 月 4 日的小行星信息,共 41 列 23,447 条记录。数据可用于搜索特定小行星或按与地球最近接近日期查找。适用于天文学研究,如分析小行星轨道特征、潜在危险性,助力了解小行星动态及对地球的潜在影响。
其他
文本
表格
数据集涵盖 3000 款有线和无线耳机产品,包含来自制造商数据表及零售平台的 30 项特征数据,无缺失值。数据涉及 50 多个品牌,发布年份在 2016 - 2024 年,价格 20 - 2000 美元不等。适用于探索性数据分析、机器学习、数据可视化及市场研究等场景,助力挖掘耳机市场规律与趋势。
消费
文本
表格
数据集聚焦一家欧洲银行 10,000 名客户的账户信息,涵盖信用评分、账户余额、产品信息及客户是否流失等关键数据。可用于分析客户流失原因、预测流失可能性、研究客户总体特征、比较不同国籍客户行为差异以及对客户进行细分等场景,为银行制定客户关系管理策略提供有力数据支持。
金融
文本
表格
该数据集聚焦 2010 - 2024 年中国 42 个城市生活成本与薪资对比,数据源于中国国家统计局工资报告及 Numbeo 等。涵盖城市层级、人口、工资、生活成本等多方面信息,可用于分析中国城市经济发展、居民生活负担、探究工资增长与通货膨胀关系、各层级城市发展差异等,为研究中国城市经济社会状况提供有力数据支持。
社会治理
文本
表格
该数据集为虚构视频流媒体平台 MavenFlix 的订阅记录,涵盖 2022 年 9 月至 2023 年 9 月约 2900 名订阅者信息。每条记录包含客户订阅的关键数据,如订阅费用、创建与取消日期、订阅间隔及支付状态。适用于分析平台订阅趋势、客户留存等情况,助于了解平台运营状况和用户行为。
其他
文本
表格
数据集涵盖 1957 年至 2024 年轨道与亚轨道太空发射的完整历史,包含 7500 次发射等丰富信息,分属 5 个时代,涉及 92 种火箭、35 个发射场等。数据集含 5 个文件,记录发射、组织、火箭等详细数据。适用于分析发射成功率、成本变化、国家竞争等太空领域相关研究。
其他
文本
表格
数据集源自暗能量光谱仪数据发布,包含 5 万个经光谱确认的天文天体记录,涵盖恒星、星系和类星体,跨度达 124 亿光年。数据集含 51 列,覆盖天球坐标、光谱红移等多方面数据,且在三个光谱类别上平衡。适用于多类光谱分类、光度红移回归等数据科学研究,助力探索宇宙天体奥秘与宇宙学研究。
教育
文本
表格
数据集模拟大型零售公司固定资产登记册,含 10 万项资产的财务、运营及审计相关属性。可用于探索性数据分析、机器学习、财务建模以及审计与风险分析等场景。为研究零售企业固定资产管理,挖掘财务与审计信息提供有力数据支持,助力企业优化资产管理策略。
消费
文本
表格
数据集结合真实与合成数据,模拟碳定年实际状况,用于估算考古及环境样本年代。数据集含原始实验室测量值与反映测量噪声、污染等变化的合成样本。通过多个特征,适用于借助回归模型预测样本年代、处理嘈杂科学数据、开展特征工程及研究测量影响等场景,为碳定年相关研究及模型评估提供实用数据。
教育
文本
表格
该数据聚焦劳动力管理(WFM),构建端到端数据管道与 KPI 仪表板。针对企业 WFM 数据来源多样、队列名杂乱等常见问题,利用 Python、PySpark 等技术,从多数据源获取数据,经清洗、标准化等处理,生成适合预测、KPI 验证及自动化的 SQL 主数据集,可用于需求预测、Power BI 可视化等场景,展示数据工程全流程概念与实践。
教育
文本
表格
生物&化学
数据集聚焦黄金这一重要宏观经济资产的定价行为。借助先进统计与可视化技术,可全面探索黄金市场动态。涵盖市场结构可视化、波动聚集性等多个关键分析主题,应用交互式蜡烛图等多种可视化技术。适用于研究人员在制定策略前,通过可视化分析挖掘黄金市场隐藏结构,洞察市场动态与金融稳定状况。
金融
文本
表格
分子相互作用流形与活性悬崖数据集,完全合成且达科研级别,用于模拟化学空间特性。与传统分子数据集不同,它采用多视角、关系型且具流形感知的表示法,融合多种特征于统一框架。适用于药物发现、分子相似性学习等高级机器学习任务,其独特架构弥补了学术与现实药物发现数据间差距,推动模型应对复杂场景。
教育
文本
图像
表格
数据集包含 33502 个工业电气符号,以 33500 张 EPLAN IEC、NFPA、GB 电气符号的 PNG 图像形式呈现,附带完整技术元数据和 AI 生成的视觉描述。适用于自动化工程中电气符号的自动分类、电气原理图的工业 OCR、相关模型微调以及技术文档的视觉检索增强生成等场景。
制造
文本
图像
表格