本数据集为心理健康障碍风险评估数据集,包含 25,000 条合成记录,涵盖人口统计、生活方式、工作学业压力、心理指标、医疗史等多维度特征,目标为三级风险分类。数据结构清晰、特征丰富,适用于心理健康风险预测、早期筛查、AI 辅助评估及心理研究等。
医疗
文本
表格
数据集包含开普勒太空望远镜观测的10000个系外行星候选体记录,涵盖候选体定位、置信度、观测特征等核心信息,配套详细数据字典。适用于天文研究、系外行星特征分析、行星确认验证及天体物理相关学术探索等。
教育
文本
表格
数据集涵盖1946至2025年全球武装冲突相关数据,聚焦战斗死亡人数、区域冲突强度、冲突参与方等核心信息,配套完成数据清洗、趋势分析等预处理工作。适用于地缘政治研究、全球安全分析、冲突预测建模、国际关系学术研究及人道主义相关课题。
教育
文本
表格
本数据集包含1000组高质量信息图与详细文本指令,覆盖布局、字体等设计细节。专为视觉–语言模型与文生图模型设计,可直接用于生成式模型微调、信息图自动生成、布局规划及多模态研究,是信息图AI生成领域的专业训练数据集。
教育
图像
本数据集包含 15,000 条合成重症监护记录,涵盖生命体征、治疗干预、器官功能及预后标签。数据模拟真实 ICU 监测场景,目标为患者死亡状态,适用于死亡率预测、病情恶化预警、临床风险建模、不平衡分类学习及医疗 AI 研究。
医疗
文本
表格
本数据集含 10,000+ 条合成对话,覆盖煤气灯效应、道德绑架、被动攻击等 6 类操控及中性对话,标注情绪评分、人格特征与操控类型。数据结构完整、类别均衡,是对话 AI 安全与心理健康领域的优质数据集。适用于操控文本二分类 / 多分类、实时检测、情绪分析、对话安全建模及社交心理研究。
教育
文本
本数据集包含 50,000 条结构化商务文本记录,涵盖邮件、报告、谈判对话等多种形式,覆盖金融、物流等多个商务领域,附带文档类型、受众水平等场景属性。数据专业规范,适用于商务英语语料分类、语言模式研究、教学资源开发、NLP 文本建模及商务沟通风格分析,是语言学习与自然语言处理的优质数据集。
教育
文本
表格
本数据集包含 8000 次模拟冷链运输记录与 24 维特征,涵盖温湿度、振动、开门次数、运输信息等 IoT 传感数据,标注是否故障与是否静默故障。数据存在类别不平衡,适用于故障预测、静默故障识别、异常检测、冷链风险分析及不平衡样本机器学习建模,是物流与供应链智能监测的实战数据集
其他
文本
表格
本数据集包含2,000个高质量的工具调用对话样本,是通过LOOPTOOL论文方法构建的增强型工具学习数据集,适用于大语言模型工具调用能力训练、函数调用微调以及多轮对话工具使用等。
其他
文本
本数据集涵盖多名学生的人口统计学、学业、生活方式及心理健康相关数据,包含年龄、CGPA、学业压力、睡眠时间、抑郁状态等关键指标,目标变量为学生是否抑郁。数据伦理合规、结构规范,适用于学生抑郁预测建模、心理健康风险因素分析、教育领域干预策略制定,以及心理学、数据科学相关的教学与学术研究。
教育
文本
表格
本数据集涵盖多个国家和年份的能源相关统计数据,包含核能发电、可再生能源、化石燃料等核心指标。数据来源权威,结构规范,适用于全球能源转型分析、核能与可再生能源对比、国家能源趋势研究、气候可持续发展分析及能源领域数据科学建模、可视化等场景,是能源经济与环保研究的优质基础数据集。
能源
文本
表格
本数据集包含 1,500 条均衡样本,覆盖正常、单元损坏、长度偏差、接触不良、形变、湿度 6 类状态,提供 S11、VSWR、增益、效率等 7 项射频电磁特征。数据已标准化、标签编码,无缺失值与泄露风险,可直接用于天线故障分类、故障类型识别、射频设备智能监测、预测性维护与通信设备机器学习建模。
制造
文本
表格
本数据集涵盖全球 50 个国家五年每日数据,共约 91000 行,整合气候、能源、工业等多维度指标。数据模拟真实季节趋势与变量关联,无缺失值,适用于能源消耗预测、气候与能源关联分析、二氧化碳排放建模、可持续发展研究及机器学习回归、可视化等场景,是环保与能源领域数据分析的优质实战数据集。
能源
文本
表格
本数据集共 5000 条记录,基于临床逻辑仿真构建,涵盖人口、社会经济、饮食、睡眠、运动、环境等 25 个特征,目标变量为抑郁严重程度。数据含统计显著关联、缺失值与高斯噪声,适用于心理健康分类建模、特征工程、生活方式风险分析、临床统计学习与数据科学教学实践。
医疗
文本
表格
本数据集模拟真实场景的借款人财务、人口统计与行为特征数据,包含年龄、收入、信用评分、学历、就业类型等关键指标,目标变量为贷款是否获批。数据结构规范、贴近金融机构实际风控逻辑。适用于违约预测、信用评分、自动化审批、金融风险建模、分类算法训练与教学科研等场景。
金融
文本
表格
本数据集包含 20000 块锂离子电芯的生产、传感、电气与 NLP 文本数据,模拟真实电池制造因果逻辑与传感器噪声。数据含缺失值、时序漂移、多模态文本与分类目标,可用于预测性维护、缺陷分类、数据插补、多模态建模与智能制造质量预测研究,是工业质检与机器学习实战的优质数据集
制造
文本
表格
本数据集覆盖 200 余个国家,包含多年度全球贸易核心指标与货币汇率数据,形成标准化宏观面板数据。数据结构清晰、质量均衡,适用于贸易分析、汇率建模、国际收支研究与金融风险评估,可直接用于面板回归、时间序列预测、深度学习模型及宏观经济类竞赛与学术研究。
金融
文本
表格
本数据集为全球漫画数据集(2000–2026),共收录 10,000 条漫画记录,覆盖日漫、韩漫、国漫、漫威、DC、独立漫画及欧洲漫画。包含 17 个结构化字段,涵盖作品信息、作者、出版社、年份、类型、评分、页数、色彩风格等。数据来源规范、格式简洁、覆盖地域广泛、时间跨度长,适用于探索性分析、可视化、机器学习建模与文化产业研究。
其他
文本
表格
本数据集为中东经济与油价平衡面板数据集(1990–2024),覆盖 13 个国家 35 年连续观测数据,包含 GDP、进出口、外资、通胀、失业率、预期寿命等宏观指标,并匹配同期布伦特原油价格。数据来源权威、结构规范、时序完整,可用于分析油价波动、地区冲突与战争对经济的影响,适用于时间序列建模、区域经济研究、政策分析与可视化展示。
能源
文本
表格
本数据集为汽车燃油效率与 CO₂排放数据集,包含 600 条标准化行程记录,覆盖 25 辆汽车与 3 种燃油类型。每条记录包含行驶距离、时长、平均速度、油耗、燃油成本、每公里成本、二氧化碳排放及效率指标。数据已清洗、结构清晰、指标丰富,适合燃油效率分析、排放建模、成本优化、可视化展示与机器学习预测,是交通与环保方向数据分析的优质实战数据集。
交通
文本
表格
罗马乌尔都语-NLP-情感数据集是目前最大的开源罗马乌尔都语情感数据集,含134,052条样本,涵盖积极、中性、消极三种情感类别。数据源自社交媒体和聊天文本,包含俚语、混合英语等真实语言特征,采用模型辅助+人工验证的混合标注方式,质量可靠。适用于情感分析、低资源语言建模等NLP任务,支持学术与商业使用,填补了罗马乌尔都语情感数据集的空白。
教育
文本
表格
本数据集为心理健康障碍风险评估数据集,包含 25,000 条合成记录,涵盖人口统计、生活方式、工作学业压力、心理指标、医疗史等多维度特征,目标为三级风险分类。数据结构清晰、特征丰富,适用于心理健康风险预测、早期筛查、AI 辅助评估及心理研究等。
医疗
文本
表格
数据集包含开普勒太空望远镜观测的10000个系外行星候选体记录,涵盖候选体定位、置信度、观测特征等核心信息,配套详细数据字典。适用于天文研究、系外行星特征分析、行星确认验证及天体物理相关学术探索等。
教育
文本
表格
数据集涵盖1946至2025年全球武装冲突相关数据,聚焦战斗死亡人数、区域冲突强度、冲突参与方等核心信息,配套完成数据清洗、趋势分析等预处理工作。适用于地缘政治研究、全球安全分析、冲突预测建模、国际关系学术研究及人道主义相关课题。
教育
文本
表格
本数据集包含1000组高质量信息图与详细文本指令,覆盖布局、字体等设计细节。专为视觉–语言模型与文生图模型设计,可直接用于生成式模型微调、信息图自动生成、布局规划及多模态研究,是信息图AI生成领域的专业训练数据集。
教育
图像
本数据集包含 15,000 条合成重症监护记录,涵盖生命体征、治疗干预、器官功能及预后标签。数据模拟真实 ICU 监测场景,目标为患者死亡状态,适用于死亡率预测、病情恶化预警、临床风险建模、不平衡分类学习及医疗 AI 研究。
医疗
文本
表格
本数据集含 10,000+ 条合成对话,覆盖煤气灯效应、道德绑架、被动攻击等 6 类操控及中性对话,标注情绪评分、人格特征与操控类型。数据结构完整、类别均衡,是对话 AI 安全与心理健康领域的优质数据集。适用于操控文本二分类 / 多分类、实时检测、情绪分析、对话安全建模及社交心理研究。
教育
文本
本数据集包含 50,000 条结构化商务文本记录,涵盖邮件、报告、谈判对话等多种形式,覆盖金融、物流等多个商务领域,附带文档类型、受众水平等场景属性。数据专业规范,适用于商务英语语料分类、语言模式研究、教学资源开发、NLP 文本建模及商务沟通风格分析,是语言学习与自然语言处理的优质数据集。
教育
文本
表格
本数据集包含 8000 次模拟冷链运输记录与 24 维特征,涵盖温湿度、振动、开门次数、运输信息等 IoT 传感数据,标注是否故障与是否静默故障。数据存在类别不平衡,适用于故障预测、静默故障识别、异常检测、冷链风险分析及不平衡样本机器学习建模,是物流与供应链智能监测的实战数据集
其他
文本
表格
本数据集包含2,000个高质量的工具调用对话样本,是通过LOOPTOOL论文方法构建的增强型工具学习数据集,适用于大语言模型工具调用能力训练、函数调用微调以及多轮对话工具使用等。
其他
文本
本数据集涵盖多名学生的人口统计学、学业、生活方式及心理健康相关数据,包含年龄、CGPA、学业压力、睡眠时间、抑郁状态等关键指标,目标变量为学生是否抑郁。数据伦理合规、结构规范,适用于学生抑郁预测建模、心理健康风险因素分析、教育领域干预策略制定,以及心理学、数据科学相关的教学与学术研究。
教育
文本
表格
本数据集涵盖多个国家和年份的能源相关统计数据,包含核能发电、可再生能源、化石燃料等核心指标。数据来源权威,结构规范,适用于全球能源转型分析、核能与可再生能源对比、国家能源趋势研究、气候可持续发展分析及能源领域数据科学建模、可视化等场景,是能源经济与环保研究的优质基础数据集。
能源
文本
表格
本数据集包含 1,500 条均衡样本,覆盖正常、单元损坏、长度偏差、接触不良、形变、湿度 6 类状态,提供 S11、VSWR、增益、效率等 7 项射频电磁特征。数据已标准化、标签编码,无缺失值与泄露风险,可直接用于天线故障分类、故障类型识别、射频设备智能监测、预测性维护与通信设备机器学习建模。
制造
文本
表格
本数据集涵盖全球 50 个国家五年每日数据,共约 91000 行,整合气候、能源、工业等多维度指标。数据模拟真实季节趋势与变量关联,无缺失值,适用于能源消耗预测、气候与能源关联分析、二氧化碳排放建模、可持续发展研究及机器学习回归、可视化等场景,是环保与能源领域数据分析的优质实战数据集。
能源
文本
表格
本数据集共 5000 条记录,基于临床逻辑仿真构建,涵盖人口、社会经济、饮食、睡眠、运动、环境等 25 个特征,目标变量为抑郁严重程度。数据含统计显著关联、缺失值与高斯噪声,适用于心理健康分类建模、特征工程、生活方式风险分析、临床统计学习与数据科学教学实践。
医疗
文本
表格
本数据集模拟真实场景的借款人财务、人口统计与行为特征数据,包含年龄、收入、信用评分、学历、就业类型等关键指标,目标变量为贷款是否获批。数据结构规范、贴近金融机构实际风控逻辑。适用于违约预测、信用评分、自动化审批、金融风险建模、分类算法训练与教学科研等场景。
金融
文本
表格
本数据集包含 20000 块锂离子电芯的生产、传感、电气与 NLP 文本数据,模拟真实电池制造因果逻辑与传感器噪声。数据含缺失值、时序漂移、多模态文本与分类目标,可用于预测性维护、缺陷分类、数据插补、多模态建模与智能制造质量预测研究,是工业质检与机器学习实战的优质数据集
制造
文本
表格
本数据集覆盖 200 余个国家,包含多年度全球贸易核心指标与货币汇率数据,形成标准化宏观面板数据。数据结构清晰、质量均衡,适用于贸易分析、汇率建模、国际收支研究与金融风险评估,可直接用于面板回归、时间序列预测、深度学习模型及宏观经济类竞赛与学术研究。
金融
文本
表格
本数据集为全球漫画数据集(2000–2026),共收录 10,000 条漫画记录,覆盖日漫、韩漫、国漫、漫威、DC、独立漫画及欧洲漫画。包含 17 个结构化字段,涵盖作品信息、作者、出版社、年份、类型、评分、页数、色彩风格等。数据来源规范、格式简洁、覆盖地域广泛、时间跨度长,适用于探索性分析、可视化、机器学习建模与文化产业研究。
其他
文本
表格
本数据集为中东经济与油价平衡面板数据集(1990–2024),覆盖 13 个国家 35 年连续观测数据,包含 GDP、进出口、外资、通胀、失业率、预期寿命等宏观指标,并匹配同期布伦特原油价格。数据来源权威、结构规范、时序完整,可用于分析油价波动、地区冲突与战争对经济的影响,适用于时间序列建模、区域经济研究、政策分析与可视化展示。
能源
文本
表格
本数据集为汽车燃油效率与 CO₂排放数据集,包含 600 条标准化行程记录,覆盖 25 辆汽车与 3 种燃油类型。每条记录包含行驶距离、时长、平均速度、油耗、燃油成本、每公里成本、二氧化碳排放及效率指标。数据已清洗、结构清晰、指标丰富,适合燃油效率分析、排放建模、成本优化、可视化展示与机器学习预测,是交通与环保方向数据分析的优质实战数据集。
交通
文本
表格
罗马乌尔都语-NLP-情感数据集是目前最大的开源罗马乌尔都语情感数据集,含134,052条样本,涵盖积极、中性、消极三种情感类别。数据源自社交媒体和聊天文本,包含俚语、混合英语等真实语言特征,采用模型辅助+人工验证的混合标注方式,质量可靠。适用于情感分析、低资源语言建模等NLP任务,支持学术与商业使用,填补了罗马乌尔都语情感数据集的空白。
教育
文本
表格