隐私感知智能电网运行数据集(PASGOD)收集自分布式电力系统实时运行节点,含电压、频率等电气参数,及温度、湿度等环境因素数据。涵盖正常与异常运行场景,反映智能电网多区域多节点的运行情况。适用于电力领域研究电网可靠性、稳定性,辅助制定电网运行策略,提升电力系统运行效率。
其他
文本
表格
客户支持聊天数据集含 25,000 条合成对话,模拟客户与支持人员真实互动。支持多语言,覆盖电商、金融科技等多个行业。适用于对话式人工智能研发,如优化聊天机器人回复;可辅助大语言模型微调,提升其在客户支持场景的表现;也能用于情感分析,了解客户在对话中的情感变化,助力企业改善服务。
其他
文本
表格
水稻数据集围绕提高水稻产量展开,利用结合包装器特征选择技术的混合机器学习模型,通过五种特征选择方法优化数据,训练多种机器学习模型。数据集涵盖农业地块、品种、土壤类型等种植相关信息,以及气象、施肥、除草防虫等数据。适用于农业研究领域,助于预测水稻产量、推荐品种,为提高水稻生产力提供支持。
农业
文本
表格
情感简化数据集源于谷歌 GoEmotions 数据集,含 53994 条类似 Reddit 风格的英文短评,标注了 0 - 27 的主要情感索引,另有文件映射索引与情感名称。适用于自然语言处理领域训练多类别模型,社交媒体情感分析,助力企业了解用户对产品或服务的情感态度,也可用于研究人员探索文本情感分类技术。
其他
文本
表格
健康指标数据集是基于逻辑构建的模拟健身相关数据集合,旨在全面反映健身状态受多种习惯因素交互影响的实际情况。数据集通过一系列复杂计算生成健身分数,并经调整转化为健康水平标签。涵盖年龄、日常活动、睡眠、饮食等多类特征,模拟了现实中各健康因素间的因果及隐藏关系。适用于健身与健康管理领域的研究,为训练相关模型、探究习惯对健康的影响以及制定科学健康管理策略提供有力支持。
医疗
文本
表格
数据集涵盖训练与测试数据,包含患者人口统计、生命体征、实验室检测结果及病史等全面医学信息。旨在助力分析肾脏健康,构建预测 CKD 及其阶段的机器学习模型。适用于医疗研究人员开展疾病研究,通过分析数据提升对 CKD 的认知;也便于开发人员优化模型,以实现 CKD 的早期发现与准确分类。
医疗
文本
表格
英伟达股票数据集包含 1999 年 1 月 22 日至 2026 年 3 月 11 日共 7079 个交易日的股票数据,设有 16 个字段,涵盖股价、成交量、市值、营收等多维度信息,并标注 6 次拆股情况及关键事件。此数据集适用于金融研究人员剖析英伟达股价走势及公司发展对股价影响;也可供高校金融教学,辅助学生理解金融市场与科技公司的关联;投资者还能借此评估投资风险与收益。
金融
文本
表格
温室作物产量数据集含超 10000 条模拟记录,20 个结构化字段,涵盖 4 种常见作物。数据模拟真实缺陷,如缺失值、重复值等。适用于农业科研人员建模预测产量,分析环境及管理因素影响;也适合数据处理学习者练习清理数据,提升技能;还能助力高校教学实践,加深学生对农业数据处理的理解 。
农业
文本
表格
该数据集模拟类Netflix流媒体平台用户行为,包含5万名用户、20个行为及人口统计特征,涵盖用户人口信息、订阅详情、设备使用、观看习惯及流失指标等。数据为真实模拟生成,适用于机器学习、推荐系统开发、用户行为分析、流失预测、观众聚类细分等场景,可支撑有监督与无监督学习任务,供教育和研究使用。
其他
文本
表格
该数据集整合QS 2026、THE 2026、ARWU 2025三大主流世界大学排名,包含57所院校、20个国家、30个数据列,涵盖院校基本信息、各项排名及细分指标、诺奖得主等数据,18所院校同时入选三大排名。使用场景广泛,可用于机器学习、院校对比分析、地理分布可视化、择校推荐及学术研究、政策制定等。
教育
文本
表格
本数据集包含联合国教科文组织认证的全球1200多处世界遗产信息,覆盖168个国家,涵盖遗产名称、所在国家、类别、列入年份、经纬度、保护面积、濒危状态、区域分类及简介等核心字段。数据官方权威、结构完整、覆盖面广,适用于地理可视化、分布规律分析、文化与自然遗产研究、时空趋势挖掘及濒危遗产评估。
能源
文本
表格
本数据集包含 121 只患病猫咪在家庭环境下采集的 6783 条血糖记录,涵盖血糖值、时间、胰岛素剂量与类型等信息,数据为长期纵向实测。数据真实、场景贴近日常饲养环境,可用于血糖时序分析、低血糖风险预测、昼夜节律研究及兽医数字健康、生理数据机器学习建模,是动物医疗与 AI 健康领域的典型数据集。
医疗
文本
表格
本数据集包含多个城市水源(自来水、过滤水等)中分离出的微塑料带标签显微镜图像,经专业实验室处理获得。适用于计算机视觉领域的图像分割、目标检测、形态分类模型训练,以及环境AI研究,为微塑料自动化监测与环境治理提供数据支撑。
医疗
图像
本数据集系统整合了城市级新能源汽车充换电服务的多源数据,涵盖充电订单详情、政府补贴发放、充电场站档案及实时能源监控信息。通过关联分析与大数据技术,它不仅服务于充电站运营优化与投资选址,更能支撑个性化充电推荐、车辆续航分析、故障预测、电网负荷调度及市场风险评估,为整个新能源汽车生态中的运营商、政府部门、车企及能源公司提供全链条的数据洞察与决策支持。
制造
图像
表格
本数据集源自市级新能源充换电公共服务平台,系统整合了多家接入运营商的充电设备数据、用户充换电交易记录、以及与之关联的政府资金支持与补贴发放信息。作为全市充换电行业的统一“数据粮仓”,它不仅能实时反映充电桩的空闲/占用状态,服务于车主的找桩需求,更能为行业监管、设施规划、政策评估及运营优化提供深度的数据洞察与决策支持。
交通
图像
表格
本数据集是面向开发者与金融机构的全球金融市场一站式数据集,覆盖沪深港美股、外汇、指数及宏观经济领域,包含 K 线、分时、Tick、财务报表、基本面等多维金融数据,依托 100 + 国家 / 地区数据源构建,具备毫秒级更新、99.9% SLA 稳定性、金融级加密的特性,可一站式满足金融投研、量化交易、金融产品开发等场景的全维度数据需求
金融
文本
本数据集收录2020–2026年arXiv平台的10,000篇人工智能与机器学习论文,包含论文编号、标题、作者、发表时间、研究分类、摘要、PDF链接等12项信息,通过官方API采集,数据权威规范。适用于文本分类、AI研究趋势分析、学术推荐系统搭建、NLP实验与机器学习建模,是人工智能领域科研、教学与实践的优质标准化数据集。
教育
文本
表格
本数据集收录投保人年龄、性别、BMI、吸烟情况、子女数量、居住区域及实际医疗花费等结构化信息。数据干净规整、变量具备现实意义,主要用于医疗花费预测、保险风险评估、特征影响分析与回归建模,是医疗健康分析、保险金融、机器学习教学与科研中常用的经典基准数据。
金融
文本
表格
本数据集覆盖2015年3月至2026年3月,包含2762个严格对齐的交易日、43个结构化特征,涵盖七大科技巨头股票数据、市场基准指数及核心宏观经济指标,经专业预处理后无任何缺失值。该数据集适用于定量建模、时间序列预测、波动率分析及市场趋势研判,也可以为金融分析、AI建模与宏观经济交叉的研究提供优质数据支撑。
金融
文本
表格
本数据集包含 211,043 条网络流记录与 44 个特征,覆盖正常流量及后门、DDoS、注入、XSS 等 10 类攻击数据。支持二分类与多分类任务,可用于训练入侵检测模型、开展异常检测研究及特征工程实践,是网络安全领域机器学习建模与教学的优质数据集。
其他
文本
表格
本数据集包含 2026 年 2 月约 2500 条合成热门话题记录,涵盖来源、语言、国家、话题分类、情感、互动量与趋势评分等信息。数据字段定义清晰,CSV 格式标准化,适用于文本分类、情感分析、趋势可视化、互动量建模等 NLP 与数据分析场景。
其他
文本
表格
隐私感知智能电网运行数据集(PASGOD)收集自分布式电力系统实时运行节点,含电压、频率等电气参数,及温度、湿度等环境因素数据。涵盖正常与异常运行场景,反映智能电网多区域多节点的运行情况。适用于电力领域研究电网可靠性、稳定性,辅助制定电网运行策略,提升电力系统运行效率。
其他
文本
表格
客户支持聊天数据集含 25,000 条合成对话,模拟客户与支持人员真实互动。支持多语言,覆盖电商、金融科技等多个行业。适用于对话式人工智能研发,如优化聊天机器人回复;可辅助大语言模型微调,提升其在客户支持场景的表现;也能用于情感分析,了解客户在对话中的情感变化,助力企业改善服务。
其他
文本
表格
水稻数据集围绕提高水稻产量展开,利用结合包装器特征选择技术的混合机器学习模型,通过五种特征选择方法优化数据,训练多种机器学习模型。数据集涵盖农业地块、品种、土壤类型等种植相关信息,以及气象、施肥、除草防虫等数据。适用于农业研究领域,助于预测水稻产量、推荐品种,为提高水稻生产力提供支持。
农业
文本
表格
情感简化数据集源于谷歌 GoEmotions 数据集,含 53994 条类似 Reddit 风格的英文短评,标注了 0 - 27 的主要情感索引,另有文件映射索引与情感名称。适用于自然语言处理领域训练多类别模型,社交媒体情感分析,助力企业了解用户对产品或服务的情感态度,也可用于研究人员探索文本情感分类技术。
其他
文本
表格
健康指标数据集是基于逻辑构建的模拟健身相关数据集合,旨在全面反映健身状态受多种习惯因素交互影响的实际情况。数据集通过一系列复杂计算生成健身分数,并经调整转化为健康水平标签。涵盖年龄、日常活动、睡眠、饮食等多类特征,模拟了现实中各健康因素间的因果及隐藏关系。适用于健身与健康管理领域的研究,为训练相关模型、探究习惯对健康的影响以及制定科学健康管理策略提供有力支持。
医疗
文本
表格
数据集涵盖训练与测试数据,包含患者人口统计、生命体征、实验室检测结果及病史等全面医学信息。旨在助力分析肾脏健康,构建预测 CKD 及其阶段的机器学习模型。适用于医疗研究人员开展疾病研究,通过分析数据提升对 CKD 的认知;也便于开发人员优化模型,以实现 CKD 的早期发现与准确分类。
医疗
文本
表格
英伟达股票数据集包含 1999 年 1 月 22 日至 2026 年 3 月 11 日共 7079 个交易日的股票数据,设有 16 个字段,涵盖股价、成交量、市值、营收等多维度信息,并标注 6 次拆股情况及关键事件。此数据集适用于金融研究人员剖析英伟达股价走势及公司发展对股价影响;也可供高校金融教学,辅助学生理解金融市场与科技公司的关联;投资者还能借此评估投资风险与收益。
金融
文本
表格
温室作物产量数据集含超 10000 条模拟记录,20 个结构化字段,涵盖 4 种常见作物。数据模拟真实缺陷,如缺失值、重复值等。适用于农业科研人员建模预测产量,分析环境及管理因素影响;也适合数据处理学习者练习清理数据,提升技能;还能助力高校教学实践,加深学生对农业数据处理的理解 。
农业
文本
表格
该数据集模拟类Netflix流媒体平台用户行为,包含5万名用户、20个行为及人口统计特征,涵盖用户人口信息、订阅详情、设备使用、观看习惯及流失指标等。数据为真实模拟生成,适用于机器学习、推荐系统开发、用户行为分析、流失预测、观众聚类细分等场景,可支撑有监督与无监督学习任务,供教育和研究使用。
其他
文本
表格
该数据集整合QS 2026、THE 2026、ARWU 2025三大主流世界大学排名,包含57所院校、20个国家、30个数据列,涵盖院校基本信息、各项排名及细分指标、诺奖得主等数据,18所院校同时入选三大排名。使用场景广泛,可用于机器学习、院校对比分析、地理分布可视化、择校推荐及学术研究、政策制定等。
教育
文本
表格
本数据集包含联合国教科文组织认证的全球1200多处世界遗产信息,覆盖168个国家,涵盖遗产名称、所在国家、类别、列入年份、经纬度、保护面积、濒危状态、区域分类及简介等核心字段。数据官方权威、结构完整、覆盖面广,适用于地理可视化、分布规律分析、文化与自然遗产研究、时空趋势挖掘及濒危遗产评估。
能源
文本
表格
本数据集包含 121 只患病猫咪在家庭环境下采集的 6783 条血糖记录,涵盖血糖值、时间、胰岛素剂量与类型等信息,数据为长期纵向实测。数据真实、场景贴近日常饲养环境,可用于血糖时序分析、低血糖风险预测、昼夜节律研究及兽医数字健康、生理数据机器学习建模,是动物医疗与 AI 健康领域的典型数据集。
医疗
文本
表格
本数据集包含多个城市水源(自来水、过滤水等)中分离出的微塑料带标签显微镜图像,经专业实验室处理获得。适用于计算机视觉领域的图像分割、目标检测、形态分类模型训练,以及环境AI研究,为微塑料自动化监测与环境治理提供数据支撑。
医疗
图像
本数据集系统整合了城市级新能源汽车充换电服务的多源数据,涵盖充电订单详情、政府补贴发放、充电场站档案及实时能源监控信息。通过关联分析与大数据技术,它不仅服务于充电站运营优化与投资选址,更能支撑个性化充电推荐、车辆续航分析、故障预测、电网负荷调度及市场风险评估,为整个新能源汽车生态中的运营商、政府部门、车企及能源公司提供全链条的数据洞察与决策支持。
制造
图像
表格
本数据集源自市级新能源充换电公共服务平台,系统整合了多家接入运营商的充电设备数据、用户充换电交易记录、以及与之关联的政府资金支持与补贴发放信息。作为全市充换电行业的统一“数据粮仓”,它不仅能实时反映充电桩的空闲/占用状态,服务于车主的找桩需求,更能为行业监管、设施规划、政策评估及运营优化提供深度的数据洞察与决策支持。
交通
图像
表格
本数据集是面向开发者与金融机构的全球金融市场一站式数据集,覆盖沪深港美股、外汇、指数及宏观经济领域,包含 K 线、分时、Tick、财务报表、基本面等多维金融数据,依托 100 + 国家 / 地区数据源构建,具备毫秒级更新、99.9% SLA 稳定性、金融级加密的特性,可一站式满足金融投研、量化交易、金融产品开发等场景的全维度数据需求
金融
文本
本数据集收录2020–2026年arXiv平台的10,000篇人工智能与机器学习论文,包含论文编号、标题、作者、发表时间、研究分类、摘要、PDF链接等12项信息,通过官方API采集,数据权威规范。适用于文本分类、AI研究趋势分析、学术推荐系统搭建、NLP实验与机器学习建模,是人工智能领域科研、教学与实践的优质标准化数据集。
教育
文本
表格
本数据集收录投保人年龄、性别、BMI、吸烟情况、子女数量、居住区域及实际医疗花费等结构化信息。数据干净规整、变量具备现实意义,主要用于医疗花费预测、保险风险评估、特征影响分析与回归建模,是医疗健康分析、保险金融、机器学习教学与科研中常用的经典基准数据。
金融
文本
表格
本数据集覆盖2015年3月至2026年3月,包含2762个严格对齐的交易日、43个结构化特征,涵盖七大科技巨头股票数据、市场基准指数及核心宏观经济指标,经专业预处理后无任何缺失值。该数据集适用于定量建模、时间序列预测、波动率分析及市场趋势研判,也可以为金融分析、AI建模与宏观经济交叉的研究提供优质数据支撑。
金融
文本
表格
本数据集包含 211,043 条网络流记录与 44 个特征,覆盖正常流量及后门、DDoS、注入、XSS 等 10 类攻击数据。支持二分类与多分类任务,可用于训练入侵检测模型、开展异常检测研究及特征工程实践,是网络安全领域机器学习建模与教学的优质数据集。
其他
文本
表格
本数据集包含 2026 年 2 月约 2500 条合成热门话题记录,涵盖来源、语言、国家、话题分类、情感、互动量与趋势评分等信息。数据字段定义清晰,CSV 格式标准化,适用于文本分类、情感分析、趋势可视化、互动量建模等 NLP 与数据分析场景。
其他
文本
表格