本数据集涵盖Cu-Ni-Co-Si、Cu-Fe-P、Cu-Cr-Zr等多个合金体系数据,按照成分配比、生产工艺、材料性能、微观结构的全链路关联主线,结构化收录了化学成分、工艺参数、显微组织特征及力学与物理性能等关键维度,有效解决了该领域实验数据分散、整合成本高的痛点,可为机器学习与材料计算提供高质量、即用型的数据集,直接支撑合金设计、性能预测与工艺优化等AI研发场景。
制造
文本
本数据集精选大学阶段普通物理经典习题,系统覆盖力学、热学、电磁学、振动与波、光学等内容,是高中物理向理论物理与工程物理过渡的关键桥梁。其核心价值在于提供“物理建模 → 数学表达 → 定量求解 → 物理意义解释”的完整推理样本,弥补模型在高于中学、低于专业理论物理层级的物理理解断层。典型应用于 AI 物理解题、科学推理模型训练、AI for Science 基础能力构建以及物理教育智能系统。
教育
文本
本数据集系统覆盖高中物理的力学、电磁学、热学与光学等核心模块,其题目设计强调物理建模、定量计算与物理意义分析。核心价值在于为AI提供大量从实际情境抽象为数学模型,再经数学推导求解的完整样本,专门针对模型在理解物理概念本质、判断公式适用条件及执行严谨多步计算等方面的短板进行训练。该数据集适用于开发专用物理解题模型、构建智能AI物理教辅系统,以及对通用大模型进行物理世界建模与科学推理能力的专项增强。
教育
文本
这不仅仅是一个数据集;它是一个鲜活的、不断发展的项目,在健康、营养和可持续发展领域有着切实的应用。无论您对营养、供应链还是食品对环境的影响感兴趣,您都有能力做出改变。
消费
文本
本数据集系统收录高中阶段数学核心题型,覆盖函数、数列、立体几何、解析几何、概率统计等高频与难点内容,完整体现高中数学的知识结构与解题逻辑。其核心价值在于为大模型提供结构化、层次清晰的基础数学推理样本,解决模型在基础数学理解、符号运算、逻辑推导与规范解题表达方面能力不足的问题。典型应用场景包括智能题库生成、AI 数学辅导、教育大模型预训练与对齐,以及通用推理模型的基础数学能力增强。
教育
文本
数据集包含 1000 多份 Nii 格式扫描图像,对应超 1000 个医学研究案例,涵盖 7 种病症与 8 个解剖区域。经专家注释,对病症及解剖结构进行分割标注。数据集提供高质量断层图像,可用于肺癌、肺部疾病的 AI 研究及诊断成像,助力医学领域在病症识别、分类等方面的发展。
医疗
图像
数据集含 443 个文件,对应 150 个医学研究案例及 13 种数据标签。以 DICOM 格式存储胸部 X 光图像,对病症详细分割并标注多种病症类型。适用于医学领域检测肺部等疾病,为医疗诊断成像提供依据,也助力计算机视觉和机器学习在医疗影像分析中的应用,辅助病症识别与分类。
医疗
图像
数据集涵盖超 200 万个医学研究案例,涉及 50 多种疾病,包含脑部 MRI 扫描图像及放射科医生报告。图像以 DICOM 格式存储,具详细结构成像。适用于医学领域的肿瘤检测与分割研究,也为计算机视觉和机器学习在医疗方面的应用提供数据支持,辅助疾病的识别、分类等工作。
医疗
图像
人机AI协同创作全流程认知轨迹AI模型训练数据集(江苏数据知识产权公示名称)。 由17份跨十多个领域首创性作品的约2000万字完整创作过程数据组成,完整记录了从灵感萌发到定稿的人机交互全过程,开创了"个人人机协同完整创作过程合规数据集资产"这一全新品类。全球公开可查询范围内人机协同作品完整创作过程数据集未有先例。作者使用其中9份作品对72B开源模型进行微调对照实验,训练效果显著具体可见数据集介绍。
其他
文本
数据集含 9600 张 AI 生成的护照图像,图像在角度、光照、背景和距离上具有多样性,并带有详细元数据标注。适用于身份验证、PII 提取等场景,可训练 OCR 和计算机视觉模型,助力金融科技等领域预防欺诈,保障信息安全。
其他
图像
数据集含有超 3000 张 DICOM 格式的数字化乳腺 X 光图像,针对 14 种以上乳腺病症进行像素级标注。该数据集适用于乳腺癌检测、病损分割,可助力医学成像领域的深度学习模型训练,为乳腺癌早期诊断提供关键数据支持,在医学与计算机视觉交叉领域具有重要价值。
医疗
图像
数据集含超 1000 份带注释的脑部 CT 扫描图像,涉及 10 种病症。以 Nii 格式存储,专为肿瘤分割、脑出血检测等任务设计。适用于医学领域中机器学习模型的训练,辅助实现语义分割、治疗方案规划等,助力对脑组织、结构和损伤的精确分析,推动脑部疾病诊断与治疗技术发展。
医疗
图像
数据集规模庞大,含超 150,000 张标注病症的胸部 CT 图像,涵盖 24 种病症。以 DICOM 格式存储,适用于医学领域肺部疾病检测、癌症诊断等任务,为训练深度学习模型提供丰富数据,助力计算机视觉在医学成像中的应用。
医疗
文本
图像
含Cot 思维链推理的完整人机AI协同创作过程认知图谱训练数据集(江苏公示名称) 由17份跨十多个领域首创性作品的约3000万字完整创作过程数据含CoT组成,完整记录了从灵感萌发到定稿的人机交互全过程,开创了"个人人机协同完整创作过程合规数据集资产"这一全新品类且含CoT。全球公开可查询范围内个人人机协同作品完整创作过程数据集未有先例。作者使用9份作品对72B开源模型进行微调对照实验详见数据集介绍
其他
文本
数据集包含 500 个以上来自城市路口和人行横道交通摄像头的视频,采用边界框标记,标注有时间、天气、车流量、行人数量及交通灯状态等元数据。适用于计算机视觉和机器学习领域,可用于实时交通场景下的车辆与行人检测、交通监控,为智慧城市的交通监测与预测提供数据支持。
交通
视频
数据集包含 2488 张以上水表图像,每组图像含照片及分割掩码各 1 个,并通过 OCR 标注水表读数及读数位置。适用于计算机视觉与机器学习领域,可支持 AI 模型完成水表读数和检测任务,应用于智慧城市的用水监测、客户服务优化及废水处理与供水系统提升等场景。
社会治理
图像
表格
数据集涵盖 5000 多张杂货店高质量货架图像,对商品的摆放正面、翻转、被遮挡等属性进行标注。适用于计算机视觉领域的产品检测、目标识别和图像分类任务,可支持零售自动化,如库存管理,以及杂货配送应用,助力提升零售行业运营效率和服务质量。
消费
图像
数据集包含 5000 多张处于满、空、垃圾散落等不同状态垃圾桶的标注图像。适用于计算机视觉、目标检测及机器学习领域,可训练分类模型和检测系统,助力智慧城市的垃圾类别划分、垃圾分类及垃圾收集工作,推动城市垃圾管理智能化发展。
社会治理
图像
数据集含 647 张密集人群图像,标注有人群规模相关关键点及人群密度类型等元数据,人群人数在 1000 - 13000 人。适用于智慧城市管理、安全监控等场景,可用于训练深度学习模型以实现人群计数、目标检测与计算机视觉任务,辅助进行大规模人群的管理与分析。
政务服务
图像
数据集包含超 10 小时来自阿联酋 20 多位阿拉伯语母语者的电话音质对话音频,以多种格式呈现且带注释,背景噪音低。适用于训练语音识别系统、对话模型及阿拉伯语语言处理工具,为阿拉伯语语音技术研究和应用开发,如语音助手、翻译系统等提供有力数据支持。
其他
音频
数据集涵盖超 10 小时 20 多位斯洛文尼亚语母语者的电话录音对话,以低噪的 MP3 和 WAV 格式呈现,音频片段约一分钟长,并带有结构化注释。适合用于斯洛文尼亚语语音识别、口语处理及语言模型训练,助力斯洛文尼亚语相关语音技术的研究与应用开发。
其他
音频
本数据集涵盖Cu-Ni-Co-Si、Cu-Fe-P、Cu-Cr-Zr等多个合金体系数据,按照成分配比、生产工艺、材料性能、微观结构的全链路关联主线,结构化收录了化学成分、工艺参数、显微组织特征及力学与物理性能等关键维度,有效解决了该领域实验数据分散、整合成本高的痛点,可为机器学习与材料计算提供高质量、即用型的数据集,直接支撑合金设计、性能预测与工艺优化等AI研发场景。
制造
文本
本数据集精选大学阶段普通物理经典习题,系统覆盖力学、热学、电磁学、振动与波、光学等内容,是高中物理向理论物理与工程物理过渡的关键桥梁。其核心价值在于提供“物理建模 → 数学表达 → 定量求解 → 物理意义解释”的完整推理样本,弥补模型在高于中学、低于专业理论物理层级的物理理解断层。典型应用于 AI 物理解题、科学推理模型训练、AI for Science 基础能力构建以及物理教育智能系统。
教育
文本
本数据集系统覆盖高中物理的力学、电磁学、热学与光学等核心模块,其题目设计强调物理建模、定量计算与物理意义分析。核心价值在于为AI提供大量从实际情境抽象为数学模型,再经数学推导求解的完整样本,专门针对模型在理解物理概念本质、判断公式适用条件及执行严谨多步计算等方面的短板进行训练。该数据集适用于开发专用物理解题模型、构建智能AI物理教辅系统,以及对通用大模型进行物理世界建模与科学推理能力的专项增强。
教育
文本
这不仅仅是一个数据集;它是一个鲜活的、不断发展的项目,在健康、营养和可持续发展领域有着切实的应用。无论您对营养、供应链还是食品对环境的影响感兴趣,您都有能力做出改变。
消费
文本
本数据集系统收录高中阶段数学核心题型,覆盖函数、数列、立体几何、解析几何、概率统计等高频与难点内容,完整体现高中数学的知识结构与解题逻辑。其核心价值在于为大模型提供结构化、层次清晰的基础数学推理样本,解决模型在基础数学理解、符号运算、逻辑推导与规范解题表达方面能力不足的问题。典型应用场景包括智能题库生成、AI 数学辅导、教育大模型预训练与对齐,以及通用推理模型的基础数学能力增强。
教育
文本
数据集包含 1000 多份 Nii 格式扫描图像,对应超 1000 个医学研究案例,涵盖 7 种病症与 8 个解剖区域。经专家注释,对病症及解剖结构进行分割标注。数据集提供高质量断层图像,可用于肺癌、肺部疾病的 AI 研究及诊断成像,助力医学领域在病症识别、分类等方面的发展。
医疗
图像
数据集含 443 个文件,对应 150 个医学研究案例及 13 种数据标签。以 DICOM 格式存储胸部 X 光图像,对病症详细分割并标注多种病症类型。适用于医学领域检测肺部等疾病,为医疗诊断成像提供依据,也助力计算机视觉和机器学习在医疗影像分析中的应用,辅助病症识别与分类。
医疗
图像
数据集涵盖超 200 万个医学研究案例,涉及 50 多种疾病,包含脑部 MRI 扫描图像及放射科医生报告。图像以 DICOM 格式存储,具详细结构成像。适用于医学领域的肿瘤检测与分割研究,也为计算机视觉和机器学习在医疗方面的应用提供数据支持,辅助疾病的识别、分类等工作。
医疗
图像
人机AI协同创作全流程认知轨迹AI模型训练数据集(江苏数据知识产权公示名称)。 由17份跨十多个领域首创性作品的约2000万字完整创作过程数据组成,完整记录了从灵感萌发到定稿的人机交互全过程,开创了"个人人机协同完整创作过程合规数据集资产"这一全新品类。全球公开可查询范围内人机协同作品完整创作过程数据集未有先例。作者使用其中9份作品对72B开源模型进行微调对照实验,训练效果显著具体可见数据集介绍。
其他
文本
数据集含 9600 张 AI 生成的护照图像,图像在角度、光照、背景和距离上具有多样性,并带有详细元数据标注。适用于身份验证、PII 提取等场景,可训练 OCR 和计算机视觉模型,助力金融科技等领域预防欺诈,保障信息安全。
其他
图像
数据集含有超 3000 张 DICOM 格式的数字化乳腺 X 光图像,针对 14 种以上乳腺病症进行像素级标注。该数据集适用于乳腺癌检测、病损分割,可助力医学成像领域的深度学习模型训练,为乳腺癌早期诊断提供关键数据支持,在医学与计算机视觉交叉领域具有重要价值。
医疗
图像
数据集含超 1000 份带注释的脑部 CT 扫描图像,涉及 10 种病症。以 Nii 格式存储,专为肿瘤分割、脑出血检测等任务设计。适用于医学领域中机器学习模型的训练,辅助实现语义分割、治疗方案规划等,助力对脑组织、结构和损伤的精确分析,推动脑部疾病诊断与治疗技术发展。
医疗
图像
数据集规模庞大,含超 150,000 张标注病症的胸部 CT 图像,涵盖 24 种病症。以 DICOM 格式存储,适用于医学领域肺部疾病检测、癌症诊断等任务,为训练深度学习模型提供丰富数据,助力计算机视觉在医学成像中的应用。
医疗
文本
图像
含Cot 思维链推理的完整人机AI协同创作过程认知图谱训练数据集(江苏公示名称) 由17份跨十多个领域首创性作品的约3000万字完整创作过程数据含CoT组成,完整记录了从灵感萌发到定稿的人机交互全过程,开创了"个人人机协同完整创作过程合规数据集资产"这一全新品类且含CoT。全球公开可查询范围内个人人机协同作品完整创作过程数据集未有先例。作者使用9份作品对72B开源模型进行微调对照实验详见数据集介绍
其他
文本
数据集包含 500 个以上来自城市路口和人行横道交通摄像头的视频,采用边界框标记,标注有时间、天气、车流量、行人数量及交通灯状态等元数据。适用于计算机视觉和机器学习领域,可用于实时交通场景下的车辆与行人检测、交通监控,为智慧城市的交通监测与预测提供数据支持。
交通
视频
数据集包含 2488 张以上水表图像,每组图像含照片及分割掩码各 1 个,并通过 OCR 标注水表读数及读数位置。适用于计算机视觉与机器学习领域,可支持 AI 模型完成水表读数和检测任务,应用于智慧城市的用水监测、客户服务优化及废水处理与供水系统提升等场景。
社会治理
图像
表格
数据集涵盖 5000 多张杂货店高质量货架图像,对商品的摆放正面、翻转、被遮挡等属性进行标注。适用于计算机视觉领域的产品检测、目标识别和图像分类任务,可支持零售自动化,如库存管理,以及杂货配送应用,助力提升零售行业运营效率和服务质量。
消费
图像
数据集包含 5000 多张处于满、空、垃圾散落等不同状态垃圾桶的标注图像。适用于计算机视觉、目标检测及机器学习领域,可训练分类模型和检测系统,助力智慧城市的垃圾类别划分、垃圾分类及垃圾收集工作,推动城市垃圾管理智能化发展。
社会治理
图像
数据集含 647 张密集人群图像,标注有人群规模相关关键点及人群密度类型等元数据,人群人数在 1000 - 13000 人。适用于智慧城市管理、安全监控等场景,可用于训练深度学习模型以实现人群计数、目标检测与计算机视觉任务,辅助进行大规模人群的管理与分析。
政务服务
图像
数据集包含超 10 小时来自阿联酋 20 多位阿拉伯语母语者的电话音质对话音频,以多种格式呈现且带注释,背景噪音低。适用于训练语音识别系统、对话模型及阿拉伯语语言处理工具,为阿拉伯语语音技术研究和应用开发,如语音助手、翻译系统等提供有力数据支持。
其他
音频
数据集涵盖超 10 小时 20 多位斯洛文尼亚语母语者的电话录音对话,以低噪的 MP3 和 WAV 格式呈现,音频片段约一分钟长,并带有结构化注释。适合用于斯洛文尼亚语语音识别、口语处理及语言模型训练,助力斯洛文尼亚语相关语音技术的研究与应用开发。
其他
音频