主页 模型库 竞赛 学习中心 工具箱 论文库 前沿 建模空间 AI建模
55+
数据集
6
领域分类
4
数据来源
📋

建模专用内嵌数据集

无需下载,直接在页面查看、复制、导出 — 精选50+用于评价、预测、优化、变化建模练习的小型数据集,含人口数据、GDP、温度序列、优化案例等

AHP/TOPSIS评价 时间序列预测 线性规划优化 增长/动力学变化
立即查看 →
💰

经济金融数据

股票、信贷、经济指标等
Kaggle 53MB

信用卡欺诈检测数据集

包含284,807条欧洲信用卡交易记录,其中492条为欺诈交易。特征经过PCA变换,适合异常检测和类别不平衡学习。

二分类 异常检测 类别不平衡
28万+ 样本 · 31 特征 获取数据 →
Kaggle 78MB

房价预测数据集

爱荷华州Ames市的房屋销售数据,包含79个解释变量,用于预测房屋最终价格。经典的回归问题数据集。

回归预测 特征工程 房地产
2,919 样本 · 79 特征 获取数据 →
Kaggle 350MB

贷款违约预测

Lending Club平台的贷款数据,包含借款人信息、贷款特征等,预测贷款是否会违约。

信用评分 风险预测 金融风控
200万+ 样本 · 150+ 特征 获取数据 →
Kaggle 60MB

股票市场数据

标普500指数成分股的历史价格数据,包含每日开盘价、收盘价、最高价、最低价和成交量。

时间序列 金融预测 量化投资
505只股票 · 5年数据 获取数据 →
UCI 300KB

银行营销数据集

葡萄牙银行电话营销活动数据,预测客户是否会订阅定期存款,适合分类问题研究。

二分类 营销分析 客户行为
45,211 样本 · 17 特征 获取数据 →
UCI 25KB

默认信用卡客户

台湾信用卡客户数据,包含人口统计信息、还款历史、账单金额等,预测下月是否会违约。

分类预测 信用风险 金融建模
30,000 样本 · 24 特征 获取数据 →
Kaggle 4.5GB

电商销售数据

巴西电商平台Olist的销售数据,包含10万+订单信息、产品类别、客户评价等。

电商分析 推荐系统 销售预测
100K+ 订单 · 多表关联 获取数据 →
政府公开 -

中国国家统计局数据

包含GDP、CPI、人口、就业、贸易等宏观经济指标的时间序列数据,适合经济建模研究。

宏观经济 时间序列 统计分析
年度/月度数据 获取数据 →
Kaggle 150MB

客户交易预测

Santander银行客户交易预测比赛数据,预测哪些客户会进行特定交易。

二分类 匿名特征 金融科技
200,000 样本 · 200 特征 获取数据 →
🏥

医疗健康数据

疾病诊断、医疗记录、健康指标
UCI 20KB

乳腺癌诊断数据集

威斯康星乳腺癌数据集,包含细胞核特征信息,用于诊断肿瘤是良性还是恶性。

二分类 医学诊断 经典数据集
569 样本 · 30 特征 获取数据 →
Kaggle 40GB

肺炎X光图像数据集

胸部X光图像数据集,用于区分正常和肺炎患者,适合医学图像分类任务。

图像分类 深度学习 医学影像
5,856 张图像 获取数据 →
UCI 1.2MB

糖尿病数据集

Pima印第安人糖尿病数据集,根据诊断测量值预测患者是否患有糖尿病。

二分类 医疗预测 入门数据集
768 样本 · 8 特征 获取数据 →
Kaggle 2GB

医疗费用数据集

美国医疗保险费用数据,包含年龄、性别、BMI、吸烟等信息,预测医疗费用。

回归预测 保险定价 特征分析
1,338 样本 · 7 特征 获取数据 →
Kaggle 500MB

心脏病数据集

综合多个心脏疾病数据集,包含年龄、胆固醇、心电图等特征,预测心脏病风险。

分类预测 心血管 健康评估
918 样本 · 12 特征 获取数据 →
Kaggle 50MB

新冠病例数据

全球COVID-19确诊病例、死亡病例、康复病例的时间序列数据。

时间序列 流行病学 疫情分析
全球数据 · 日更新 获取数据 →
UCI 15KB

肝脏病患者数据集

印度肝脏病患者数据,包含年龄、性别、各种酶指标等,用于肝病预测。

分类预测 肝病诊断 医疗数据
583 样本 · 10 特征 获取数据 →
Kaggle 100MB

睡眠健康数据集

包含睡眠时长、质量、睡眠障碍等信息,分析影响睡眠质量的因素。

健康分析 相关性 生活方式
374 样本 · 13 特征 获取数据 →
Kaggle 200MB

中风预测数据集

根据年龄、高血压、心脏病、婚姻状况等特征预测中风风险。

二分类 脑血管 风险评估
5,110 样本 · 11 特征 获取数据 →
🚗

交通物流数据

出行、运输、城市交通
Kaggle 500MB

纽约出租车数据

纽约市黄色出租车和绿色出租车的行程记录,包含时间、地点、费用等信息。

出行分析 时空数据 大规模数据
数百万行程 · 18 特征 获取数据 →
Kaggle 50MB

共享单车数据集

华盛顿特区Capital Bikeshare共享单车使用数据,包含天气、季节、时间等信息。

时间序列 需求预测 共享经济
17,379 样本 · 16 特征 获取数据 →
Kaggle 100MB

航班延误数据集

美国国内航班数据,包含航班号、起飞延误、到达延误、原因等信息。

延误预测 航空运输 分类回归
500万+ 航班 · 多年数据 获取数据 →
Kaggle 10MB

交通事故数据集

美国交通事故记录数据,包含事故严重程度、天气、路况等信息。

事故分析 安全评估 地理信息
350万+ 事故记录 获取数据 →
政府公开 -

中国城市交通数据

包含城市公交、地铁、出租车等交通数据,适合城市交通规划研究。

城市规划 公共交通 智慧城市
多城市数据 获取数据 →
Kaggle 30MB

物流配送数据

电商物流配送数据,包含订单信息、配送时间、配送区域等。

物流优化 配送预测 电商分析
10万+ 订单记录 获取数据 →
Kaggle 5MB

Uber出行数据

Uber叫车数据,包含出发地、目的地、时间、价格等信息。

网约车 出行分析 定价模型
10万+ 行程记录 获取数据 →
Kaggle 50MB

车辆燃油效率数据

汽车燃油效率数据,包含车型、发动机、油耗等信息。

回归分析 能源效率 汽车工业
40,000+ 车型 获取数据 →
🌱

环境能源数据

气候、能源、环境监测
Kaggle 10MB

空气质量指数数据

全球主要城市的空气质量指数AQI数据,包含PM2.5、PM10、O3等污染物浓度。

环境监测 时间序列 污染分析
全球城市 · 日更新 获取数据 →
政府公开 -

全球气候变化数据

NOAA提供的全球气温、降水、海平面等气候变化数据,适合气候建模研究。

气候模型 环境科学 长期趋势
百年历史数据 获取数据 →
Kaggle 50MB

电力消耗数据

家庭电力消耗数据,包含每分钟的电力使用情况,适合负荷预测研究。

时间序列 能源预测 智能家居
200万+ 记录 · 7 特征 获取数据 →
Kaggle 100MB

太阳能发电数据

太阳能电站发电数据,包含发电量、天气条件等,适合可再生能源预测。

可再生能源 发电预测 能源系统
数年数据 · 多电站 获取数据 →
Kaggle 200MB

风力发电数据

风力发电机组数据,包含风速、风向、发电功率等,适合风电预测研究。

风能预测 清洁能源 时间序列
多机组 · 年度数据 获取数据 →
Kaggle 20MB

地震数据集

全球地震记录数据,包含震级、震源深度、位置等信息。

自然灾害 空间分析 地质学
数万次地震记录 获取数据 →
Kaggle 30MB

水资源数据集

全球水资源数据,包含降水量、径流量、水位等指标。

水资源 水文模型 环境管理
全球数据 获取数据 →
政府公开 -

中国环境监测数据

中国环境监测总站提供的空气质量、水质、噪声等环境监测数据。

环境监测 中国数据 实时数据
全国监测站点 获取数据 →

社交网络数据

社交媒体、网络分析、推荐系统
Kaggle 800MB

Twitter情感分析数据

大量带情感标签的推文数据,适合自然语言处理和情感分析研究。

NLP 情感分析 文本分类
160万+ 推文 获取数据 →
Kaggle 200MB

电影推荐数据集

MovieLens电影评分数据,包含用户评分、电影信息、标签等,适合推荐系统研究。

推荐系统 协同过滤 经典数据集
2000万+ 评分 获取数据 →
Kaggle 500MB

电商评论数据

亚马逊产品评论数据,包含评分、评论文本、产品信息等。

文本挖掘 情感分析 电商数据
数百万评论 获取数据 →
Kaggle 5MB

社交网络图数据

Facebook社交网络图数据,适合网络分析、社区发现、图挖掘研究。

图分析 社交网络 复杂网络
4,039 节点 · 88,000+ 边 获取数据 →
Kaggle 100MB

新闻文章数据集

新闻文章标题、内容、类别数据,适合文本分类、主题建模研究。

文本分类 主题模型 NLP
20万+ 文章 获取数据 →
Kaggle 150MB

Reddit评论数据

Reddit平台评论数据,包含用户评论、评分、话题等信息。

社交平台 文本分析 用户行为
数百万评论 获取数据 →
Kaggle 50MB

在线约会数据

OkCupid用户资料数据,包含用户偏好、兴趣等信息,适合推荐系统研究。

用户画像 匹配算法 社交分析
60,000+ 用户 获取数据 →
Kaggle 80MB

YouTube视频数据

YouTube热门视频数据,包含观看量、点赞、评论、标签等信息。

视频分析 流行度预测 内容推荐
数万视频 获取数据 →
📚

教育文化数据

教育、体育、文化艺术
Kaggle 50MB

学生成绩数据集

葡萄牙中学生成绩数据,包含学生背景、学习习惯、家长情况等,预测学业成绩。

教育数据挖掘 成绩预测 影响因素
649 样本 · 33 特征 获取数据 →
Kaggle 100MB

在线课程数据

Coursera、edX等在线教育平台课程数据,包含课程信息、评分、学习人数等。

在线教育 课程分析 学习行为
数万课程 获取数据 →
Kaggle 20MB

大学排名数据

全球大学排名数据,包含QS、THE等多个排名体系的指标数据。

教育评价 排名分析 高校研究
全球1000+大学 获取数据 →
Kaggle 150MB

NBA球员数据

NBA球员和球队的历史统计数据,适合体育分析和预测建模。

体育统计 篮球分析 预测建模
历史数据 · 多赛季 获取数据 →
Kaggle 30MB

图书评分数据

Goodreads图书评分数据,包含用户评分、书籍信息、阅读量等。

推荐系统 阅读分析 文化数据
数百万评分 获取数据 →
Kaggle 200MB

音乐数据集

Spotify音乐数据,包含音频特征、流行度、流派等信息。

音乐分析 流派分类 推荐系统
数万首歌曲 获取数据 →
政府公开 -

中国教育统计数据

教育部发布的各类教育统计数据,包含招生、毕业生、教师等指标。

教育统计 中国数据 宏观分析
年度数据 获取数据 →
Kaggle 10MB

电子游戏销售数据

全球电子游戏销售数据,包含销量、平台、年份、流派等信息。

销售分析 游戏产业 趋势预测
16,500+ 游戏 获取数据 →