数学建模数据集
精选55+公开数据集,涵盖经济金融、医疗健康、交通物流、环境能源、社交网络等领域,适合建模练习与科研使用
经济金融数据
股票、信贷、经济指标等信用卡欺诈检测数据集
包含284,807条欧洲信用卡交易记录,其中492条为欺诈交易。特征经过PCA变换,适合异常检测和类别不平衡学习。
房价预测数据集
爱荷华州Ames市的房屋销售数据,包含79个解释变量,用于预测房屋最终价格。经典的回归问题数据集。
贷款违约预测
Lending Club平台的贷款数据,包含借款人信息、贷款特征等,预测贷款是否会违约。
股票市场数据
标普500指数成分股的历史价格数据,包含每日开盘价、收盘价、最高价、最低价和成交量。
银行营销数据集
葡萄牙银行电话营销活动数据,预测客户是否会订阅定期存款,适合分类问题研究。
默认信用卡客户
台湾信用卡客户数据,包含人口统计信息、还款历史、账单金额等,预测下月是否会违约。
电商销售数据
巴西电商平台Olist的销售数据,包含10万+订单信息、产品类别、客户评价等。
中国国家统计局数据
包含GDP、CPI、人口、就业、贸易等宏观经济指标的时间序列数据,适合经济建模研究。
客户交易预测
Santander银行客户交易预测比赛数据,预测哪些客户会进行特定交易。
医疗健康数据
疾病诊断、医疗记录、健康指标乳腺癌诊断数据集
威斯康星乳腺癌数据集,包含细胞核特征信息,用于诊断肿瘤是良性还是恶性。
肺炎X光图像数据集
胸部X光图像数据集,用于区分正常和肺炎患者,适合医学图像分类任务。
糖尿病数据集
Pima印第安人糖尿病数据集,根据诊断测量值预测患者是否患有糖尿病。
医疗费用数据集
美国医疗保险费用数据,包含年龄、性别、BMI、吸烟等信息,预测医疗费用。
心脏病数据集
综合多个心脏疾病数据集,包含年龄、胆固醇、心电图等特征,预测心脏病风险。
新冠病例数据
全球COVID-19确诊病例、死亡病例、康复病例的时间序列数据。
肝脏病患者数据集
印度肝脏病患者数据,包含年龄、性别、各种酶指标等,用于肝病预测。
睡眠健康数据集
包含睡眠时长、质量、睡眠障碍等信息,分析影响睡眠质量的因素。
中风预测数据集
根据年龄、高血压、心脏病、婚姻状况等特征预测中风风险。
交通物流数据
出行、运输、城市交通纽约出租车数据
纽约市黄色出租车和绿色出租车的行程记录,包含时间、地点、费用等信息。
共享单车数据集
华盛顿特区Capital Bikeshare共享单车使用数据,包含天气、季节、时间等信息。
航班延误数据集
美国国内航班数据,包含航班号、起飞延误、到达延误、原因等信息。
交通事故数据集
美国交通事故记录数据,包含事故严重程度、天气、路况等信息。
中国城市交通数据
包含城市公交、地铁、出租车等交通数据,适合城市交通规划研究。
物流配送数据
电商物流配送数据,包含订单信息、配送时间、配送区域等。
Uber出行数据
Uber叫车数据,包含出发地、目的地、时间、价格等信息。
车辆燃油效率数据
汽车燃油效率数据,包含车型、发动机、油耗等信息。
环境能源数据
气候、能源、环境监测空气质量指数数据
全球主要城市的空气质量指数AQI数据,包含PM2.5、PM10、O3等污染物浓度。
全球气候变化数据
NOAA提供的全球气温、降水、海平面等气候变化数据,适合气候建模研究。
电力消耗数据
家庭电力消耗数据,包含每分钟的电力使用情况,适合负荷预测研究。
太阳能发电数据
太阳能电站发电数据,包含发电量、天气条件等,适合可再生能源预测。
风力发电数据
风力发电机组数据,包含风速、风向、发电功率等,适合风电预测研究。
地震数据集
全球地震记录数据,包含震级、震源深度、位置等信息。
水资源数据集
全球水资源数据,包含降水量、径流量、水位等指标。
中国环境监测数据
中国环境监测总站提供的空气质量、水质、噪声等环境监测数据。
社交网络数据
社交媒体、网络分析、推荐系统Twitter情感分析数据
大量带情感标签的推文数据,适合自然语言处理和情感分析研究。
电影推荐数据集
MovieLens电影评分数据,包含用户评分、电影信息、标签等,适合推荐系统研究。
电商评论数据
亚马逊产品评论数据,包含评分、评论文本、产品信息等。
社交网络图数据
Facebook社交网络图数据,适合网络分析、社区发现、图挖掘研究。
新闻文章数据集
新闻文章标题、内容、类别数据,适合文本分类、主题建模研究。
Reddit评论数据
Reddit平台评论数据,包含用户评论、评分、话题等信息。
在线约会数据
OkCupid用户资料数据,包含用户偏好、兴趣等信息,适合推荐系统研究。
YouTube视频数据
YouTube热门视频数据,包含观看量、点赞、评论、标签等信息。
教育文化数据
教育、体育、文化艺术学生成绩数据集
葡萄牙中学生成绩数据,包含学生背景、学习习惯、家长情况等,预测学业成绩。
在线课程数据
Coursera、edX等在线教育平台课程数据,包含课程信息、评分、学习人数等。
大学排名数据
全球大学排名数据,包含QS、THE等多个排名体系的指标数据。
NBA球员数据
NBA球员和球队的历史统计数据,适合体育分析和预测建模。
图书评分数据
Goodreads图书评分数据,包含用户评分、书籍信息、阅读量等。
音乐数据集
Spotify音乐数据,包含音频特征、流行度、流派等信息。
中国教育统计数据
教育部发布的各类教育统计数据,包含招生、毕业生、教师等指标。
电子游戏销售数据
全球电子游戏销售数据,包含销量、平台、年份、流派等信息。