全球旧事资料 分类
浙江工商大学计算机与信息工程学院
《Pytho
程序设计与实践》大作业报告
专业计科
班级1404
学号、、姓名陆阳孙勇裘明
指导教师
2015年6月28日
f题目介绍
在真实的业务场景下我们往往需要对所有商品的一个子集构建个性化推荐模型。在完成这件任务的过程中我们不仅需要利用用户在这个商品子集上的行为数据往往还需要利用更丰富的用户行为数据。定义如下的符号
U用户集合
I商品全集
P商品子集PI
D用户对商品全集的行为数据集合
那么我们的目标是利用D来构造U中用户对P中商品的推荐模型。
数据说明
竞赛数据包含两个部分。第一部分是用户在商品全集上的移动端行为数据D表名为tia
chi_mobile_recomme
d_trai
_user包含如下字段
f第二个部分是商品子集P表名为tia
chi_mobile_recomme
d_trai
_item包含如下字段
训练数据包含了抽样出来的一定量用户在一个月时间11181218之内的移动端行为数据D评分数据是这些用户在这个一个月之后的一天1219对商品子集P的购买数据。参赛者要使用训练数据建立推荐模型并输出用户在接下来一天对商品子集购买行为的预测结果。
大作业报告内容包括以下几个部分
1、数据分组统计
可统计有多少用户、商品、商品类别等信息甚至每天各种行为的统计数。如图
f还有在给出的用户行为数据中有些用户在整个1118日至1218日对商品有浏览行为记录但是从未产生过购买行为这些用户会否在12月19号购买商品实难预测因此我们去除这些无购买行为的用户信息认为这些用户在12月19号还是不会购买任何商品。
贴关键代码
importtime
importpa
dasaspd
fstarttimetime
df_itemspdread_csv
好听全球资料 返回顶部