Spark+ES+ClickHouse 构建DMP用户画像 完整版
第1章 DMP用户画像项目介绍
本章将向大家介绍什么是DMP,并辅以行业数据说明DMP的重要性和行业前景,并介绍课程讲解项目所会使用到的大数据技术,框架、版本以及推荐得学习方法。
第2章 项目环境搭建
本章将带领大家一起来学习,如何用 docker 一键部署开发环境;如何实现 Hive 数仓的数据导入;实用工具类的代码编写等,完成开发前得准备工作。
第3章 DMP和用户画像
本章会介绍,用户画像的生成流程,画像的标签维度,用户画像和特征工程的关系。带领大家了解什么样的画像才是高质量的用户画像,以及DMP用户画像的使用场景。
第4章 用户画像搭建之特征工程
本章会详细的讲解数值型特征,类别型特征,文本型特征的特征处理,以及特征交叉的算法 FM,特征筛选的算法 gbdt 和 xgboost。并会带领大家应用 Spark 代码实现商品评论的情感提取,以及基于 xgboost 的特征筛选。
第5章 用户画像搭建之标签体系构建
本章会详细的讲解,如何通过TF-IDF生成标签的权重;用户行为偏好标签的计算;标签在Hbase的存储格式;以及如何使用ES存储Hbase的索引,进而提高复杂组合标签的查询效率。
第6章 用户画像搭建之群体用户画像构建
本章会讲解,如何通过朴素贝叶斯,实现用户性别预测,基于RFM模型对用户价值进行分群,基于K-Means对用户的消费等级进行分群,并会带领大家认识用户分群的时间衰减因素。
第7章 用户画像搭建之DMP人群管理
本章会通过 DMP 演示如何管理人群标签,生成人群包数据,人群圈选,以及人群扩展。并且使用 Clickhouse 做人群洞察分析。
第8章 项目展示及版本升级解决方案
本章会模拟生产环境集群的形式,展示项目实际运行效果,并结合框架版本升级,讲解踩坑秘笈。
**** Hidden Message *****
啥也不说了,感谢楼主分享哇! 啥也不说了,感谢楼主分享哇! 啥也不说了,感谢楼主分享哇! 啥也不说了,感谢楼主分享哇! 珍惜生命,果断回帖。 正需要,支持楼主大人了! 确实是难得好帖啊,顶先 啥也不说了,感谢楼主分享哇! 啥也不说了,感谢楼主分享哇! 啥也不说了,感谢楼主分享哇!