清华大学|信息学院|国家实验室|English Version

信研院举办2019年学术讲座2——《用户行为大数据—用户理解》

5月15日下午,由信研院主办的2019年系列学术讲座2——《用户行为大数据—用户理解》在FIT楼多功能厅举办。本次讲座由爱奇艺高级技术经理陆祁主讲,副院长邢春晓主持,校内外师生等100余人听取了报告。

DSC_5440_副本.jpg

讲座中,陆祁从用户理解概述、案例实践和产品应用三个方面,分享了爱奇艺在大数据下的用户理解场景中的业务需求和应用实践。实际业务中,用户理解体系是综合考虑了自然、设备、身份、行为偏好、社交等多种属性的用户标签体系,和用户画像密切相关。该标签体系包含数百多维特征,其中数十多维特征通过数据挖掘产生,陆祁对数据挖掘流程进行了重点介绍,并列举了用户属性识别、自然人识别和WOI与社交关系识别三个典型案例。陆祁还介绍了高质量标签收集的方式、如何解决标签有偏和抖动的问题以及标签预处理内容,如何使用不同的机器学习方法对样本建模,并提出规则和PU Learning是特殊情况下进行数据挖掘的关键。在产品应用方面,陆祁提出,用户画像可以用于个性化推荐、用户分析、精准运营和广告等,用户理解则有助于个人画像查询、数据分析、定向运营和广告投放等业务的推进。

讲座结束后,陆祁现场回答了师生提出的关于数据尺度选择与场景应用的关系、数据挖掘中的用户隐私考虑以及对特征工程自动化的探索灯问题。

【发布时间:2019-05-17】【浏览次数:323】