波兰最大的数据科学盛会的第四版已经过去。尽管今年的数据科学峰会仅在线举行,但我们不能错过。

数据科学领域是多种多样的,演讲者讨论的主题也同样多种多样。它们的范围从纯粹的技术模型(例如,构建模型)到解决数据问题再到描述研究本身。

但是,我们特别感兴趣地聆听了有关将广告和营销领域与人工智能解决方案联系起来的演讲。今天,我们想与您分享我们对其中一些的印象。

使用AI进行广告和营销的趋势

预测在线广告拍卖的最低价格:在广告技术行业中整合启发式数据科学解决方案, KarolKulasiński和ŁukaszSidor(Yieldbird)

当前,数字广告支出超过了模拟广告(电视,纸张媒体等)的广告支出总额。但是,由于以RTB模式销售广告的过程非常复杂,因此配额的优化需要AI的参与。  

演讲还涉及支持人工智能算法使用的其他方面,例如缺乏拍卖销售平台的标准化,影响价格或实时数据生成的因素的自动化。 

该演示文稿基于Yieldbird的案例研究,该案例研究在NCBiR赠款的基础上,研究了购买拍卖(出价)的分布以及影响RPM优化指数的变量(给定页面上广告收入与流量的比率)。讨论了整个研究过程以及为潜在客户提供解决方案的可伸缩体系结构的过程。该项目所伴随的问题主要是具有很大差异的数据量及其聚集影响了操作成本。另一个问题是已开发模型的基准和动作中所占份额的最佳创建速度(出价阴影)。 

对于我们来说,演示非常有趣,因为我们不仅在自己的赠款上工作,而且还是使用Facebook 营销学 API中的数据并支持广告活动报告的工具。 

预测Facebook上营销活动的有效性
RafałWojdan,LidiaKołakowska,Dominika Sagan,TomaszBocheński(Sotrender)

众所周知,Facebook是许多人娱乐和交流的源泉。但是,并非所有人都知道,由于其受欢迎程度,公司越来越多地使用它进行营销活动。关键方面之一是优化已发布的广告,以使其达到为其设定的目标。朝这个方向迈出的第一步是预测广告效果/受欢迎程度。 

Sotrender的数据科学家在演讲中说:

  • Sotrender如何解决有关营销活动有效性的研究问题? 
  • 脸书 营销学 API的结构是什么,我们如何从中获取数据? 
  • 为什么定义目标变量有问题? 
  • 如何创建一个基于文本和图像数据以及广告配置参数的模型,以及如何解释该模型的操作?

优化营销活动中提升模型的可解释性
Paulina Tomaszewska(PW),JanMiłośćjewski(UW),AndżelikaZalewska(PW)

如您所知,您可以通过各种方式优化广告和我们定位到的收件人。一种方法是通过“提升模型”。 创建的模型为每个用户预测两种情况下的情况: 

  1. 用户收到广告
  2. 用户没有收到广告

两种结果之间的差异决定了广告是否会影响用户购买产品的意愿。 

XAI被用来测试我们是否可以信任该模型–也就是说,他如何做出选择。使用SHAP值(模型具有“树”结构,使用的算法是treeSHAP),解释了模型遵循的规则。比较了几种方法以概括SHAP结果 –重要性可变,依赖图。根据结果​​,提出了一些可以遵循的规则,例如:当某人从男装和女装系列中购买产品时,最好展示一个女装系列的广告。

使用心理学个性化广告:案例研究, Adam Witkowski(MIM解决方案)

在他的演讲中,作者讨论了自动广告的主题以及一组用户的个性估计以及基于个性的用户点击给定广告的可能性。建立模型的数据集来自移动设备上的广告数据。 

在这种情况下,使用了经过Python训练的LightGBM算法。另一方面,该模型已部署在Go中,其中主要确定了与Python相比的效率和速度优势。 MlFlow工具用于监视实验,我们在Sotrender的工作中也使用了该工具。讨论了由于Google的政策而在模型中使用的基本功能以及在建模中使用某些功能的限制。用户根据分类人格的五因素模型。该项目与众不同的方面肯定是这样一个事实,除了数据科学家之外,心理学领域的研究人员也在致力于该项目,带来了深入的专家知识。 

演讲的主题,尽管我们认为非常有趣,但可以以更深入的方式介绍。 

使用R中的Google Vision API识别Facebook广告素材上图像的内容。
Maciej Baranowski(Sotrender)

图像识别以及检测文本和可见对象的模型已经开发了很长时间。但是,由于各种原因,由于使用成本或缺乏培训数据,它们的可用性和使用可能性可能会受到限制。现有工具(例如Google Vision API)可以为您提供帮助。 

Maciek在讲话中谈到了如何轻松快速地分析数百幅图像。例如,这适用于Facebook帖子中使用的图像-这些图像通常包含的内容不仅仅是广告的说明。数据来自 脸书广告库

如果您对此问题感兴趣,建议您阅读全文。

使用相似的配置文件和归因模型来优化营销活动,即汽车行业的BigData和ML, Ewelina Zaborowska和Bogdan Koroluk(哈瓦斯传媒集团)

购物路径和客户联系点很多,这是优化营销活动的第一个挑战。对于聚合和集成,提出了一种基于ID图的解决方案。

对于相似的建模,使用了60天的用户互动历史记录以及渠道和联系点。基于这些数据,深度学习模型确定了用户的相似性。通过使用分类模型解决了归因问题,该模型可以预测给定路径是否以转换结束。选择了一个随机森林模型,并根据cookie中的信息构建了训练数据。最重要的是要预测不会转换的路径。根据模型结果,确定每个通道的ROI。

马尔可夫链用于跟踪转换路径,从而可以确定客户在接触点和媒体渠道之间进行转换的可能性。

例如,如果用户通过单击“付费搜索”开始其路径,则有38%的可能性将其转化为最终路径,有20%的可能性将单击再营销广告系列,而1%的可能性将显示。

总之,尽管所提出的解决方案和模型是众所周知的,但很高兴听到有关所分析问题的更多实用信息。

数据科学峰会的其他有趣话题

尽管我们主要将注意力集中在营销和广告主题上,这从我们日常活动的角度来看是显而易见的,但在会议期间,其他一些演示也引起了我们的注意。 

如何预期与招聘者联系的意愿? RafałProńko(CV时间轴)

在介绍过程中,介绍了该项目的结果和工作过程,旨在增加对招聘门户网站上招聘者信息的积极回应的频率。事实证明,通过使用机器学习模型来预测应聘者在给定时间改变工作的趋势,然后在此基础上进行选择,联系的效率可以提高两倍(从10%到20%)。这为招聘人员节省了大量时间,因此为雇用他们的公司节省了大量资金。 

通过尝试反思在Sotrender中使用类似模型的可能性,可以尝试创建一个模型,以增加与我们工具的新用户(客户)的潜在候选人进行有效营销交流的机会。    

使用Google Cloud Platform训练和实施机器学习模型的模型
MaciejPieńkosz(投稿人)

好的,我已经在我的笔记本中有了出色的模型,接下来该怎么办?大多数机器学习课程和资源都为我们做好实施机器学习算法和构建模型的准备。但是,在大多数情况下,模型只是大型系统的一小部分,其实现和维护是一个耗时的过程,会产生各种错误。当我们不得不制作一个而不是更多的模型时,问题就更加恶化了。尽管出现了越来越多的工具和平台来促进此过程,但是这个问题仍然很少受到关注。 

在他的演讲中,Maciek讨论了我们在Sotrender中使用的方法,最佳做法以及Google Cloud Platform工具和服务,以有效地训练和生产用于分析社交媒体数据的ML模型。此外,它讨论了在基于ML(MLOps)模型的产品生产中我们需要注意DevOps的哪些方面,以及如何使用Google Cloud Platform在您的初创公司或公司中轻松实现它们。

这个孩子的年龄没有估计。如何使用YouTube创建年龄估算器
Natalia Ziemba Jankowska(Linux波兰)

一个非常有趣的演示,其中提出了业务需求,它是建立一个模型来识别自助游戏机用户的年龄。 

他们发现,即使最有前途的模型也能很好地识别成人的年龄,而不是儿童的年龄。

为什么?公开的,可用的和选定的模型是基于IMDb电影数据库(由名人准备的数据集)中的照片建立的。但是,源材料中没有孩子的照片,因此该模型没有什么可学的。

但是,有人指出,该模型仅应提及某人是否超过18岁。或以下-不需要确切的年龄识别。但是,最初需要在模型学习操作之前收集数据。决定使用YouTube并从该网站上发布的视频中删除人们的面孔,以便该模型可以学习年龄估算,并根据这些内容将人们分配到适当的年龄类别。在研究中,年龄组分为儿童,学龄前儿童,小学生,高中生,学生和成人。 

然而,事实证明,找到合适的材料是一项创造性的壮举。 

 

关于作者

克劳迪娅(KlaudiaŻyłka)

市场营销专家

Instagram,狗,书籍和美食爱好者。华沙大学和马尔默大学的前学生。每天提高她的营销技巧。自豪地拥有DIMAQ证书