美文网首页
[PML 3] C1S2 生活中的个性化算法

[PML 3] C1S2 生活中的个性化算法

作者: 数科每日 | 来源:发表于2022-02-25 05:17 被阅读0次

除了介绍各种算法以外, 本书的以外一个目的是探索个性化算法在日常生活中的使用, 并进一步讨论它可能的风险和后果。

个性化算法现在已经很常见了, 比如音乐推荐, 电商网站推荐,新闻推荐等等。 相关的技术也从入门级的启发式算法(我朋友喜欢A, 那么我也可能喜欢A)到 temporal patterns, NLP或者 CV。

下面介绍一些常见的例子, 它们会在本书中作为例子反复出现。

推荐系统

本书很多例子都关于推荐系统, 一方面是它常见, 另外一方面是因为他的数据很容易搞到。 此外, 推荐算法一般都很 straightforward, 比较容易就能够搭建出一个接近 state-of-the-art 水平的算法。在推荐系统中使用的技术也容易推广到其他场景中。

为了构建推荐系统, 我们必须理解用户的喜好和物品的属性, 以此理解为什么用户会购买一个物品,而不是另外一个。 用户的喜好是主观的,和年龄, 收入,种族有关。 此外,用户喜好和物品属性都可能随着时间的变化。

基于推荐技术,在无数环境中,捕捉个体之间的差异是做出有意义的预测的关键。比如个性化健康应用中,用户的身体特征、病史或风险因素可能会有所不同;或在涉及自然语言(或对话)的环境中,用户的写作风格、个性或特定背景可能会有所不同。

个性化健康

个性化健康(Personalized health): 是个性化算法中的一个新兴领域。 在做健康判断,疾病预测,心率监控的时候, 算法必须结合使用者本人的健康特征, 否则给出结果的价值就会大打折扣。

个性化健康的一个典型应用是: 预测病人下次看医生的时候, 会有什么症状。 这个应用非常类似推荐系统:预测病人与某种刺激(疾病症状)之间随着时间变化的互动关系(Yang et al., 2014)。 此类任务的技术借鉴了推荐系统的思想,尤其是时间和顺序推荐(temporal and sequential recommendation),我们会在第 7 章中介绍他们。

此外,个性化健康还包括: 预测手术时间s (Ng et al., 2017), 预测心率对物理刺激的变化(Ni et al., 2019b), 药物分布动力学(Ingrande et al., 2020). 对此类问题进行建模需要了解患者或医生的特征(以及他们之间的互动)。用到的技术范围从简单回归(例如预测手术持续时间)到循环神经网络(例如预测心率曲线)。

很多个性化健康问题都会用到自然语言处理,例如分析病历记录,或者X光照片生成报告 (Ni et al., 2020)。 第8章会对他们进行讨论。

计算社会科学

有时候, 我们对用户数据建模,不仅仅是预测未来的事件。而是要了解正现在系统中各个部分是如何互动的。使用机器学习和数据驱动的方法从大型数据集中了解 dynamics of human behavior 是计算社会科学的主要目标之一。

同样,对于我们开发的许多模型,理解当下行为和预测未来一样重要。当我们开发 回归模型来预测 reddit 上的内容成功时(第 2.6.1 节),我们的主要目标是发现成功的因素,例如社区动态、标题、提交时间等。或者,在构建推荐系统时,我们的目标是理解和解释引导用户决策的潜在因素,以及导致这些偏好随时间变化的原因,包括用户如品味变化、对旧物品产生怀旧情绪,或者只是单纯响应了用户界面的变化。

最后,当我们开始探索个性化的伦理后果(我们将在第 1.8 节中介绍)时,我们将强调一点,准确预测本身并不是这类系统唯一追求的目标。在第 10 章中,我们将研究对与个性化系统交互的用户的长期影响:这包括研究是什么因素驱使用户使用极端内容,以及如何通过算法缓解这些不良结果。

语言生成, 个性化对话 与 可互动代理 (Language Generation, Personalized Dialog, and Interactive Agents)

最后,鉴于人们与预测系统交互的新模式,我们对个性化提出了新的需求。

例如,个性化在涉及自然语言的应用中至关重要。由于写作风格、主观性等方面的差异,用户生成的语言数据会表现出很大的可变性。在处理此类数据时,非个性化模型可能会遇到处理这种差别的问题。例如,对于自动对话系统,无论是面向任务,还是在开放域“闲聊”,都可以从个性化中受益。 从而产生更加个性化,个人用户的语气,或上下文更感同身受的响应 (Majumder et al., 2020)。

我们将在整本书中看到几个个性化语言建模的实例:语言模型对于解释机器学习预测结果越来越重要(第 8.4.3 节),这会促进与预测系统交互的新模式(例如对话,第 8.4.4 节),并开发新型辅助工具,例如帮助用户回复电子邮件的算法(第 8.5 节)。

相关文章

网友评论

      本文标题:[PML 3] C1S2 生活中的个性化算法

      本文链接:https://www.haomeiwen.com/subject/wmtxrrtx.html