范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

使用ML和人在循环中构建Airbnb类别(译文来自Airbnb)

  Airbnb 2022 版本引入了类别,这是一种以浏览为重点的产品,允许用户通过浏览围绕一个共同主题的房屋集合来寻找灵感,例如 湖畔、乡村、高尔夫、沙漠、国家公园 、 冲浪 等。在我们的第一部分类别博客系列我们介绍了创建类别并在产品中展示它们的高级方法。在第二部分中,我们将更详细地描述 ML 分类工作。
  在整个帖子中,我们使用 Lakefront 类别 作为运行示例来展示 ML 支持的类别开发过程。类似的过程适用于其他类别,具有类别特定的细微差别。例如,一些类别更多地依赖兴趣点,而其他类别更多地依赖结构化列表信号、图像数据等。 类别定义
  类别开发从产品驱动的类别定义开始:"  Lakefront 类别应包括距湖不到 100 米的列表 "。虽然一开始这听起来像是一项简单的任务,但它非常微妙和复杂,因为它涉及利用多个结构化和非结构化列表属性、兴趣点 (POI) 等。它还涉及训练将它们组合起来的 ML 模型,因为没有一个这些信号自己捕获了可能候选者的整个空间。 列出理解信号
  作为过去各种项目的一部分,Airbnb 的多个团队花时间处理不同类型的原始数据,以提取结构化形式的有用信息。我们的目标是利用这些信号进行基于规则的冷启动类别候选生成,然后将它们用作 ML 模型的特征,以便以更高的精度找到类别候选: 房东提供的房源信息 ,例如 房产类型 (例如城堡、船屋)、 便利设施和属性   (游泳池、火坑、森林景观等)。 列出   位置 、 标题、描述、图像标题, 可以扫描关键字(我们收集了每个类别不同语言的详尽关键字集)。 主机指南 ,其中主机推荐附近的地方供客人参观(例如葡萄园、冲浪海滩、高尔夫球场),其中包含可用于提取 POI 的位置数据 Airbnb 体验 ,例如 冲浪 、 高尔夫、水肺潜水 等。 事实证明,这些活动的地点 有助于确定某些活动相关类别的候选房源。 客人评论   是可以扫描 关键字 的另一个来源。我们还收集客人的补充评论,其中客人提供 有关房源质量、便利设施和属性的反馈。 客人在浏览时创建的愿望清单 ,例如"Golf trip 2022"、"Beachfront"、"Yosemite trip",通常与其中一个类别相关,事实证明这对候选人生成很有用。
  图 1. airbnb 用户创建的热门愿望清单
  使用外部数据进一步丰富了房源理解知识库,例如 卫星数据 (告诉我们房源是否靠近海洋、河流或湖泊)、 气候、地理空间数据 、 人口数据 (告诉我们房源是在农村还是城市)或大都市区)和 POI 数据 ,其中包含来自主机指南或我们通过开源数据集收集的名胜古迹的名称和位置,并通过内部人工审查进一步改进、丰富和调整。
  最后,我们利用内部 ML 模型从原始列表数据中提取更多知识。其中包括 ML 模型,用于检测列表图像中的设施和对象 、 对列表图像中的房间类型和室外空间进行分类 、 计算列表之间的嵌入相似性 以及 评估物业美学 。这些中的每一个都分别在类别开发、候选生成、扩展和质量预测的不同阶段有用。 基于规则的候选生成
  一旦定义了一个类别,我们首先利用上一节中描述的预先计算的列表理解信号和 ML 模型输出来使用一组规则对定义进行编码。然后,我们的候选生成引擎应用它们来生成一组基于规则的候选,并根据类别置信度分数对它们进行优先排序以供人工审核。
  此置信度分数是根据有多少信号使列表符合类别以及与每个规则关联的权重计算的。例如,考虑到 Lakefront 类别,靠近 Lake POIs 的权重最大,房东提供的关于直接进入湖泊的信号次之更重要,listing 标题、描述、愿望清单、评论中发现的 lakefront 关键字权重较小,而湖泊和水检测在列表中,图片的权重最小。具有所有这些属性的列表将具有非常高的置信度分数,而仅具有一个属性的列表将具有较低的分数。 人工审核流程
  通过从具有最高类别置信度得分的每个类别中选择一定数量的列表,每天将候选人送去人工审查。然后人工代理判断列表是否属于该类别,选择最佳封面照片并评估列表的质量(图 3)
  随着人工评论开始涌入,并且有足够多的列表带有确认和拒绝的类别标签,它解锁了新的候选生成技术,这些技术开始贡献自己的候选: 基于邻近度: 利用到给定类别中已确认房源的距离,例如已确认的 Lakefront 房源的邻居也可能是 Lakefront 嵌入相似性 :利用列表嵌入来查找与给定类别中已确认列表最相似的列表。 训练 ML 分类   模型 :一旦代理审查了 20% 基于规则的候选人,我们就开始训练 ML 模型。
  一开始,只有经过代理审查的列表才会被发送到生产环境并出现在主页上。随着时间的推移,随着我们的候选生成技术产生了更多的候选和反馈循环的重复,它使我们能够使用更多标记数据训练越来越好的 ML 模型。最后,在某个时候,当 ML 模型足够好时,我们开始将具有足够高模型分数的列表发送到生产环境(图 2)。
  图 2. 每个类别的生产清单数量和人工审查的分数
  使 ML 模型与人工审核任务保持一致
  为了扩展审查过程,我们训练了模仿三个人工代理任务中的每一个的 ML 模型(图 3)。在以下部分中,我们将演示每个模型所涉及的训练和评估过程
  图 3. 用于模拟人工审查的 ML 模型设置
  机器学习分类模型
  ML 分类模型的任务是自信地将列表放在一个类别中。这些模型使用 Bighead(Airbnb 的 ML 平台)作为 XGBoost 二进制 分类 模型进行训练。他们使用代理类别分配作为标签,并将"列表理解"部分中描述的信号作为特征。与基于规则的设置相反,ML 模型使我们能够通过模型分数阈值更好地控制候选人的精度。
  尽管许多特征是跨类别共享的,并且可以训练单个多类模型,但由于类别大小的高度不平衡和类别特定特征的主导地位,我们发现最好为每个类别模型训练专用的 ML。另一个很大的原因是,对单个类别的重大更改,例如定义的更改、大量添加新的 POI 或标签,不需要我们重新训练、启动和衡量对所有类别的影响,而是方便地在一个孤立的类别。
  湖滨 ML 模型
  特征 :第一步是构建特征,最重要的是到 Lake POI 的距离。我们从收集表示为单个点的湖泊 POI 开始,然后添加了追踪湖泊的湖泊边界,这大大提高了能够在边界附近拉出列表的准确性。然而,如图 4 所示,即便如此,仍有许多边缘情况导致基于规则的列表分配出现错误。
  图 4. 不完美的 POI(左)和复杂地理的示例:湖泊和家之间的高速公路(中)、长长的后院(右)
  其中包括不完美的湖泊边界,可能在水内或陆地之外、湖泊和房屋之间的高速公路、悬崖上的房屋、不完美的列表位置、缺失的 POI 以及不是真正湖泊的 POI,如水库、池塘等。为此因此,事实证明,将 POI 数据与其他列表信号结合起来作为 ML 模型特征,然后使用该模型主动改进 Lake POI 数据库是有益的。
  在这里被证明有用的一种建模方法是 特征丢失 。由于大多数特征还用于生成由代理评分的基于规则的候选对象,从而产生 ML 模型使用的标签,因此存在过度拟合和超出规则的有限模式发现的风险。
  为了解决这个问题,在训练期间,我们会从一些列表中随机删除一些特征信号,例如与 Lake POI 的距离。因此,该模型并没有过度依赖主要的 POI 特征,这使得列表即使不靠近任何已知的 Lake POI 也可以获得高 ML 分数。这使我们能够找到丢失的 POI 并将它们添加到我们的数据库中。
  标签 : 正面标签 被分配给标记为 Lakefront 的 列表代理, 负面标签 被分配给作为 Lakefront 候选人发送以供审查但被拒绝的列表(从建模角度来看 是硬底片 )。我们还从相关的 Lake House 类别中抽取了负面样本   ,这些类别允许距离湖泊更远( 更简单的负面 )和标记在其他类别中的列表( 最简单的负面 )
  训练/测试拆分:  70:30 随机拆分,我们对距离和嵌入相似性特征进行了特殊处理,以免泄露标签。
  图 5. Lakefront ML 模型特征重要性和性能评估
  我们使用不同的特征子集训练了几个模型。我们对 POI 数据自身的表现以及其他信号可以提供哪些改进感兴趣。如图 5 所示,POI 距离是迄今为止最重要的特征。但是,当单独使用时,它无法达到 ML 模型的性能。具体来说,ML 模型将平均精度提高了 23%,从 0.74 提高到 0.91,这证实了我们的假设。
  由于 POI 功能是最重要的功能,我们通过添加新的 POI 和改进现有的 POI 来改进它。 这被证明是有益的,因为使用改进的 POI 特征的 ML 模型大大优于使用 初始 POI 特征的模型(图 5)。
  Lake POI 优化的过程包括利用训练有素的 ML 模型通过检查模型得分高但与现有 Lake POI 相距甚远的列表来 查找缺失或不完善的 POI  (图 6 左),以及通过检查模型得分低的列表 删除错误的 POI 分数,但非常接近现有的 Lake POI(图 6 右)
  图 6. 查找缺失 POI(左)和错误 POI(右)的过程
  将自信的列表发送到生产环境: 使用测试集 Precision-Recall 曲线,我们找到了一个达到 90% Precision 的阈值。我们使用这个阈值来决定哪些候选人可以直接投入生产,哪些需要先送去人工审查。 封面图片机器学习模型
  为了用 ML 执行第二个代理任务,我们需要训练不同类型的 ML 模型。其任务是根据类别上下文选择最合适的列表封面照片。例如,为 Lakefront 类别选择具有湖景的列表照片。
  我们测试了几个开箱即用的对象检测模型以及几个使用人工评论数据训练的内部解决方案,即(列表 id、类别、封面照片 id)元组。我们发现,最佳的封面照片选择准确性是通过使用我们的人工审查数据微调Vision Transformer 模型(VT) 实现的。经过训练后,该模型可以对所有列表照片进行评分,并确定哪一张是给定类别的最佳封面照片。
  为了评估模型,我们使用了一个保留数据集并测试了代理选择的特定类别的列表照片是否在同一类别的前 3 个最高得分 VT 模型照片中。所有类别的前 3 名平均精度为 70%,我们认为这是令人满意的。
  为了进一步测试模型,我们判断 VT 选择的照片是否比主持人选择的封面照片更能代表类别(图 7)。结果发现,VT 模型可以在 77% 的情况下选择更好的照片。应该注意的是,主持人选择的封面照片通常是在不考虑任何类别的情况下选择的,因为它最能代表搜索提要中的列表。
  图 7. Vision Transformer 与 Host 选择的 Lakefront 类别相同列表的封面照片选择
  除了通过 ML 分类模型为发送到生产的候选人选择最佳封面照片外,VT 模型还用于加快人工审查过程。通过按照 VT 分数的降序排列候选列表照片,我们能够将代理对类别和封面照片做出决定所需的时间缩短 18%。
  最后,对于一些高度视觉化的类别,例如 设计 、 创意空间 ,VT 模型被证明对直接候选生成很有用。 质量机器学习模型
  最后的人工审核任务是通过选择以下四个等级之一来判断列表的质量:最具启发性、高质量、可接受、低质量。正如我们将在博客系列的第三部分中讨论的那样,质量在搜索提要中的列表排名中起着重要作用。
  为了训练可以预测列表质量的 ML 模型,我们结合使用了参与度、质量和视觉信号来创建功能集和代理质量标签来创建标签。这些功能包括评论评级、心愿单、图像质量、嵌入信号和列表便利设施和属性,例如价格、客人数量等。
  给定具有四个质量等级的多类设置,我们尝试了不同的损失函数(成对损失、一对多、一对一、多标签等)。然后,我们在保留集上比较了不同策略的 ROC 曲线,二元一对一模型表现最好。
  图 8:质量 ML 模型特征重要性和 ROC 曲线
  除了在搜索排名中发挥作用外,Quality ML 分数还在人工审查优先逻辑中发挥作用。有了所有三个 ML 模型都可以完成所有三个人工审查任务,我们现在可以简化审查流程并将更多候选人直接送往生产,同时还优先考虑一些人进行人工审查。这种优先排序在系统中起着重要作用,因为经过人工审查的列表可能在类别提要中排名更高。
  在确定人工审核列表的优先级时,需要考虑多个因素,包括列表类别置信度得分、列表质量、可预订性和该地区的受欢迎程度。最好的策略被证明是这些因素的组合。在图 9 中,我们显示了在撰写本文时几个类别的人工审核的最佳候选人。
  图 9:列表在 4 个不同类别中优先审查
  评分后,这些标签将用于在主动反馈循环中进行定期模型重新训练,不断提高类别准确性和覆盖率。 未来的工作
  我们未来的工作涉及在几个方向上迭代三个 ML 模型,包括使用生成视觉模型生成更大的标签集,并可能将它们组合成一个多任务模型。我们还在探索使用大型语言模型 (LLM) 进行类别审查任务的方法
  作者:Mihajlo Grbovic, Pei Xiong, Pratiksha Kadam, Ying Xiao, Sherry Chen, Weiping Peng, Shukun Yang, Chen Qian, Haowei Zhang, Sebastien Dubois, Nate Ney, James Furnary, Mark Giangreco, Nate Rosenthal, Cole Baker, Aaron Yin, Bill Ulammandakh, Shankar Shetty ,  Sid Reddy, Egor Pakhomov
  出处:https://medium.com/airbnb-engineering/building-airbnb-categories-with-ml-human-in-the-loop-35b78a837725

1亿存款被无故划扣?这家科创板公司怒告河南一银行,真相如何?上市公司状告河南一银行!近日,科创板上市公司紫晶存储发布公告称,公司在河南卢氏农商行的近1亿元存款被无故划扣拒绝办理银行UKEY挂失及资金转账事宜。公司多次要求卢氏农商行予以返还配62岁北京人艺院长任鸣去世!两天前最后露面精神好,众星发文悼念饿了吗?戳右边关注我们,每天给您送上最新出炉的娱乐硬核大餐!6月19日深夜,北京人民艺术剧院官网上突然发布一则讣告,宣布院长任鸣去世的噩耗,外界一片哗然。据悉,任鸣老师于6月19日继蓝天野之后,又一人艺巨星陨落!北京人艺院长任鸣去世,陈好等明星发文悼念6月19日,北京人民艺术剧院发布讣告,北京人民艺术剧院院长著名导演艺术委员会主任任鸣同志,因病医治无效于6月19日在京逝世,享年62岁。6月20日,郑云龙在个人社交平台发文悼念北京全国哪的茶叶最好喝?经评比,这4地的茶脱颖而出,你喝过吗茶叶,是我国的国饮,已有历史四千多年,是中华文明灿烂的瑰宝!人们爱喝茶,除了是因为茶叶是我国历史不可分割的一部分之外,更重要的是因为茶叶天然健康,喝起来香醇甘甜,百喝不厌口感无可替柯文哲抛两岸建厦金大桥民进党反酸2024起手式台湾民众党主席台北市长柯文哲日前在金门主张兴建厦金大桥,却被民进党政客反酸。民进党党团干事长郑运鹏声称,台湾是岛屿,没有与任何一个其他区块连接,如果柯文哲要跟厦门连接,国际上会有不养老金开始上涨,3000元以下多涨300,达到5000元停涨合理吗?点击上方蓝色按钮,可同步收听有声书。养老金开始上涨!3000元以下再涨300,达到5000元不涨合理吗?5月26日,人社部和财政部联合公布了2022年养老金调整通知,确定养老金第1赵丽颖冯绍峰疑复合!两人同一会所先后离开,出门相差不到5分钟饿了吗?戳右边关注我们,每天给您送上最新出炉的娱乐硬核大餐!6月20日,有媒体晒出赵丽颖与冯绍峰两人出入同一会所的照片,出门前后时间相差不到5分钟,疑似复合。动态一出,迅速引起网友6月下旬已定档电视剧6月中旬开播电视剧一览6月22日秦俊杰邓家佳通天塔腾讯视频6月24日辣目洋子李宏毅我叫刘金凤优酷视频6月24日嘉羿魏笑星河璀璨的我们腾讯视频6月中旬开播的电视剧6月18日李佳航张一铎成果破事精英爱奇艺6权威人士大面积暴雨换其他顶级球场都不行,梅州赛区正升级排水直播吧6月20日讯在接受红星新闻采访时,梅州赛区相关人士表示,目前正在对赛区场地的排水功能进行升级,以保障接下来的比赛顺利进行。正在梅州赛区参加联赛的成都蓉城在前四轮中超联赛中,就河南为啥高烧不退?近日地表最高温度达74。1头号周刊近几日南北方朋友都处于水生火热的局面,北方有高温南方有暴雨,今天讲一讲高温突出的河南,河南热成了可南,郑州热成了蒸州,现在的河南堪称火焰山。河南到底有多热呢?我们来看数字河医院被质疑延误患儿治疗致其去世仅担次要责任!鉴定机构回应近日,邓女士在网上称其出生36天的孩子,被河北医科大学第二医院收治后因无核酸报告延误治疗死亡一事,引发关注。此次事故被鉴定为一级甲等医疗事故,医方承担次要责任。6月17日,南都记者
苹果5G芯片研发失败后,国内巨头传来好消息,外媒库克遇到麻烦众所周知,苹果作为全球数一数二的科技巨头,在自研科技方面是有不少成果的,比如苹果自研的A系列芯片,苹果自研的M系列芯片以及苹果自研的iOS系统等,每一项单拿出来都是很牛的科研成果。杜锋带胡明轩徐杰提前投降!累吐的还是周琦,背锅的还是郭艾伦北京时间6月30日,男篮全新12人大名单正式揭晓,杜锋做出了一个争议重大的决定,把3大嫡系后卫全部都放到了名单当中,用了7个后卫。后卫线上只有郭艾伦,赵继伟,孙铭徽,赵睿,胡明轩,全红婵再次刷屏热搜!最终得分被修正,亲哥哥刷出榜1,全家庆祝北京时间6月29日,2022年布达佩斯游泳世锦赛,全红婵与白钰鸣笑傲混合全能团体决赛,全红婵首次成为世锦赛冠军!此役,全红婵的哥哥与家人们也在关注全红婵的表现。值得一提的是,因为计澳大利亚前外交官警告绝不能误读中国战略,否则灾难将指日可待6月28日,澳大利亚前外交官大卫利文斯通发文称他担忧中国在南海,对澳军复刻珍宝岛或炮击金门事件。他在文章灾难指日可待澳大利亚绝不能误读中国的致命战略中,提醒现在的澳大利亚当局。没有胆小慎入!此片既重口又情色,会让人全程生理不适你永远无法预估电影人的脑洞能有多大。还记得2年前,第一次看到生吃导演那部号称戛纳邪典的钛,厂长的胃和脑袋,分别遭受了一波拳打脚踢。那是颠覆认知,大受震撼,这辈子都忘不掉啊。真的,一总书记为何十年三赴光谷考察?中国光谷因为光得名这里是中国第一根石英光纤诞生地这里是全球最大的光纤光缆研制基地这里是全国第二个国家自主创新示范区6月28日习近平总书记来到湖北武汉考察第一站就来到了光谷这是继20雪中悍刀行十大名剑,大凉龙雀上榜,李淳罡的木马牛排第二位近些年来,雪中悍刀行是我唯一一本能读得下去的网络小说。读完雪中悍刀行,我看到了跟金庸古龙不一样的江湖。在雪中悍刀行琳琅满目的角色中,最出彩的莫过于李淳罡。李淳罡年少时天资绝代,广陵香港珠宝大亨抄底佐丹奴,曾是一代人的潮流,如今疯狂撤店本文来源时代财经作者周嘉宝佐丹奴再一次被人们记起,是因为一则来自香港珠宝大亨郑家纯家族发起的收购要约。佐丹奴旗舰店。时代财经摄近日,香港服装品牌佐丹奴国际(0709。HK)发布公告香港回归当晚惊心动魄!为何在升旗的时候,他要口吞鼻血呢?1997年7月1日香港正式回归祖国的怀抱,香港作为我国的特别行政区,虽然占地面积并不大,但是它是世界上人口密度最高的地区之一,也是全球第三大金融中心,这也是我国中西方文化交流的重要明明是当爷爷的年龄,身材气质却像30岁,这12位男星状态绝了娱乐圈中有许多的不老男神,尽管出道多年,有近似爷爷辈的年龄,但气质仍然出众。他们十分自律,保持着自己的身材。这也帮助了他们的颜值一直保持在良好状态。他们不同于那些刚到中年便发福变得唐山打人事件最新进展被打女子不愿露面的原因曝光,让人心寒唐山打人事件最新进展被打女子不愿露面的原因曝光,让人心寒六月十日,唐山一家烧烤摊殴打女生事件,至今已有19天。唐山的打人案在网络上引起了很大的关注,网络上的网民们对这种破坏社会秩序