范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

如何评估机器学习模型的商业价值

  作者:amitvkulkarni
  CDA数据分析师编译 概述
  对于任何评估来说,最难的是保持简单易操作,在数据科学中也是如此。在任何数据科学项目中,细化数据、微调模型、部署它们的迭代过程都是一个持续的过程。随着工具、算法的进步,以及随着 MLOps 的出现,事情变得容易了很多,而且未来也会继续发展——技术会优化自己。
  业务方面呢?说服客户相信使用先进工具和技术构建的复杂模型的预测能力有多容易?客户是否愿意为项目提供资金并信任我们模型的建议?好吧,不妨试着解释模型的 ROC 曲线,试着用特异性和敏感性指标来说服客户——你会看到的只是眼球在滚动。
  但是,如果我们能够在没有复杂指标和技术术语的情况下回答业务问题呢?那么,我们就可能有机会从业务部门那里获得支持。在本文中,我们将看到一个用例,在该用例中,我们仍将构建我们的模型,但以不同的方式对其进行解释——业务方式。
  使用 ML 模型提取商业价值的方法
  在这篇博客中,我们将探索十分位数的使用,了解各种评估图,如累积增益图和提升图等,以评估 ML 模型的商业价值。该方法将帮助我们解释 ML 模型的预测能力,并使解释模型结果变得很简单。这些图表和指标将使企业能够更有信心地做出明智的决策。
  我们将在本文中探索以下主题。数据探索 数据处理 建立模型 生成十分位数和报告 模型对比 业务场景 结论 入门
  我们将使用来自 UCI 机器学习存储库的公开可用的银行数据 集, zip 文件中有四个数据集,但我们感兴趣的是*bank-additional-full.csv。*所有的属性信息都可以在上面的 URL 中找到。数据来自直接营销电话联系客户,以评估客户是否有兴趣订阅银行定期存款。如果订阅,则为 Yes,否则为 No。本文讨论的是如何评估 ML 模型的商业价值。数据加载和处理:
  让我们加载数据并查看一下以便更好的理解数据。import wget import zipfile import pandas as pd import numpy as np url = "https://archive.ics.uci.edu/ml/machine-learning-databases/00222/bank-additional.zip" wget.download(url)  zf = zipfile.ZipFile("bank-additional.zip") df= pd.read_csv(zf.open("bank-additional/bank-additional-full.csv"), sep=";")
  我们可以进行完整的EDA/特征工程/选择重要变量然后构建模型,但为了简单起见,我们将选择很少的变量进行模型构建。df= df[["y", "duration", "campaign", "pdays", "previous", "euribor3m"]]
  此外,还需要更进一步地探索数据,将目标变量转换为分类变量并对其进行编码。df.y[df.y == "yes"] = "term deposit" df.y = pd.Categorical(df.y) df["y"] = df.y.cat.codes df.info() 输出:RangeIndex: 41188 entries, 0 to 41187  Data columns (total 6 columns):  # Column Non-Null Count Dtype  — —— ————– —–  0 y 41188 non-null int8  1 duration 41188 non-null int64  2 campaign 41188 non-null int64  3 pdays 41188 non-null int64  4 previous 41188 non-null int64  5 euribor3m 41188 non-null float64  dtypes: float64(1), int64(4), int8(1)  memory usage: 1.6 MB df.head()  y duration campaign pdays previous euribor3m  0 261  1  999 0  4.857  0 149  1  999 0  4.857  0 226  1  999 0  4.857  0 151  1  999 0  4.857  0 307  1  999 0  4.857 df.describe()  y duration campaign pdays previous euribor3m count 41188.000000 41188.000000 41188.000000 41188.000000 41188.000000 41188.000000 mean 0.112654 258.285010 2.567593 962.475454 0.172963 3.621291 std 0.316173 259.279249 2.770014 186.910907 0.494901 1.734447 min 0.000000 0.000000 1.000000 0.000000 0.000000 0.634000 25% 0.000000 102.000000 1.000000 999.000000 0.000000 1.344000 50% 0.000000 180.000000 2.000000 999.000000 0.000000 4.857000 75% 0.000000 319.000000 3.000000 999.000000 0.000000 4.961000 max 1.000000 4918.000000 56.000000 999.000000 7.000000 5.045000
  模型构建以提取商业价值 逻辑回归
  Step1: 定义自变量和目标变量y = df.y X = df.drop("y", axis = 1)
  Step2: 将数据集拆分为训练集和测试集,其中测试大小为整个数据集的 20%X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.2, random_state = 2021)
  Step3: 建立逻辑回归模型from sklearn.model_selection import train_test_split  from sklearn.linear_model import LogisticRegression  # Logistic regression model  clf_glm = LogisticRegression(multi_class = "multinomial", solver = "newton-cg").fit(X_train, y_train)  prob_glm = clf_glm.predict_proba(X_test)  max_prob_glm = round(pd.DataFrame(np.amax(prob_glm, axis=1), columns = ["prob_glm"]),2)
  至此,我们已经建立了模型,并在测试数据上对其进行了评分(预测),这为我们提供了每个观察结果的预测概率。
  生成十分位数
  简单地说,十分位数把数据进行分箱。所以,我们将所有预测的概率分成十组,并对它们进行排名,这意味着最高的预测概率将在十分之一,最低的设置将在十分之一。我们将使用pandas的 cut() 函数拆分数据。
  下面的代码行创建一个名为Decile_rank_glm的新列, 它保存每个预测记录的排名。max_prob_glm["Decile_rank_glm"] = pd.cut(max_prob_glm["prob_glm"], 10, labels = np.arange(10,0, -1))      prob_glm Decile_rank_glm 0 0.99 1 1 0.59 9 2 0.96 1 3 0.83 4 4 0.85 4 ... ... ... 8233 0.98 1 8234 0.98 1 8235 0.99 1 8236 0.99 1 8237 0.93 2
  注: 0.99 的概率为 1,0.93 为 2,0.85 为 4,0.59 为 9。我们将在后面的部分中看到此结果的可视化。
  模型评估以提取商业价值
  我们构建的任何模型都必须与基线模型进行比较,以评估模型的性能。让我们在下面进一步探讨这一点。随机模型 :基线模型将是一个随机模型,这意味着它与抛硬币一样好,这意味着有 50% 的概率客户的电话是正确的或者客户购买我们的产品。我们的逻辑回归模型的性能显然应该比这更好。向导模型 :这是另一个极端模型,它的预测是完美的,这意味着它几乎以 100% 的准确度进行预测。此模型不应用于生产或任何业务决策,因为很可能会过度拟合。逻辑回归 :我们的模型应该介于这两个极端模型之间,这使我们有足够的信心做出业务决策。
  我们将在累积增益图中可视化上述模型。展现逻辑回归的性能。kds.metrics.plot_cumulative_gain(y_test.to_numpy(), prob_glm[:,1])
  累积增益图 | 商业价值机器学习模型
  到目前为止看起来不错,图在预期线上,逻辑回归模型介于我们讨论的两个极端模型之间。
  累积增益图的见解:如果我们只能选择 前 20% (十分位数 1 和十分位数 2),那么我们就可以覆盖**近 80%**的目标类别。由于这是一个累积图,我们看到**曲线在十分位数 5 之后变平,**这意味着十分位数 6 到 10 要么有最少的记录,要么没有。 向导模型 在十分位数 2 的位置 达到了100% 标记 ——我们已经知道这是一个理想模型,仅供参考。如果我们的模型开始接近或者类似于这两个极端模型中的任何一个,那么需要检查我们的模型。
  到目前为止,我们已经讨论了模型、十分位数及其性能比较。让我们在十分位数级别上进一步探讨这一点,以更清楚地了解发生了什么以及我们如何更好地解释这个过程。我们将在视觉效果的帮助下进行分析,这使它变得更加容易。kds 包有一个非常好的功能,可以在一行代码中生成所有指标报告。kds.metrics.report(y_test, prob_glm[:,1])
  metrics report | Business value ML model
  让我们了解这些情节中的每一个。需要注意的是,所有图的 x 轴都是十分位数。提升图(Lift Plot) :这个图向我们展示了逻辑回归模型与随机模型相比到底有多好。例如:十分位数 2 给了我们几乎 4 倍的提升,这意味着我们可以比随机模型方法做得好 4 倍。当我们进入更高的十分位数时,升力下降并最终满足随机模型线,这是因为所有更高的概率分数值都在我们已经在累积增益图中看到的最高十分位数(1 到 3)中。因此,底部十分位数的概率较低且几乎与随机模型相同。十分位数提升图(Decile-wise Lift Plot) :该图向我们展示了每个十分位数中目标类观察的百分比,我们观察到十分位数 1 具有最大值,随着x轴数值的延伸,十分位数百分比下降,在某个点之后它甚至低于随机模型线。这是因为随机模型具有随机设置的均匀分布的观测值,而我们的模型在较高的十分位数中预测的观测值较少。累积增益图(Cumulative Gain Plot) :在以前的部分中讨论过这个问题,还研究了对图的解释。KS 统计图(KS Statistic Plot) :KS 图评估不同的分布,即事件和非事件,KS 值是分布之间差异最大的点。简而言之,它有助于我们理解 ML 模型区分两个事件的能力。KS 分数大于 40,如果它恰好在前 3 个十分位数中,那么它被认为是好的。在我们的例子中,我们从图中得到了 68.932 和十分位数 3 的分数。
  让我们用随机森林再构建一个模型,看看结果如何。clf_rf = RandomForestClassifier().fit(X_train, y_train) prob_rf = clf_rf.predict_proba(X_test) max_prob_rf = pd.DataFrame(np.amax(prob_rf, axis=1), columns = ["prob_rf"]) max_prob_rf["Decile_rank_rf"] = pd.cut(max_prob_rf["prob_rf"], 10, labels = np.arange(10,0, -1)) kds.metrics.plot_cumulative_gain(y_test.to_numpy(), prob_rf[:,1]) kds.metrics.report(y_test, prob_rf[:,1])
  img
  观察:随机森林模型略好于逻辑回归模型。 十分位数 2 的提升略高,KS 统计数据为 72.18,而logistic统计数据为 68.93
  业务场景
  建议控制:在某些情况下,客户有业务需求,即应始终生成最少 X 条建议。在这种情况下,我们可以通过考虑前 3 个十分位数而不是 2 个十分位数来获得更大的建议,并且还可以对其他记录进行精细控制。
  衡量市场反应:推荐后分析和市场反应很容易衡量。例如,从前一点,我们可以单独跟踪来自十分位数 3 的所有额外推荐的表现。来自十分位数 3 的额外推送是否产生了任何影响(正面或负面)?
  优化营销支出:通过关注前 20-30% 的人群,企业可以节省时间、资源和金钱。以避免这些时间、资源和金钱会花费在无响应者或定位错误客户上。
  结语
  技术有其一席之地,企业也有发言权。归根结底,这一切都与技术带来的商业价值有关。当这些收益用商业术语来解释时,它总是会更有效。它不仅有助于从业务中获得信心,而且还开辟了新的探索机会。
  请注意,我们构建了两个分类模型,但没有研究我们通常为此类模型所做的 ROC 曲线、混淆矩阵、精度、召回率和其他标准指标。强烈建议跟踪和测量这些指标以评估模型的性能,然后遵循此文中的十分位数方法。根据目标受众和目标,使用最适合目标的方法。

京东自营入驻很简单吗?京东自营开店流程步骤详情本文解决的问题京东自营入驻很简单吗?京东自营店铺类型京东自营入驻条件京东自营开店流程步骤详情京东自营流量这么大,如何入驻?京东自营供应商入驻的基础前提条件是什么?想要成为京东自营供东风快递全球范围内使命必达,不支持无理由退换货和拒签最近快递梗火了!作为可爱的火箭军小姐姐怎么能错过这个梗呢?虽然只是简简单单的一个小娱乐,但坚定的语气让我们感到安全感十足!如此普通的小姐姐却让我们倍感亲切,虽然是素颜,但小编觉得她QM报告手机市场一年大起大落,谁是赢家?曾几何时,作为全球第二大手机厂商的华为,在5G手机销量方面一度超越三星稳坐第一。但很快由于芯片限制,麒麟绝唱后的华为手机业务开始收缩,随之带来整个国内智能终端市场的大洗牌。对此,Q淘宝方面正式启用全新slogen,此前曾被曝光日前,淘宝APP正式启用新slogen太好逛了吧。而此前早在今年6月就曾有消息称,手机淘宝APP开屏页面曾展示过太好逛了吧这一slogan。事实上,淘宝方面曾多次更换slogen,iPhone信号弱问题将解决新技术支持没有4G5G也能发消息打电话大家好,又见面了我是每天分享数码一线资讯和专注二手数码回收的换换君最新消息,据分析师郭明錤称,iPhone13将支持低地球轨道(LEO)卫星通信连接,允许用户在没有4G或5G覆盖的工信部一纸限令,无线充电产业影响几何?每年iPhone新机上市前都会有大量预测和爆料,今年的iPhone13也不例外,一个讨论的焦点是iPhone13会不会取消Lightning充电接口,其实这一讨论从iPhone115000mAh大电池骁龙870双模5G,跌至1599元,有3点主要优势今天我们来聊一款跌至千元机的5G手机,这款手机就是摩托罗拉edges,6GB128GB版发布价是1999元,是一款发布价在2000元档位的智能手机,现在已经跌至1599元价位了,这多维度对比华硕灵耀14s联想YOGA14s,谁才是轻薄本换新首选?如今正值开学季,每年这个时候笔记本市场都会迎来一波换新热潮,而在今年,华硕灵耀14s联想YOGA14s两款可以说是今年暑期最受欢迎的两款轻薄笔记本,价格配置不相上下,不少人也都在这USB摄像机和SDI摄像机哪个比较好?凯茉锐摄像机是一种可以把光学图像信号转变为电信号,以便于存储或者传输的视频硬件设备。光电信号很微弱,需通过预放电路进行放大,再经过各种电路进行处理和调整,最后得到的标准信号可以送到录像机波多星电视盒子Y1,良心好用机顶盒,自测很好用的机顶盒我很久以前就买了这个波多星Y1互联网电视盒子,使用之后觉得非常的不错,所以我今天就给大家介绍一下这一款电视盒子。他们家的电视盒子最重要的一点就是没有广告,因此每次看电视剧,都可以节iPadmini6升级预测,去掉home,增大屏幕,只为取代iPad2021请点击关注,获取更多数码资讯要问我2021年苹果秋季发布会最期待什么产品,不是iPhone13也不是M1X的MacBook更不是AppleWatch7,而是iPadmini6。我一
贝索斯盖茨也入局电动车了?KoBoldMetals公司将于格陵兰岛寻找电动汽车金属智通财经APP获悉,由杰夫贝索斯(JeffBezos)和比尔盖茨(BillGates)等亿万富翁支持的矿产勘探公司KoBoldMetals与伦敦上市公司BluejayMining签智能手环里的变形金刚它既是智能手环,更是腕上蓝牙耳机很多朋友对于智能手环,有一个比较特殊的需求,就是既要能支持蓝牙通话,又要能当蓝牙耳机。放在手腕上,是智能手环,但是想听歌想接电话的时候,又可以秒变成蓝牙耳机,塞在耳朵上。这款手环就体验堪比苹果iCloud钥匙串!国产手机密码本功能安全又实用如今,很多网站App都会要求用户登录才能浏览某些信息,然而牢记帐户名密码等信息并不是一件容易的事。为此,苹果在iOS系统上推出了iCloud钥匙串功能,通过这个功能,用户的帐户名,Ionic实战基于AngularJS的移动混合应用开发Ionic实战作者美JeremyWilken(杰里米威尔肯斯)内容简介Ionic是近几年很火的一项跨平台开发技术。Ionic最大的亮点是集成了Angular和Cordova,对于有对盖茨马斯克和贝佐斯而言,花100万美元就像花1美元亚太日报Shannon你有没有想过,如果你有非常多的钱,可以像平常掏出一美元买糖那样,轻松地就花掉几千,甚至几百万美元,那将会是什么样子?也许,这就是成为比尔盖茨的感觉吧。他的净资88购物节第5年沃尔玛在京东到家创下销售新峰值沃尔玛全渠道88购物节迎来第5年,也是沃尔玛上线达达集团旗下平台京东到家五周年。8月8日是88购物节峰值日,沃尔玛在京东到家平台上的销售额再次刷新单日新高,销售取得突破性增长。今年360借条App恢复上架官方回应整改方案已通过验收财经网科技8月9日讯,据新浪科技消息,今日,360借条App在华为应用市场已恢复上架,用户已可正常下载使用。360借条是360数科旗下产品,此前有媒体报道称,360借条因整改不到位送三天回放,24小时无线智能监控,小米室外摄像机看家真不错随着大家安全意识的提高,监控摄像头已经走向家庭,在家用场景下摄像头的主要作用是为了在窃贼进入家中时,用监控以便于留下证据为后续交给警察破案使用。只要家中有网络,找一处合适的位置用螺高端旗舰还得看华为,华为P60Pro渲染图曝光,清一色的高端配置当前智能手机市场可以说已经达到了一个非常饱和的状态,无论哪种类型价位设计层次的手机都有,可上升的空间也是微乎其微。因此不少厂商开始堆参数,从机身背面的设计下手,例如有辨识度的相机模Windows11再惹众怒!网友微软就是在逼我买新电脑微软推出Windows这次更新,让用户产生非常大的抵触情绪。自从微软官宣了windows11之后,随后来的不是期待和支持,而是大家纷纷抱怨更新之后对电脑硬件要求太高了。一硬件门槛引2000以内,七夕最适合送男女朋友的礼物推荐,你最喜欢哪个?一年一度的七夕马上就要到咯!距离八月14号很多小伙伴纷纷都挑起送对象的礼物啦,不过挑礼物确实是一件头疼的事情,这里小编整理了一些热门的礼物推荐嗷Switch游戏机个人感觉比较受大部