范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

神经网络与传统统计方法的简单对比

  传统的统计方法如OLS假设变量之间符合简单的线性关系或者高阶线性关系进行拟合(或函数逼近),然而,并不是所有关系都是简单的线性关系或者高阶线性关系,这时就需要借助神经网络 (neural network,NN)等方法来进行建模。神经网络可以在不需要知道函数关系具体形式的条件下近似各种函数关系。 预测模型1. scikit-learn
  下例使用scikit-learn 库中的 MLPRegressor 类,该类可用 DNN 进行回归估计。DNN 有时也被称为多层感知器(multi-layer perceptron,MLP)。从最终的MSE来看,结果并不完美,但是对一个配置简单的模型来说,效果已经非常不错了。 from sklearn.neural_network import MLPRegressor  # 生成样本数据 def f(x):     return 2 * x ** 2 - x ** 3 / 3 x = np.linspace(-2, 4, 25) y = f(x)  # 实例化 MLPRegressor 对象 model = MLPRegressor(hidden_layer_sizes=3 * [256], learning_rate_init=0.03, max_iter=5000) # 拟合或学习步骤。 model.fit(x.reshape(-1, 1), y) # 预测步骤 y_ = model.predict(x.reshape(-1, 1)) MSE = ((y - y_) ** 2).mean() MSE # Out: # 0.003216321978018745
  样本和预测结果图 plt.figure(figsize=(10, 6)) plt.plot(x, y, "ro", label="sample data") plt.plot(x, y_, lw=3.0, label="dnn estimation") plt.legend();
  样本数据和基于神经网络的预测2. Keras
  下一个示例使用了 Keras 深度学习软件包中的序列模型 Sequential,对该模型每轮进行100次迭代训练,重复5轮。每轮训练之后,我们将更新并绘制由神经网络预测的近似值。如图显示,随着每一轮训练的近似值的准确率逐渐提高,MSE值逐渐降低。与之前的模型相似,最终结果并不完美,但是鉴于模型的简单性,它还是不错的。 import tensorflow as tf tf.random.set_seed(100)  from keras.layers import Dense from keras.models import Sequential  # 实例化 Sequential 模型对象 model = Sequential() # 添加采用整流线性单元(ReLU)激活函数的全连接层作为隐藏层 model.add(Dense(256, activation="relu", input_dim=1)) # 添加线性激活的输出层 model.add(Dense(1, activation="linear")) # 编译模型对象 model.compile(loss="mse", optimizer="rmsprop")  # 原始样本数据图 plt.figure(figsize=(10, 6)) plt.plot(x, y, "ro", label="sample data")  # 迭代训练指定次数 for _ in range(1, 6):     # 训练神经网络     model.fit(x, y, epochs=100, verbose=False)     # 预测近似值     y_ = model.predict(x)     # 计算当前的 MSE     MSE = ((y - y_.flatten()) ** 2).mean()     print(f"round={_} | MSE={MSE:.5f}")     # 绘制当前的近似结果     plt.plot(x, y_, "--", label=f"round={_}") plt.legend(); # Out: # round=1 | MSE=3.87256 # round=2 | MSE=0.92527 # round=3 | MSE=0.28527 # round=4 | MSE=0.13191 # round=5 | MSE=0.09568
  样本数据和多轮训练后得到的预测值
  从以上两个示例来看,相比OLS回归完美的复刻原有方程的系数,神经网络只能提供一个近似的预测,那么为什么还要使用神经网络呢?假设我们的数据不是通过预定义好的数学函数生成的,而是随机产生的特征和标签呢?下面我们再看一个例子,当然该示例仅用于说明,不具有实际意义。 # 随机生成测试数据 np.random.seed(0) x = np.linspace(-1, 1) y = np.random.random(len(x)) * 2 - 1 # 用不同的多次项OLS回归进行拟合 plt.figure(figsize=(10, 6)) plt.plot(x, y, "ro", label="sample data") for deg in [1, 5, 9, 11, 13, 15]:     reg = np.polyfit(x, y, deg=deg)     y_ = np.polyval(reg, x)     MSE = ((y - y_) ** 2).mean()     print(f"deg={deg:2d} | MSE={MSE:.5f}")     plt.plot(x, np.polyval(reg, x), label=f"deg={deg}") plt.legend(); # Out: # deg= 1 | MSE=0.28153 # deg= 5 | MSE=0.27331 # deg= 9 | MSE=0.25442 # deg=11 | MSE=0.23458 # deg=13 | MSE=0.22989 # deg=15 | MSE=0.21672
  随机样本数据和 OLS 回归线
  明显可见,OLS 回归的效果并不理想。OLS回归假设我们可以通过有限个(基于多项式的)基函数的组合来逼近目标函数,由于样本数据集是随机生成的,因此在这种情况下,OLS 回归效果不佳。下面我们用神经网络来试下。 model = Sequential() model.add(Dense(256, activation="relu", input_dim=1)) # 此处添加3个隐藏层 for _ in range(3):     model.add(Dense(256, activation="relu")) model.add(Dense(1, activation="linear")) model.compile(loss="mse", optimizer="rmsprop") # 显示神经网络架构以及可训练参数的数量 model.summary() # Out: # Model: "sequential_1" # _________________________________________________________________ #  Layer (type)                Output Shape              Param #    # ================================================================= #  dense_2 (Dense)             (None, 256)               512        #                                                                   #  dense_3 (Dense)             (None, 256)               65792      #                                                                   #  dense_4 (Dense)             (None, 256)               65792      #                                                                   #  dense_5 (Dense)             (None, 256)               65792      #                                                                   #  dense_6 (Dense)             (None, 1)                 257        #                                                                   # ================================================================= # Total params: 198,145 # Trainable params: 198,145 # Non-trainable params: 0 # _________________________________________________________________ %%time plt.figure(figsize=(10, 6)) plt.plot(x, y, "ro", label="sample data") for _ in range(1, 8):     model.fit(x, y, epochs=500, verbose=False)     y_ =  model.predict(x)     MSE = ((y - y_.flatten()) ** 2).mean()     print(f"round={_} | MSE={MSE:.5f}")     plt.plot(x, y_, "--", label=f"round={_}") plt.legend(); # Out: # round=1 | MSE=0.13428 # round=2 | MSE=0.08515 # round=3 | MSE=0.05811 # round=4 | MSE=0.04389 # round=5 | MSE=0.03376 # round=6 | MSE=0.00722 # round=7 | MSE=0.00644 # CPU times: user 22.8 s, sys: 3.97 s, total: 26.8 s # Wall time: 12.1 s
  随机样本数据和神经网络预测
  尽管预测结果并不完美,但预测结果明显好于OLS。神经网络架构有近200000个可训练的参数(权重),与OLS 回归(最多使用15+1个参数)相比,这提供了相对较高的灵活性。 分类任务
  神经网络也可以很容易地用于分类任务。考虑以下基于 Keras 实现神经网络分类,二元特征数据和二元标签数据是随机生成的。建模方面的主要调整是将输出层的激活函数从linear更改为sigmoid。虽然分类效果并不完美,但是也达到了很高的准确率。 # 创建随机特征数据和标签数据 f = 5 n = 10 np.random.seed(124812) x = np.random.randint(0, 2, (n, f)) y = np.random.randint(0, 2, n) model = Sequential() model.add(Dense(256, activation="relu", input_dim=f)) # 输出层的激活函数为 sigmoid model.add(Dense(1, activation="sigmoid")) # 损失函数为 binary_crossentropy model.compile(loss="binary_crossentropy", optimizer="rmsprop", metrics=["acc"]) model.fit(x, y, epochs=50, verbose=False) y_ = np.where(model.predict(x).flatten() > 0.5, 1, 0) # 预测值与标签数据的比较结果 y == y_ # Out: # array([ True,  True,  True,  True,  True,  True,  True, False,  True, True]) # 绘制每轮训练的损失函数和准确率值 res = pd.DataFrame(model.history.history) res.plot(figsize=(10, 6));
  分类准确率及损失与训练轮数的关系
  由以上示例说明,对比传统统计方法,神经网络的一些基本特征: 问题无关性
  在给定一组特征值的情况下,神经网络方法的性能与需要预测或者分类的具体标签值是无关的。而统计方法(比如OLS 回归)可能对较小的一组问题表现良好,对其他问题则表现不太好或根本没有效果。
  2. 增量学习
  给定一个用来度量成功的目标,神经网络中的最佳权重是基于随机初始化和增量改进而逐步学习得到的。这些增量改进是在考虑预测值和样本标签值之间的差异后,通过神经网络反向传播权重更新来实现的。
  3. 通用函数逼近器
  有严格的数学定理表明神经网络(即使只有一个隐藏层)几乎可以逼近任何函数。

太原人速看!中医讲究阴阳平衡导致阴阳失衡的原因有哪些阴阳平衡阴阳者,天地之道也,万物之纲纪,变化之父母,生杀之本始,神明之府也。治病必求于本。黄帝内经意思就是阴阳是宇宙间的一般规律,是一切事物的纲纪,万物变化的起源,生长毁灭的根本,(体育)短道速滑世界杯多德雷赫特站中国队晋级女子3000米接力决赛当日,在20222023赛季国际滑联短道速滑世界杯荷兰多德雷赫特站女子3000米接力半决赛中,由公俐王欣然徐爱丽臧一泽组成的中国队以4分11秒686的成绩晋级A组决赛。2月11日,皇马酝酿换帅!克洛普图赫尔成热门安帅接掌桑巴军团?据西媒donbalon报道,安切洛蒂将在赛季结束后离任,他将接过桑巴军团的帅印。皇马正在物色安帅的替身,克洛普和图赫尔是两个热门人选。齐达内离任,皇马请回了安切洛蒂,当时安帅与埃弗超额储蓄能否变成超额消费?专家建议可借鉴夜间集市本文来源时代周报作者陈熊海对不少人来说,每个月能赚多少钱是最为关心的话题之一。2022年,全国平均每个人赚了30000多块钱,扣除价格因素,比上年度增加了2。9。赚多少,花多少和存解决医药企业特殊物品出入境痛点深圳17名政协委员提出建议丨关注深圳两会21世纪经济报道记者魏笑深圳报道特殊物品是生物技术和医药产业研发生产的关键性原材料,受政策限制技术壁垒或来源单一等因素影响,大部分依赖进口。但是因特殊物品的进口业务专业性极强,且审太原人速看!开学了!如何将孩子身体调整到最佳状态?儿科专家给出饮食和用药指导我们开学啦新的学期新的起点新的开始开学了!经过一个假期的休息,很多孩子可能都有点不适应开学后规律的生活了。所以我们一定要尽快给孩子调理好身体,让他们尽快的熟悉即将到来的学习生活。去真的,孩子有一个就好别人有咱也有就行了真的,孩子有一个就好。别人有咱也有就行了。不是不爱孩子,反而因为太爱才各种担心患得患失。今天送闺女去幼儿园,她从早上醒来就偷偷抹眼泪,但还是怕你发现似的强忍着,我假装看不见,穿衣洗明宪宗晚年感叹膝下无子,太监扑通跪倒您儿子6岁了,在冷宫里天顺八年也就是公元1464年正月,大名鼎鼎的土木堡战神明英宗朱祁镇38岁,这时的朱祁镇已经奄奄一息,他在病榻之上召见了自己的太子,朱见深向他交代家国大事也把帝国的重任交给了他。几天胡谋宇案谁是截胡的凶手?胡谋宇案是新发生的,和历史好像沾不上边。秀才最近研读历史,注册了几个关于历史的自媒体号。秀才试图以历史的角度给予解读,但发现这是徒劳的。历史上的失踪案,比起胡谋宇失踪案都太简单了,周佛海一生中的三变第三变文熊辉第三变由臭名昭著的大汉奸成了国民党的接收大员随机应变反复无常,可以说是周佛海一生的特征,是他阴险狡诈的本质。在抗战中期,周佛海像一条狗,嗅出日本人不行了。为了寻找出路,他重新狮心王和萨拉丁胜利者和失败者?第三次十字军东征(11871192),主角不仅仅是狮心王理查德和萨拉丁的战斗,其中还有很多其他角色和因素,引起了从古至今各界学者的了解和争论。争论中的第三次十字军东征艾伦默里(Al
直降1000元,三星手机售价大跳水,这四款三星手机可以闭眼买双11购物狂欢节过去之后,有些手机都恢复了原价,但三星手机没有恢复原价,目前仍然降价销售。而作为旗舰机皇的GalaxyS22Ultra降价力度最大,直降1000元。不过作为旗舰机皇乐视手机,你够了不知道机友们还记不记得,今年乐视发了一台iPhone新手机,叫Y1Pro。核心卖点是,499元起,拒绝性能过剩,外观媲美顶配万元机。机哥万万没想到,这系列!居然!还有续集!新款升级进地下停车场就失联?这四款手机,保你信号满满,上网速度快您在阅读前请点击上面的关注二字,后续会第一时间为您提供更多有价值的相关内容,感谢您的支持。经常有人抱怨,自己的手机在进入停车场的时候,就会出现信号下降,甚至无法拨打电话的情况,这个网曝苹果Mac产品新专利,无键键盘设计此前,苹果带来了全新的M2芯片迭代,并推出了基于M2芯片的新Mac系列产品。与此同时,关于苹果旗下Mac产品的消息也开始大量出现在爆料中。最新的消息没有显示更多的新产品信息,却提到20002500元的拍照手机,你看好哪一款?寻找数码点评派随着经济的发展,大家对手机的要求也有了明显的提高。特别是这几年,随着拍摄抖音,西瓜视频的人越来越多,大家对手机拍照和视频录制的效果,要求也是越来越严格要美颜,要清晰,电动汽车暴增!大功率充电桩越来越多,国家电网承受得了吗?最新数据2022年10月我国新能源汽车销量达到71。4万辆,同比增长81。7。同时,2022年110月我国新能源汽车销量为528万辆,同比增长110。0,而渗透率方面更是直达24。联发科天玑1080与天玑1300全面比较和基准测试联发科终于在全球推出了天玑1080。与去年推出的天玑920相比有许多改进。这个特殊的芯片将是最受欢迎的芯片之一。因此,正在与价格相似的移动设备上提供的其他市场替代品进行比较。目前,小米成今年双十一手机销售榜榜魁今年双十一苹果华为小米手机的降价幅度创往年之冠,特别是曾经有肾机之称的苹果,IPHONE14上市不足一月已降到5000元左右,而国内众多厂家的安卓旗舰机型也是低价大甩卖。据公布统计买对才最香!如何在刀法精准的手机厂商忽悠下正确避坑正好双11过了,不用为打广告嫌疑操心,随笔和大家聊聊买手机这事儿。先说我的观点,手机就是消耗品,别指望自己用了个三四年,五六年后,你手中的这个工具依旧霸道。真还传罗永浩华为和苹果说碳酸锂吨价逼近60万元!钠离子电池风起,想要代锂还有几道坎?每经记者朱成祥黄鑫磊每经编辑梁枭新能源汽车销售火热,让动力电池必备原料锂紧俏起来。碳酸锂价格逼近60万元吨大关,富含锂矿的南美三国也欲争夺锂资源定价权,阿根廷智利玻利维亚推动建立锂别纠结了,这个时间点根本就不适合换任何品牌的手机现在,如果你还在纠结自己要换什么手机,那我直接可以劝你放弃了!这是一个老款要优惠没有优惠,要新款还没上市的尴尬时间点。除非你的手机彻底不能用了,否则我建议你再等等。首先各大手机厂商