范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

神经网络与传统统计方法的简单对比

  传统的统计方法如OLS假设变量之间符合简单的线性关系或者高阶线性关系进行拟合(或函数逼近),然而,并不是所有关系都是简单的线性关系或者高阶线性关系,这时就需要借助神经网络 (neural network,NN)等方法来进行建模。神经网络可以在不需要知道函数关系具体形式的条件下近似各种函数关系。 预测模型1. scikit-learn
  下例使用scikit-learn 库中的 MLPRegressor 类,该类可用 DNN 进行回归估计。DNN 有时也被称为多层感知器(multi-layer perceptron,MLP)。从最终的MSE来看,结果并不完美,但是对一个配置简单的模型来说,效果已经非常不错了。 from sklearn.neural_network import MLPRegressor  # 生成样本数据 def f(x):     return 2 * x ** 2 - x ** 3 / 3 x = np.linspace(-2, 4, 25) y = f(x)  # 实例化 MLPRegressor 对象 model = MLPRegressor(hidden_layer_sizes=3 * [256], learning_rate_init=0.03, max_iter=5000) # 拟合或学习步骤。 model.fit(x.reshape(-1, 1), y) # 预测步骤 y_ = model.predict(x.reshape(-1, 1)) MSE = ((y - y_) ** 2).mean() MSE # Out: # 0.003216321978018745
  样本和预测结果图 plt.figure(figsize=(10, 6)) plt.plot(x, y, "ro", label="sample data") plt.plot(x, y_, lw=3.0, label="dnn estimation") plt.legend();
  样本数据和基于神经网络的预测2. Keras
  下一个示例使用了 Keras 深度学习软件包中的序列模型 Sequential,对该模型每轮进行100次迭代训练,重复5轮。每轮训练之后,我们将更新并绘制由神经网络预测的近似值。如图显示,随着每一轮训练的近似值的准确率逐渐提高,MSE值逐渐降低。与之前的模型相似,最终结果并不完美,但是鉴于模型的简单性,它还是不错的。 import tensorflow as tf tf.random.set_seed(100)  from keras.layers import Dense from keras.models import Sequential  # 实例化 Sequential 模型对象 model = Sequential() # 添加采用整流线性单元(ReLU)激活函数的全连接层作为隐藏层 model.add(Dense(256, activation="relu", input_dim=1)) # 添加线性激活的输出层 model.add(Dense(1, activation="linear")) # 编译模型对象 model.compile(loss="mse", optimizer="rmsprop")  # 原始样本数据图 plt.figure(figsize=(10, 6)) plt.plot(x, y, "ro", label="sample data")  # 迭代训练指定次数 for _ in range(1, 6):     # 训练神经网络     model.fit(x, y, epochs=100, verbose=False)     # 预测近似值     y_ = model.predict(x)     # 计算当前的 MSE     MSE = ((y - y_.flatten()) ** 2).mean()     print(f"round={_} | MSE={MSE:.5f}")     # 绘制当前的近似结果     plt.plot(x, y_, "--", label=f"round={_}") plt.legend(); # Out: # round=1 | MSE=3.87256 # round=2 | MSE=0.92527 # round=3 | MSE=0.28527 # round=4 | MSE=0.13191 # round=5 | MSE=0.09568
  样本数据和多轮训练后得到的预测值
  从以上两个示例来看,相比OLS回归完美的复刻原有方程的系数,神经网络只能提供一个近似的预测,那么为什么还要使用神经网络呢?假设我们的数据不是通过预定义好的数学函数生成的,而是随机产生的特征和标签呢?下面我们再看一个例子,当然该示例仅用于说明,不具有实际意义。 # 随机生成测试数据 np.random.seed(0) x = np.linspace(-1, 1) y = np.random.random(len(x)) * 2 - 1 # 用不同的多次项OLS回归进行拟合 plt.figure(figsize=(10, 6)) plt.plot(x, y, "ro", label="sample data") for deg in [1, 5, 9, 11, 13, 15]:     reg = np.polyfit(x, y, deg=deg)     y_ = np.polyval(reg, x)     MSE = ((y - y_) ** 2).mean()     print(f"deg={deg:2d} | MSE={MSE:.5f}")     plt.plot(x, np.polyval(reg, x), label=f"deg={deg}") plt.legend(); # Out: # deg= 1 | MSE=0.28153 # deg= 5 | MSE=0.27331 # deg= 9 | MSE=0.25442 # deg=11 | MSE=0.23458 # deg=13 | MSE=0.22989 # deg=15 | MSE=0.21672
  随机样本数据和 OLS 回归线
  明显可见,OLS 回归的效果并不理想。OLS回归假设我们可以通过有限个(基于多项式的)基函数的组合来逼近目标函数,由于样本数据集是随机生成的,因此在这种情况下,OLS 回归效果不佳。下面我们用神经网络来试下。 model = Sequential() model.add(Dense(256, activation="relu", input_dim=1)) # 此处添加3个隐藏层 for _ in range(3):     model.add(Dense(256, activation="relu")) model.add(Dense(1, activation="linear")) model.compile(loss="mse", optimizer="rmsprop") # 显示神经网络架构以及可训练参数的数量 model.summary() # Out: # Model: "sequential_1" # _________________________________________________________________ #  Layer (type)                Output Shape              Param #    # ================================================================= #  dense_2 (Dense)             (None, 256)               512        #                                                                   #  dense_3 (Dense)             (None, 256)               65792      #                                                                   #  dense_4 (Dense)             (None, 256)               65792      #                                                                   #  dense_5 (Dense)             (None, 256)               65792      #                                                                   #  dense_6 (Dense)             (None, 1)                 257        #                                                                   # ================================================================= # Total params: 198,145 # Trainable params: 198,145 # Non-trainable params: 0 # _________________________________________________________________ %%time plt.figure(figsize=(10, 6)) plt.plot(x, y, "ro", label="sample data") for _ in range(1, 8):     model.fit(x, y, epochs=500, verbose=False)     y_ =  model.predict(x)     MSE = ((y - y_.flatten()) ** 2).mean()     print(f"round={_} | MSE={MSE:.5f}")     plt.plot(x, y_, "--", label=f"round={_}") plt.legend(); # Out: # round=1 | MSE=0.13428 # round=2 | MSE=0.08515 # round=3 | MSE=0.05811 # round=4 | MSE=0.04389 # round=5 | MSE=0.03376 # round=6 | MSE=0.00722 # round=7 | MSE=0.00644 # CPU times: user 22.8 s, sys: 3.97 s, total: 26.8 s # Wall time: 12.1 s
  随机样本数据和神经网络预测
  尽管预测结果并不完美,但预测结果明显好于OLS。神经网络架构有近200000个可训练的参数(权重),与OLS 回归(最多使用15+1个参数)相比,这提供了相对较高的灵活性。 分类任务
  神经网络也可以很容易地用于分类任务。考虑以下基于 Keras 实现神经网络分类,二元特征数据和二元标签数据是随机生成的。建模方面的主要调整是将输出层的激活函数从linear更改为sigmoid。虽然分类效果并不完美,但是也达到了很高的准确率。 # 创建随机特征数据和标签数据 f = 5 n = 10 np.random.seed(124812) x = np.random.randint(0, 2, (n, f)) y = np.random.randint(0, 2, n) model = Sequential() model.add(Dense(256, activation="relu", input_dim=f)) # 输出层的激活函数为 sigmoid model.add(Dense(1, activation="sigmoid")) # 损失函数为 binary_crossentropy model.compile(loss="binary_crossentropy", optimizer="rmsprop", metrics=["acc"]) model.fit(x, y, epochs=50, verbose=False) y_ = np.where(model.predict(x).flatten() > 0.5, 1, 0) # 预测值与标签数据的比较结果 y == y_ # Out: # array([ True,  True,  True,  True,  True,  True,  True, False,  True, True]) # 绘制每轮训练的损失函数和准确率值 res = pd.DataFrame(model.history.history) res.plot(figsize=(10, 6));
  分类准确率及损失与训练轮数的关系
  由以上示例说明,对比传统统计方法,神经网络的一些基本特征: 问题无关性
  在给定一组特征值的情况下,神经网络方法的性能与需要预测或者分类的具体标签值是无关的。而统计方法(比如OLS 回归)可能对较小的一组问题表现良好,对其他问题则表现不太好或根本没有效果。
  2. 增量学习
  给定一个用来度量成功的目标,神经网络中的最佳权重是基于随机初始化和增量改进而逐步学习得到的。这些增量改进是在考虑预测值和样本标签值之间的差异后,通过神经网络反向传播权重更新来实现的。
  3. 通用函数逼近器
  有严格的数学定理表明神经网络(即使只有一个隐藏层)几乎可以逼近任何函数。

5G赋能青海移动互联网流量增速全国第一图为中国电信(国家)数字青海绿色大数据平台。(资料图)李隽摄中新网西宁10月4日电(李隽侯尚斌)4日,记者从青海省通信管理局获悉,1至8月,青海省移动互联网累计流量达11。12亿G开国上将许世友80岁病逝,邓小平为何不准办追悼会,不准立碑呢?在阅读此文之前,麻烦您点击一下关注,既方便您进行讨论和分享,又能给您带来不一样的参与感,感谢您的支持!在河南省信阳市的一个半山腰处,有五棵粗壮的松树将自己的枝干蜿蜒地伸向同一个地方中创新航港交所上市市值662亿港元小米与红杉是股东雷递网雷建平10月6日中创新航科技股份有限公司(简称中创新航,股票代码03931)今日在港交所上市。中创新航发行价为38港元,募资净额为98。64亿港元。中创新航与天齐锂业香港有限来袭!足球赛事情报参考1。巴甲球场遭破坏,福塔莱萨损失惨重!福塔莱萨在上个主场对阵弗拉门戈的比赛中,赛后福塔莱萨的主场被发现有多达134个座位都遭到了球迷的破坏。而且被破坏的区域遍布球场各个区域。福塔莱都是6。7英寸大屏,iPhone14Plus和iPhone14ProMax怎么选?细心的朋友可能会发现,今年的iPhone14系列砍掉了mini版本,反而增加了一款iPhone14Plus,它采用了6。7英寸屏幕,而iPhone14ProMax同样采用6。7英寸挤牙膏让iPhone14吃到苦头?9月8日的苹果发布会已经落下帷幕,紧随其后的iPhone14系列发售,则是对苹果新品竞争力的首次大考。和之前的猜测不同,iPhone14系列中,iPhone14Pro销量占比最高,张本零封日本3比0巴西,挺进世乒赛八强,中国台北女团将战新加坡北京时间10月5日消息,2022年世界乒乓球团体锦标赛在成都进入到第六日。男团18决赛,户上隼辅以3比1战胜雨果卡尔德拉诺,张本智和及川瑞基分别战胜各自对手,日本队以3比0战胜巴西2022年换手机首选这三款,性能出色价格良心,入手至少能用三五年您在阅读前请点击上面的关注二字,后续会第一时间为您提供更多有价值的相关内容,感谢您的支持。如果你最近有更换手机的想法,不妨考虑一下这三款机型,拥有超高的市场好评率,不但性能出色,关UR2022秋季新品合集,外套,连衣裙,不入后悔系列每到换季,衣橱里总是觉得缺这个少那个我想静静于是乎,总是在买买买的路上狗头狗头今年UR秋季出的新品着实长在了我的审美上,小香风外套,连衣裙,长裙等等我买的这几件算是比较百搭的,随我荣耀X40GT爆料,主打性能表现,网友骁龙888感觉有点开玩笑荣耀被华为出售后,经历过一段低谷的时期,不过在完成产业链整合后,荣耀爆发出了强大的实力,在中国国内的市场突飞猛进,从今年相关机构公布的市场数据来看,荣耀登顶国内市场销量榜首的位置很想换新机却预算有限?来看看这3款真香手机,总有一款适合你每到特殊节假日,总会涌现出一批高性价比的真香手机,配置和性能都很强悍,这也使得预算有限但有换机想法的人,拥有了更多的选择。但手机如今毕竟的刚需产品,选择起来难免会有所纠结,而目前安
大学教师收入高吗?看教师现身说法,你羡慕不羡慕?一提到教师的收入,大家的第一印象就是不怎么样,因为网络上关于教师收入问题的帖子很多。而这些帖子大多是抱怨教师工资低的。这都是以前的老黄历了,现在大部分教师的收入都有了一定程度的提高又有券商申请基金托管牌照!年内已有5家申请,排队大军增至8家,为啥这么火?近日,证监会信息显示,渤海证券申请基金托管人资格材料已获证监会接收。渤海证券成为继东吴证券东北证券东兴证券湘财证券之后,年内第5家申请基金托管资格的券商。截至目前,排队申请基金托管市场监管总局发布食品生产许可审查新规为严格落实四个最严要求,贯彻党中央国务院放管服证照分离改革决策部署,加强食品安全监督管理,规范食品生产许可审查工作,依据中华人民共和国食品安全法及其实施条例食品生产许可管理办法等法关注丨政策利好零售和生物医药行业图片来源新华社中国经济时报记者周雪松党的二十大报告提出,促进中医药传承创新发展。专家在接受中国经济时报记者采访时表示,未来五年,进一步挖掘内需潜力,提升消费在拉动经济增长中的作用将投资中国34年!全球投资大鳄为何如此坚定?还要给孩子留大量中国股票,背后有何原因?以上音频技术来自讯飞配音投资小红书第114期过近日,量子基金前合伙人吉姆罗杰斯在接受澎湃新闻采访时表示,过去40年中,没有一个国家能像中国一样发展得如此迅速如此强劲如此稳健,他将给募资183亿元,投后估值超千亿广汽埃安完成A轮融资引战21世纪经济报道记者宋豆豆广州报道10月20日晚,广汽集团(601238。SH,02238。HK)发布公告称,其子公司广汽埃安在广州产权交易所公开挂牌,实施增资扩股,完成A轮融资引炎热的一天苏联红军眼中的巴巴罗萨行动首日(下)更多硬核,有趣,好玩的文章和资讯,请点击上方芬里尔战史研究关注获取!时间来到了1941年6月22日当天第9混编航空师师部通信连电话班班长弗谢沃洛德奥林皮耶夫(VsevolodOli原创王二妮冒死给八路运硫磺(1)1938年5月,日军土肥原十四师团攻占菏泽,侵入定陶,进逼陇海路,鲁西南全境沦陷。那是多么艰难的日子啊!溃兵土匪如麻,谣言四起,人心惶惶,不可终日!在这疾风暴雨的日子里,何处是前行1947年,仅仅因为一张电影票,国民党警察和宪兵在上海街头火拼国民党部队中分成三六九等,相信大家早有耳闻。其中地位最高,最嚣张的无疑就是空军和宪兵了。空军自然不用说,宪兵为啥待遇这么高?国民党宪兵和警察01hr很简单,宪兵算是蒋介石最信任的部特拉斯45天还不是最短,欧洲历史上最短任期的领导人都有谁?此前,英国保守党政治家乔治坎宁(GeorgeCanning)一直保持着英国最短任职首相的纪录。坎宁在1827年8月8日死于肺结核之前共任职了119天。坎宁在他那个时代担任过许多高级海安县第一任县长文武兼备的李俊民说到紫石县第一任县长李俊民,必须先交代一下紫石县。紫石县乃是1943年为纪念民主爱国人士韩国均(字紫石),由东台泰县如皋三县析置,治所在海安镇(今天的海安县城)。紫石县是我党领导下