真好用!数据处理-将一组数据归一化到任意区间范围的方法

真好用!数据处理-将一组数据归一化到任意区间范围的方法

将数据归一化到任意区间范围的方法

一般常见的数据归一化,是归一化到0~1,或者-1~1的区间,但在一些特殊场合下,我们需要根据实际情况归一化到其他任意区间。

 将数据归一化到[a,b]区间范围的方法

如一组数据实际最小值为70,最大值为99,要将这组数据归一化到80-95区间。

(1)首先找到样本数据Y的最小值Min    70及最大值Max   99

(2)计算系数为:k=(b-a)/(Max-Min)   K=(95-80)/(99-70)       b=95   a=80

(3)得到归一化到[a,b]区间的数据:norY=a+k(Y-Min)

原始数据70,转化后的值=a+k(Y-Min)

原始数据85,转化后的值=a+k(Y-Min)

在excel里可以通过公式批量规一化数据到某一区间范围。


更好用的方法:将一组成绩转换到82-99之间 a=82  b=99

一组数据在50.4-95.89之间,即Min=50.4  Max=95.89

实际数Y=85.67

k=(b-a)/(Max-Min)=(99-82)/(95.89-50.4 )=17/(95.89-50.4 )

转换后的数 norY=a+k(Y-Min)=82+k*(85.67-50.4)=82+17/(95.89-50.4 )*(85.67-50.4)=95.2

125jz网原创文章。发布者:江山如画,转载请注明出处:http://www.125jz.com/12109.html

(0)
江山如画的头像江山如画管理团队
人工智能行业人才配置与供需情况分析,人工智能发展对职业院校人才培养“转型”的启示!
上一篇 2023年7月2日 下午12:00
简!修改Jupyter 默认打开目录的方法
下一篇 2023年7月19日 上午9:50

99%的人还看了以下文章

  • 少儿编程现状,为什么做了半年多少儿编程,我决定放弃?

    少儿编程现状,为什么做了半年多少儿编程,我决定放弃?少儿编程现状,为什么做了半年多少儿编程,我决定放弃?少儿编程现状,为什么做了半年多少儿编程,我决定放弃?少儿编程现状,为什么做了半年多少儿编程,我决定放弃?

    少儿编程教育目前整体还处在市场培育的阶段,当然各个城市发展节奏不一样,在这个阶段进入会具备一定的先发优势,但也要承受教育市场的责任,面临较大的不确定性,如果本身实力较弱或者经济压力较大、机会成本较高,很可能会在中途就放弃。

    2018年11月12日 科技
    16.6K0
  • 什么是批标准化 (Batch Normalization)

    Batch Normalization, 批标准化, 和普通的数据标准化类似, 是将分散的数据统一的一种做法。 训练更深层的神经网络一直是深度学习中提高模型性能的重要手段之一。 批规范化操作,不仅加快了模型收敛速度,而且更重要的是在一定程度缓解了深层网络的一个难题“梯度弥散”,从而使得训练深层网络模型更加容易和稳定。另外,批规范化操作不光适用于深层…

    2022年9月22日
    6.7K0
  • 同事加班1天,你只需10秒!ChatExcel让多表处理快如闪电⚡

    同事加班1天,你只需10秒!ChatExcel让多表处理快如闪电⚡同事加班1天,你只需10秒!ChatExcel让多表处理快如闪电⚡同事加班1天,你只需10秒!ChatExcel让多表处理快如闪电⚡同事加班1天,你只需10秒!ChatExcel让多表处理快如闪电⚡

    只需10秒,就可以完成多表同时处理,多表合并、多表拆分、多表对比、多表分析、多表创建,都可以轻松完成!超大数据,也可轻松搞定。 官网登录地址:chatexcel.com  目前是beta版,进入工作台后,可以尝试10个表/Sheet,后续会逐步开放到 100 个表/Sheet,1024MB大小文件。 01 多表处理 批量处理100张表格,同事用了1天,现在的…

    2025年4月2日 科技
    1.1K0
  • 高等学校乡村振兴科技创新行动计划(2018—2022年)

    实施乡村振兴战略,是党中央做出的重大决策部署,是决胜全面建成小康社会、全面建设社会主义现代化国家的重大历史任务,是新时代“三农”工作的总抓手。为深入贯彻党的十九大精神和全国教育大会精神,落实《中共中央国务院关于实施乡村振兴战略的意见》和《乡村振兴战略规划(2018—2022年)》,推动高校深入服务乡村振兴战略实施,特制定本行动计划。 一、总体要求 (一)指导…

    2019年3月11日
    4.4K0
  • NTFS文件系统的主要特征和优点,NTFS与FAT比较哪个好?

    NTFS是随着Windows NT操作系统而产生的,并随着WindowsNT4跨入主力分区格式的行列,它的优点是安全性和稳定性极其出色,在使用中不易产生产生文件碎片,NTFS分区对用户权限作出了非常严格的限制,每个用户都只能按着系统赋予的权限进行操作,任何试图越权的操作都将被系统禁止,同时它还提供了容错结构日志,可以将用户的操作全部记录下来,从而保护了系统的…

    2020年3月22日
    7.1K0
  • 轻量级目标检测SSD算法、学习率、sigmoid函数详解

    轻量级目标检测SSD算法、学习率、sigmoid函数详解轻量级目标检测SSD算法、学习率、sigmoid函数详解轻量级目标检测SSD算法、学习率、sigmoid函数详解轻量级目标检测SSD算法、学习率、sigmoid函数详解

    深度学习中最重要的超参数:学习率 什么是学习率 学习率就是SGD算法中的ϵk[^23]: 学习率决定了在每步参数更新中,模型参数有多大程度(或多快、多大步长)的调整[^24]。在之前,学习率是一个固定的数ϵ,这时候学习率是超参数。后来实践中发现,逐渐减少学习率是必要的[^26],也就是学习率schedule ϵ1,…,ϵk,这时候,学习率在一定程度…

    2022年9月20日 科技
    5.4K3

发表回复

登录后才能评论

评论列表(1条)

  • 江山如画的头像
    江山如画 2024年2月3日 上午7:48

    将数据归一化到任意区间范围的方法
    一般常见的数据归一化,是归一化到0~1,或者-1~1的区间,但在一些特殊场合下,我们需要根据实际情况归一化到其他任意区间,方法是:

    将数据归一化到[a,b]区间范围的方法:

    (1)首先找到样本数据Y的最小值Min及最大值Max
    (2)计算系数为:k=(b-a)/(Max-Min)
    (3)得到归一化到[a,b]区间的数据:norY=a+k(Y-Min)
    ————————————————

    实质上,归一化的一般规范函数是:y = (ymax-ymin)*(x-xmin)/(xmax-xmin) + ymin: