Excel има много инструменти за Анализ на данни но данните, с които работите, трябва да са в правилната форма. Ако вариациите са големи, може да бъде трудно да се установят връзки между различен номер комплекти. Поради тази причина средната стойност, както и стандартното отклонение са периметри, които помагат за често нормализиране на всеки набор от данни в excel.
Ако желаете нормализирайте да се набор от данни преди да използвате други аналитични инструменти върху тях, е лесно да го направите. Можете да постигнете нормализирани или стандартизирани набори от данни в Excel по определени начини.
Разбиране на нормализирани данни
Стандартизираните данни обикновено са резултат от нормализиране . Данните или цял набор от числа се трансформират с помощта на средна или средна стойност, както и стандартно отклонение, изчислено за цял набор. Стандартното разпределение за нормализирани данни обикновено представлява a средно от 0 заедно с 1 като дисперсия .
Когато набор от данни се нормализира, ще намерите положителни стойности, които да живеят над, докато отрицателните стойности са под средните. +1 представлява стойност, която се отклонява с 1 по-горе, докато -1 е това, което се представя, когато стандартното отклонение е едно под средното.
Функции, използвани за нормализиране
Два основни анализа са необходими, когато някой иска да нормализира набор от данни. Например, данни, които се изпълняват от A2 до A51, когато искате да ги нормализирате, трябва да намерите средната стойност и стойността на стандартното отклонение на този набор.
За да изберете средното на такива данни, изберете клетка, която е до данните и е празна; тук можете да маркирате като средно и да въведете формула „=СРЕДНО(A2: A51)“.
Можете да промените обхвата на числа според набора от данни, който желаете обмисли. Например, ако данни е между B4 и B55, въведете формулата „=СРЕДНО(B4: B55)“.
За да намерите стандартно отклонение, изберете друга клетка, която е празна. Означете го като стандартно отклонение и въведете формулата „=STDEV(A2: A51)“. Тук можете да коригирате координати на клетката според диапазона на набора от данни.
Последният етап е да използвайте функцията Standardize, полезен инструмент, присъстващ в Excel. Той съдържа три аргумента или информационни бита във формат, даден като СТАНДАРИЗИРАНЕ(стойност, средна стойност, стандартно отклонение) .
Можете да въведете нормализирани данни като етикет в клетка до данните или след клетките, където са показани средното и стандартното отклонение.
В избраната клетка трябва да въведете формулата „=STANDARDIZE(A2, $C$2, $D$2)“; това показва необходимостта от нормализиране на данните между клетка A2, средната стойност, намерена в C2, и стандартното отклонение в клетка D2. Знакът $ прави формулата лесна за репликиране в следващите стъпки.
Задръжте курсора на мишката върху долния ъгъл на клетка и когато се появи черният кръст, трябва да щракнете върху него и да го плъзнете надолу, така че да подреди клетките на данните; това би дублирало формулата и би позволило на входните данни да променят местоположението, да съпоставят клетките на редове и да вкара средно и стандартно отклонение.
Стъпки за нормализиране на данни в Excel
Excel помага за лесното боравене с големи набори от данни. С параметрите за нормализиране тук можете да използвате големи набори от числа, за да намалите същите до по-малки мащаби. Уравнението за нормализиране помага и за сравняване на различни набори от данни.
Отворете нов или съществуващ в Excel
Това е първата стъпка, която трябва да направите, когато искате да нормализирате данните в Excel. Може да имате съществуваща електронна таблица с данни, които трябва да бъдат нормализирани. Стартирайте Microsoft Excel. Това отваря електронна таблица като нов документ; бихте могли да започнете от въведете данни тук или изберете да отворите запазен документ като щракнете върху опцията „Отвори“.
Започнете със средноаритметично
Започнете от клетка C1 и въведете формулата =СРЕДНО(A1: AX) . Вместо AX въведете последната клетка с данни в колона A. Това ще завърши въвеждането за средна функция. Той също така ще върне средната аритметична стойност, използвана за нормализиране.
Изчислете стандартното отклонение
Както се вижда на изображението по-горе, изберете клетка C2 където можете да въведете функцията STDEV.S(A1: AX). Кавички не са необходими и просто трябва да промените стойността на AX според последната клетка с данни в колона A, както е посочено за средната стойност изчислителна функция. Това стартира изчисляването на стандартното отклонение и се използва за нормализиране на данни.
Въведете формула СТАНДАРИЗИРАНЕ, като щракнете върху клетка B1 където въвеждате СТАНДАРТИЗА (A1, C$1, C$2). Въпреки това, в момента на въвеждане на символите, не е нужно да поставяте кавички. Използването на знак за долар помага да се направи универсален. Можете да го копирате и поставите във всяка друга клетка и относителните препратки за клетки в редове и колони се избират автоматично.
Това помага на потребителя да използва формулата навсякъде и препратките към клетки C1, C2 не е необходимо да се променят. С тази функция завършена нормализирана форма клетка A1 идва на B1.
Нормализиране на оставащите данни
След като нормализирате данните в първата клетка на колона A, трябва да направите същото за останалата част от колона A. Изберете B1, щракнете върху същото и задръжте, плъзгайки мишката надолу по колоната и останалите клетки. Продължете същото, докато всички клетки в колона B не бъдат покрити. Пуснете мишката, за да видите стандартизираната формула, приложена и към колона B.
Функции на Excel, които помагат за нормализиране на данните
Когато нормализирате данни в електронни таблици, формулите IF, ‘AND’ и ‘DATEDIF’ са полезни, ако функцията помага за създаване на флагове, които филтрират данните. „DATEDIF“ е функция, която помага за определяне на периоди от време които преминават между две дадени дати. Функцията „И“ показва връзката между две или повече колони.
Можете да видите пример за a електронна таблица с данни тук,
Данните тук показват броя на ябълките в килограми, събрани от фермера, и на коя земеделска земя и дни.
За да се определи деня на прибиране на реколтата в рамките на 30 дни от началото, формулата, която трябва да се използва е =DATEDIF(E2, A2,d).
Задайте флаг за отчитане на двете променливи. Това се прави с помощта на формулата =AND(D2 = 1, F2<= 30).
Последната стъпка може да включва стартиране на двете добавени полета и прилагане на същите към набора от данни изцяло.
Горните стъпки и функции помагат за ефективно нормализиране на различни набори от данни в Excel.
Какво означава нормализиране на данни в Excel?
Нормализиране — Промяна на оригиналните числови стойности, за да се поберат в определен диапазон.
Например, искате да промените резултатите от теста, които бих могъл да бъде между 0–100, за да бъде в диапазона 0–1.
Може да искате нормализирайте когато имате множество променливи с различни диапазони.
Как нормализирате данните?
Как да нормализирам до 100 в Excel?
Да се нормализирайте стойностите в набор от данни да са между 0 и 100 , можете да използвате следната формула:
си= (xи– min(x)) / (max(x) – min(x)) * 100 .
си= (xи– min(x)) / (max(x) – min(x)) * Q.
Мин-Макс Нормализиране .
Означава Нормализиране .
Кой е най-добрият метод за нормализиране?
В най-добрата техника за нормализиране е този, който емпирично работи добре, така че опитайте нови идеи, ако смятате, че ще работят добре върху вашето разпространение на функции. Когато функцията е повече или по-малко равномерно разпределена във фиксиран диапазон. Когато функцията съдържа някои екстремни отклонения.
Как нормализирате данните за възрастта?
теория. Да предположим, че действителният обхват на дадена функция възраст е 5 до 100. Можем нормализирайте тези стойности в диапазон от [0, 1] чрез изваждане на 5 от всяка стойност на възраст колона и след това резултатът се разделя на 95 (100–5).
Кое е по-добро нормализиране или стандартизиране?
Нормализиране е добре да използвате, когато знаете, че разпределението на вашите данни не следва гаусово разпределение. Стандартизация , от друга страна, може да бъде полезно в случаите, когато данните следват гаусово разпределение. Това обаче не трябва да е непременно вярно.
Каква е разликата между стандартизация и нормализиране?
Нормализиране обикновено означава повторно мащабиране на стойностите в диапазон от [0,1]. Стандартизация обикновено означава мащабиране на данните, за да имат средна стойност 0 и стандартно отклонение от 1 (единична дисперсия).
Трябва ли да нормализирам данните за възрастта?
За машинно обучение не се изисква всеки набор от данни нормализиране . Изисква се само когато характеристиките имат различни обхвати. Например, помислете за a данни комплект, съдържащ две функции, възраст , и доход (x2). Където възраст варира от 0–100, докато доходите варират от 0–100 000 и повече.
Кога не трябва да нормализирате данните?
Някои добри причини Не да се Нормализирайте
Присъединяването е скъпо. Нормализиране вашата база данни често включва създаване на много таблици.
Нормализиран дизайнът е труден.
Бързото и мръсното трябва да бъде бързо и мръсно.
Ако използвате NoSQL база данни, традиционно нормализиране е не желателно.
Нормализирането винаги ли е добро?
3 отговора. Зависи от алгоритъма. За някои алгоритми нормализиране няма ефект. Като цяло алгоритмите, които работят с разстояния, обикновено работят По-добре На нормализиран данни, но това не означава, че производителността ще бъде винаги бъде по-висока след нормализиране .
Защо нормализираме данните за изображения?
Нормализиране на изображението входове: Нормализиране на данните е важна стъпка, която гарантира, че всеки входен параметър (пиксел, в този случай) има подобен данни разпределение. Това прави конвергенцията по-бърза, докато обучавате мрежата. Разпределението на такива данните биха приличат на гаусова крива, центрирана в нула.
Каква е целта на нормализирането?
по принцип, нормализиране е процесът на ефективно организиране на данни в база данни. Има две основни цели на нормализиране процес: елиминирайте излишните данни (съхраняване на едни и същи данни в повече от една таблица) и гарантирайте, че зависимостите от данни имат смисъл (съхранявайте само свързани данни в таблица).
Трябва ли да нормализираме изображенията?
Нормалната му цел е да преобразува вход образ в диапазон от стойности на пиксели, които са по-познати или нормални за сетивата, откъдето идва и терминът нормализиране . Ако ние използват сива скала образ , ние само трябва да се нормализира използвайки един канал.
Как нормализирате изображение?
Има някои вариации на как да се нормализира на изображения но изглежда повечето използват тези два метода:
Извадете средната стойност за канал, изчислена за всички изображения (напр. VGG_ILSVRC_16_layers)
Извадете по пиксел/канал, изчислен върху всички изображения (напр. CNN_S, вижте също референтната мрежа на Caffe)
Как нормализирате данните в Python?
Python предоставя библиотеката за предварителна обработка, която съдържа нормализирайте функция за нормализирайте на данни . Той приема масив като вход и нормализира стойностите му между 0 и 1. След това връща изходен масив със същите размери като входа.
Как нормализирате RGB стойностите?
Кога нормализиране на RGB стойности на изображение, разделяте всеки пиксел стойност от сумата на пикселите стойност по всички канали. Така че, ако имате пиксел с интензитет R, G и B в съответните канали, това е нормализирани стойности ще бъде R/S, G/S и B/S (където S=R+G+B).
Защо разделяме изображението на 255?
От 255 е максималната стойност, разделяне от 255 изразява представяне 0-1. Всеки канал (червен, зелен и син са всеки канал) е 8 бита, така че всеки от тях е ограничен до 256, в този случай 255 тъй като 0 е включено. Както показва справката, системите обикновено използват стойности между 0-1, когато използват стойности с плаваща запетая.