Хистограма - онлайн пъзели


Онлайн пъзел Хистограма
Хистограма
Хистограма (Histogram) е графично представяне на емпирично разпределение, т. е. получено от наблюдения, на непрекъсната количествена променлива (количество измервано в непрекъсната скала). Тя е приближение на функцията плътност на разпределението на случайната величина, модел на наблюдаваната променлива.
Целта е да се проявят характеристиките на разпределението, като например симетричност или асиметричност (ляво или дясно изтегляне), унимодалност или бимодалност или повече от две моди, наличие на данни с големи отклонения (аутлаери или изключения, екстремални стойности). Хистограмата е едно от седемте средства/инструмента за контрол на качеството (seven basic tools of quality).
Хистограмата се състои от правоъгълници, плътно наредени върху хоризонталната ос, чиито основи са интервали, покриващи областта, която съдържа наблюденията. Интервалите се избират така, че да не се пресичат и всяко едно наблюдение от данните да попада в точно един интервал. Височината на правоъгълник от хистограмата се определя така, че лицето му да е пропорционално на съответстващата му честотата или броя на наблюденията в интервала, който е основа на правоъгълника.
Използване на относителни честоти (т.е. емпиричните вероятности) вместо броя променя само скалата на ординатата, но не и формата на хистограмата.
Обикновено дължините на интервалите се избират равни по големина, но това не е задължително.
Същата графика може да се използва за представяне на разпределението на една количествена променлива върху друга, също количествена. Например разпределение на валежите в л/кв.м по седмици или месеци, т.е. върху променливата „време“.
По същество, количествената променлива се трансформира в категорна, което действие се нарича също и агрегиране, сумиране или бинаризация, т.е. разпределение по интервали или контейнери (bins). Височината на правоъгълниците при равни по дължина интервали е пропорционална на честотите, по което хистограмата прилича на бар диаграма (bar plot). Плътно прилепените стълбове показват, че графиката илюстрира разпределение на количествена променлива.
Прието е стълбовете на хистограмата да се оцветяват едноцветно. Различни цветове се използват когато данните се разделят в групи (категории), т.е. налична е качествена (групираща, категорна) променлива. Различни цветове показват принадлежност на наблюдения в различни групи.