박스 플롯 예제

Comments 0 by
August 2, 2019

우리는 수염을 외부 또는 멀리 떨어진 값으로 그리지 않지만 여전히 상자 플롯에서 수염을 나타내고 싶습니다. 이것은 수염 을 넘어 추가 마크를 추가하여 달성된다. 특히 외부 값은 작은 “o`s”로 표시되고 멀리 떨어진 값은 별표(*)로 표시됩니다. 데이터에는 멀리 떨어진 값과 하나의 외부 값이 없습니다. 이 외부 값(29)은 여성을 위한 것이며 그림 3에 도시되어 있다. TRACE를 누르고 화살표 키를 사용하여 상자 플롯을 검사합니다. 그림 3. 상자는 외부 값이 표시된 플롯입니다. 표 2. 상자는 여성의 시대에 대한 용어와 값을 플롯. 그림 5. 자세한 레이블이 있는 여성 데이터에 대한 상자 플롯입니다.

온라인 imathAS 상자 플롯 도구를 사용하여 상자와 수염 플롯을 만듭니다. 그림 4는 데이터의 공개 요약을 제공합니다. 분포의 절반 점수는 경첩 사이에 있기 때문에 (경첩은 25 번째와 75 번째 백분위수임을 기억하십시오), 우리는 여성의 절반이 17 초에서 20 초 사이인 반면 남성의 절반은 19에서 25.5 사이입니다. 우리는 또한 한 여자가 거의 모든 남자보다는 느리더라도, 여자는 일반적으로 남자 보다는 더 빨리 색깔을 명명했다는 것을 것을을 봅니다. 그림 5는 상세한 레이블이 있는 여성 데이터에 대한 상자 플롯을 보여 주어 있습니다. 상자 및 수염 플롯을 만드는 데 사용되는 다섯 개의 숫자는 다음과 같습니다: 상자 플롯의 다른 스타일은 다른 상황에 가장 적합하며 사용할 확고한 규칙이 없습니다. 데이터를 탐색할 때 는 여러 가지 시각화 방법을 시도해야 합니다. 보고서에 포함되는 그래프는 서로 다른 그래프가 가장 중요하다고 생각하는 데이터의 측면을 얼마나 잘 나타내는지에 따라 달라집니다.

“꿀벌 떼” 플롯은 이 데이터 집합에 10과 15 에 가까운 데이터가 많지만 그 사이에는 상대적으로 적은 데이터가 있음을 보여줍니다. 상자 플롯이 이것에 대한 증거를 제공하지 않는지 확인하십시오. “동일하고 동일하지 않음”은 대부분의 모든 데이터 집합에 대한 짧고 정확한 설명입니다… 예를 들어 단풍 나무 잎 더미. 단풍 나무잎은 크기가 거의 같지만 약간의 차이가 있습니다. 설명 통계는 숫자를 사용하여 데이터가 동일하고 동일하지 않은 방법을 설명하려는 시도입니다. 상자 플롯(상자 및 수염 다이어그램이라고도 함)은 최소, 첫 번째 사분위수, 중앙값, 세 번째 사분위수 및 최대값의 다섯 숫자 요약을 기반으로 데이터의 분포를 표시하는 표준화된 방법입니다. 가장 간단한 상자 플롯에서 중앙 사각형은 첫 번째 사분위수에서 세 번째 사분위수(사분위수 범위 또는 IQR)에 걸쳐 있습니다. 사각형 내부의 세그먼트는 중앙값과 상자 아래의 “수염”을 표시하여 최소 및 최대 위치를 표시합니다. 일부 데이터 집합의 경우 가장 큰 값, 가장 작은 값, 첫 번째 사분위수, 중앙값 및 세 번째 사분위수 중 일부가 동일할 수 있습니다. 예를 들어 중앙값과 세 번째 사분위수가 동일한 데이터 집합이 있을 수 있습니다.

이 경우 다이어그램에는 중앙값을 표시하는 상자 내부에 점선이 없습니다. 상자의 오른쪽에는 세 번째 사분위수와 중앙값이 모두 표시됩니다. 예를 들어 가장 작은 값과 첫 번째 사분위수가 둘 다 하나인 경우 중앙값과 세 번째 사분위수가 모두 5이고 가장 큰 값이 7인 경우 상자 플롯은 다음과 같습니다. tery 상자 플롯을 구성하는 몇 가지 단계가 있습니다.