[C언어] 백준 2108 통계학
본문 바로가기

백준 C언어

[C언어] 백준 2108 통계학

728x90
반응형

문제

수를 처리하는 것은 통계학에서 상당히 중요한 일이다. 통계학에서 N개의 수를 대표하는 기본 통계값에는 다음과 같은 것들이 있다. 단, N은 홀수라고 가정하자.

  1. 산술평균 : N개의 수들의 합을 N으로 나눈 값
  2. 중앙값 : N개의 수들을 증가하는 순서로 나열했을 경우 그 중앙에 위치하는 값
  3. 최빈값 : N개의 수들 중 가장 많이 나타나는 값
  4. 범위 : N개의 수들 중 최댓값과 최솟값의 차이

N개의 수가 주어졌을 때, 네 가지 기본 통계값을 구하는 프로그램을 작성하시오.

입력

첫째 줄에 수의 개수 N(1 ≤ N ≤ 500,000)이 주어진다. 단, N은 홀수이다. 그 다음 N개의 줄에는 정수들이 주어진다. 입력되는 정수의 절댓값은 4,000을 넘지 않는다.

출력

첫째 줄에는 산술평균을 출력한다. 소수점 이하 첫째 자리에서 반올림한 값을 출력한다.

둘째 줄에는 중앙값을 출력한다.

셋째 줄에는 최빈값을 출력한다. 여러 개 있을 때에는 최빈값 중 두 번째로 작은 값을 출력한다.

넷째 줄에는 범위를 출력한다.

예제 입력 1 

5
1
3
8
-2
2

예제 출력 1 

2
2
1
10

예제 입력 2 

1
4000

예제 출력 2 

4000
4000
4000
0

예제 입력 3 

5
-1
-2
-3
-1
-2

예제 출력 3 

-2
-2
-1
2

예제 입력 4 

3
0
0
-1

예제 출력 4 

0
0
0
1

(0 + 0 + (-1)) / 3 = -0.333333... 이고 이를 첫째 자리에서 반올림하면 0이다. -0으로 출력하면 안된다.

https://www.acmicpc.net/problem/2108

 

2108번: 통계학

첫째 줄에 수의 개수 N(1 ≤ N ≤ 500,000)이 주어진다. 단, N은 홀수이다. 그 다음 N개의 줄에는 정수들이 주어진다. 입력되는 정수의 절댓값은 4,000을 넘지 않는다.

www.acmicpc.net

 

수학 기초 구현 문제입니다.

첫째 줄에 배열 요소의 갯수가 주어지고 이후 요소들이 주어진뒤

출력 첫째 줄에 요소들의 평균 값

출력 둘째 줄에 요소들의 중앙 값

출력 셋째 줄에 요소들의 최빈값 (빈도수가 가장 많은 값, 최빈값이 여러개인 경우 두번 째로 작은 값)

출력 넷째 줄에 요소들의 최대값 - 최소값

 

대충 이런식으로 볼 수 있는 문제입니다.

 

저는 문제를 잘못 해석해서 거의 다 풀어놓고 3시간 동안 고민하고 있었는데요

출력 둘째 줄에 중앙 값을 순열(중복 x) 에서 뽑는 줄 알았는데 중복 순열에서의 중앙값을 구하는 거였네요 ㅠ

여러분들은 이런 실수 없으시길 바라겠습니다.

 

먼저 많은 분들이 다른 출력들은 다 하겠는데 최빈값은 좀 까다롭게 느껴지실 겁니다

빈도수가 가장 많은 값을 뽑는건 쉽겠지만 여러개인 경우 그 중 두번째로 작은 값이라..

쉽게 생각해보면 최소값부터 빈도수를 검색하다 최빈값을 만나고 이후 또 최빈값을 만났을 때 곧바로 리턴하는 함수를 만들면 됩니다.

int	frequency()
{
	int f = 0;
	int result;
	int c = 0;

	for(i = 0; i < 4001; i++)
	{
		if (f < m[i])
			f = m[i];
		if (f < p[i])
			f = p[i];
	}
	for(i = 4000; i > 0; i--)
	{
		if (m[i] == f)
		{
			result = -i;
			c++;
		}
		if (c >= 2)
			return (result);
	}
	for(i = 0; i < 4001; i++)
	{
		if (p[i] == f)
		{
			result = i;
			c++;
		}
		if (c >= 2)
			return (result);
	}
	return (result);
}

저 같은 경우 배열 요소들을 입력 받을 때 음수일 때, 양수일 때 따로 배열을 만들어서 저장해 두었습니다.

그래서 이런식으로 최소값부터 최빈값을 검색해 최빈값이 두번 검색 됐다면 곧바로 리턴시키는 함수를 만들었습니다.

 

int	main(void)
{
	scanf("%d", &n);
	int	s[n], j = 0;
	for(i = 0; i < n; i++)
	{
		scanf("%d", &nums[i]);
		if (nums[i] < 0)
			m[abs(nums[i])]++;
		else
			p[nums[i]]++;
		total += nums[i];
		if (min > nums[i])
			min = nums[i];
		if (max < nums[i])
			max = nums[i];
	}
	for(i = 4000; i > 0; i--)
	{
		for(int k = 0; k < m[i]; k++)
			s[j++] = -i;
	}
	for(i = 0; i < 4001; i++)
	{
		for(int k = 0; k < p[i]; k++)
			s[j++] = i;
	}
	printf("%d\n%d\n%d\n%d\n", (int)round((double)total / (double)n), s[j / 2], frequency(), max - min);
	return (0);
}

문제를 잘 보시면 요소들의 최대값은 절대값으로 4000을 넘지 않는다고 합니다.

최대값이 정말 작은걸 이용해서 계수정렬을 사용할 수 있다는걸 알고 음수, 양수 전용 배열을 [4001] 크기로 각각 만들어서

입력 받을 때 적용 시킨뒤 나중에 큰 배열에 계수 정렬을 적용 시키고 곧바로 출력하는 식으로 했습니다.

 

첫째 줄의 경우 평균 값을 출력하는 거니까 입력받을 때 하나하나 미리 더해주고 n으로 나누어서 round 함수를 이용해

반올림해서 출력하는 식으로 했고

둘째 줄은 중앙 값을 출력하는 거니까 계수 정렬을 이용해 중앙값을 그대로 출력하게끔 했습니다.

셋째 줄인 최빈 값은 위에서 보신 최빈값 전용 함수로 출력하고

넷째 줄은 단순히 범위를 구하는 거니까 최대값 - 최소값을 출력하게끔 했습니다.

 

다시 보니 정말 쉬운편 같은데 문제를 잘못해석해서 중앙값 만드는데 3시간 걸렸다는게 한이네요.. ㅠㅠ

 

반응형

전체 코드

#include <stdio.h>
#include <stdlib.h>
#include <math.h>
int	nums[500001], m[4001] = {}, p[4001] = {}, total = 0, n, i, min = 2147483647, max = -2147483648;

int	frequency()
{
	int f = 0;
	int result;
	int c = 0;

	for(i = 0; i < 4001; i++)
	{
		if (f < m[i])
			f = m[i];
		if (f < p[i])
			f = p[i];
	}
	for(i = 4000; i > 0; i--)
	{
		if (m[i] == f)
		{
			result = -i;
			c++;
		}
		if (c >= 2)
			return (result);
	}
	for(i = 0; i < 4001; i++)
	{
		if (p[i] == f)
		{
			result = i;
			c++;
		}
		if (c >= 2)
			return (result);
	}
	return (result);
}

int	main(void)
{
	scanf("%d", &n);
	int	s[n], j = 0;
	for(i = 0; i < n; i++)
	{
		scanf("%d", &nums[i]);
		if (nums[i] < 0)
			m[abs(nums[i])]++;
		else
			p[nums[i]]++;
		total += nums[i];
		if (min > nums[i])
			min = nums[i];
		if (max < nums[i])
			max = nums[i];
	}
	for(i = 4000; i > 0; i--)
	{
		for(int k = 0; k < m[i]; k++)
			s[j++] = -i;
	}
	for(i = 0; i < 4001; i++)
	{
		for(int k = 0; k < p[i]; k++)
			s[j++] = i;
	}
	printf("%d\n%d\n%d\n%d\n", (int)round((double)total / (double)n), s[j / 2], frequency(), max - min);
	return (0);
}
728x90
반응형

'백준 C언어' 카테고리의 다른 글

[C언어] 백준 1759 암호 만들기  (2) 2023.02.27
[C언어] 백준 11399 ATM  (0) 2023.02.13
[C언어] 백준 2805 나무 자르기  (0) 2023.01.27
[C언어] 백준 5430 AC  (2) 2023.01.25
[C언어] 백준 7576 토마토  (0) 2023.01.20