수학 & 확률 & 통계 8

콜라츠 추측 (Collatz conjecture) 수열 길이 분포도

자연수 n에 대해 f(n) = 3n+1 (n이 홀수), n/2 (n이 짝수)로 정의하자. 이때 어떠한 자연수 n을 가져오더라도 f(...)를 계속 적용하다보면 1 (->4->2->1->... 은 사이클)로 끝난다는 추측이다. 일단은 컴퓨터로 돌려봤을때는 2^68까지는 반례가 없다고 한다. (https://en.wikipedia.org/wiki/Collatz_conjecture) 파이썬에서 함수 op_collatz(n)을 정의하고, def op_collatz(n): ret = [] while n >= 1: ret.append(n) if n == 1: break if n % 2 == 0: n = n // 2 else: n = 3 * n + 1 return ret 1~29까지 수열 (n, f(n), f(f(n..

Extended Euclidean Algorithm

Diophantine equation과 관련해서 간략하게 정리를 해보려고 한다. \[ax + by = c\] 꼴로 나타낼 수 있는 방정식을 linear Diophantine equation (https://en.wikipedia.org/wiki/Diophantine_equation)이라 하고, Bézout's identity (https://en.wikipedia.org/wiki/B%C3%A9zout%27s_identity)에 따르면 \[ax + by = gcd(a,b)\] 을 만족하는 정수해 x와 y가 존재한다. 보다 일반적으로는 우변은 \(gcd(a,b)\)의 정수배가 가능하다고 한다. Extended Euclidean algorithm은 \(gcd(a,b)\) 그리고 \(x\) 와 \(y\)를 구하..

[잡담] A if B와 A only if B (충분조건, 필요조건)

요즘은 어떻게 가르치는지 모르겠는데, 예전 수학의 정석에서는 Sufficient Condition/ Necessary Condition을 South, North로 해놓고 방위 기호(4)의 방향으로 나름 "외우기" 쉽게 설명하려 했던 기억이 난다. 당시에도 왜 이걸 이런 식으로 설명하나 이해가 가질 않았다. 핵심은 결국 두 집합(A, B)의 포함 관계 일 뿐이다. 그러니 A가 B에 포함이 되든가 아니면 B가 A에 포함이 되든가, 아니면 포함 관계가 성립하지 않든가 정도의 경우만 존재한다. 이 때 A가 B안에 포함되면 A는 B의 충분조건(Sufficient condition)이고, B는 A의 필요조건(Necessary condition)라고 부른다. 영어에서도 A if B B -> A 이렇게 "그냥" 외우기..

민감도와 특이도 (Sensitivity and Specificity)

이진 분류(Binary classification)에서 나올 수 있는 경우는 4가지다. 어떤 테스트가 Positive/Negative의 결과를 말해주는데, 정말 실제로 Positive/Negative인지의 조합에 따른 것이다. 실제로 Positive 실제로 Negative Positive 라고 말함 True Positive False Positive (Type I error) Negative 라고 말함 False Negative (Type II error) True Negative 민감도(Sensitivity)는 True positive rate (TPR) 혹은 Recall이라고 부른다. \( (Sensitivity) = \frac{TP}{TP+FN} \) 실제로 positive인 녀석들 중에서 검사가 ..

리틀의 법칙 (Little's Result)

공식 \( L = \lambda W \) \(L\): 큐(queue) 안의 평균 사람 수 \(\lambda\): 평균 도착 속도 (얼마나 자주 사람들이 오는가?) \(W\): 평균 대기 시간 Little's law 혹은 Little's result라고 불린다. 간단한 공식이지만, 확률 분포의 종류에 상관없이 일반적으로 성립하기 때문에 아주 유용하다. "긴 구간에 대한 평균"임에 유의. 만약 줄에 아무도 없으면 대기 시간(Waiting time)은 0이다. 대기 시간의 의미를 생각해보자. 가장 마지막에 줄을 선 사람이 제일 앞까지 오는 데 걸리는 시간을 의미한다. 이 시간 동안 몇 명의 사람들이 추가적으로 들어올까? 바로 대기 시간에 평균 도착 속도를 곱한 값이다. 예제 4시간 동안 300명의 손님이 다녀..

지수함수의 멱급수 계산 (유한합)과 floor 함수

지수함수 \(e^{x}\)는 아래와 같은 멱급수(power series)로 나타낼 수 있다. $$ e^{x} = \sum_{n=0}^{\infty}{\frac{x^n}{n!}} $$ 그런데 만약 \(N\)번째 항까지 더한 유한합 -- 즉, 아래 급수는 어떻게 될까? $$ \sum_{n=0}^{N}{\frac{1}{n!}} $$ 약간 트릭(?)을 쓰자면, 양변에 \( N! \) 를 곱하고 \( x = 1 \) 을 대입한다. 그리고 두 부분합으로 쪼갠다. $$ e \cdot N! = \sum_{n=0}^{\infty}{\frac{N!}{n!}} = \sum_{n=0}^{N}{\frac{N!}{n!}} + \sum_{n=N+1}^{\infty}{\frac{N!}{n!}} $$ 두 개의 부분합 중, 처음 부분합..

[수능수학] 1997년 수리영역 29번

극악의 정답률 0.08%의 문제 (공식적으로는 인문계 1.25%, 자연계 1.09%)라고 하는데, 굉장히 생소하게 느껴졌다. 안 풀어봤을 리가 없는데 말이다. 흠... 문제 29. 두 방정식 \(P(x)=0, Q(x)=0\)의 서로 다른 실근의 개수는 7개, 9개이고, 집합 \( A = \{(x,y)|P(x)Q(y)=0, Q(x)P(y)=0, x,y \in \mathbb{R} \} \)는 무한집합이다. 집합 \(A\)의 부분집합 \(B=\{(x,y)|(x,y)\in A, x=y\}\)의 원소의 개수를 \(n(B)\)라고 하면 이것은 \(P(x), Q(x)\)에 따라 변한다. \(n(B)\)의 최댓값을 구하라. [4점] 풀이 우선 집합 \(A\)가 무한집합이라는 말이 어떤 상황일까? \(P(x)Q(y)=0..