달력

06

« 2017/06 »

  •  
  •  
  •  
  •  
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  •  
2017.03.11 00:14

8일간의 선형대수학 정오표 Math2017.03.11 00:14

8일간의 선형대수학 책에 오류가 몇 개 있어서 목록을 작성해 둔다.


p. 74

이 된다. 그런데 \( a_i \ne 0 \)이라고 하였으므로 \( \lambda_i = \lambda_{\color{red}{\ell+1}} \)이 되어 모순이다.


p.125


이 된다. 벡터 \( \mathbf{v}_3 \)의 놈을 계산하면

\[\| \mathbf{v}_3 \|^2 = \left\langle x^2 - \dfrac13,x^2 - \dfrac13 \right\rangle = \int_{-1}^1 \left( x^2 - \frac13 \right)^2 dx = \color{red}{\dfrac{8}{45}} \]

이므로 세 번째 벡터를 \( \mathbf{v}_3 = \frac{\color{red}{3\sqrt{5}}}{2\sqrt{2}}\left( x^2 - \frac13 \right) \)로 고치면 정규벡터가 된다.


p.127


(2) \( X = \begin{bmatrix} x_{ij} \end{bmatrix}\), \( Y = \begin{bmatrix} y_{ij} \end{bmatrix}\)라 하면, \( \color{red}{XY} \)의 대각성분이

\begin{align*} &x_{11}y_{11}+x_{12}y_{21}+\dotsb+x_{1n}y_{n1}, \\ &x_{21}y_{12}+x_{22}y_{22}+\dotsb+x_{2n}y_{n2}, \\ &\dotsc, \\ &x_{n1}y_{1n}+x_{n2}y_{2n}+\dotsb+x_{nn}y_{nn} \end{align*} 이고, \(YX\)의 대각성분이 \[\color{red}{ \begin{align*} &x_{11}y_{11}+x_{21}y_{12}+\dotsb+x_{n1}y_{1n}, \\ &x_{12}y_{21}+x_{22}y_{22}+\dotsb+x_{n2}y_{2n}, \\ &\dotsc, \\ &x_{1n}y_{n1}+x_{2n}y_{n2}+\dotsb+x_{nn}y_{nn} \end{align*} } \] 이므로 \(\operatorname{tr}(XY) = \operatorname{tr}(YX)\)가 성립한다. 그러면


p.129


를 계산하면 \[ \begin{bmatrix} 59 & -1 \\ -1 & 5 \end{bmatrix} \begin{bmatrix} a \\ b \end{bmatrix} = \begin{bmatrix} \color{red}{36} \\ 5 \end{bmatrix} \] 이고 방정식을 풀면 \(a = \color{red}{\frac{185}{294}}\), \( b = \color{red}{\frac{331}{294}}\)이다.



저작자 표시 비영리 변경 금지
신고
크리에이티브 커먼즈 라이선스
Creative Commons License

'Math' 카테고리의 다른 글

8일간의 선형대수학 정오표  (0) 2017.03.11
Raymond Smullyan 교수 별세  (0) 2017.02.15
윤옥경 교수님 별세  (1) 2017.02.08
2017년 수학 달력  (0) 2016.10.21
한 면 안정 다면체와 거북이  (0) 2016.10.03
레카만 수열의 기묘한 성질  (2) 2016.09.09
Posted by puzzlist
2017.02.15 22:14

Raymond Smullyan 교수 별세 Math2017.02.15 22:14

"이 책의 제목은 무엇인가?"라는 재미있는 논리 퍼즐 책으로 유명한 레이먼드 스멀리언(Raymond Smullyan) 교수가 2월 6일 돌아가셨다고 한다. 향년 97세.


그는 마술사이자 피아니스트이며, 탁월한 논리학자였다. 박사 학위 지도교수는 무려 알론조 처치(Alonzo Church). 그러니까 스멀리언은 앨런 튜링(Alan Turing)과 사형제간이 된다.


평소 "죽음은 두려워할 필요 없다. 어차피 살아 생전에는 오지 않을 일이므로."라고 할 정도로 유쾌한 분이어서 그런지 100년 가까이 장수를 누렸다.



저작자 표시 비영리 변경 금지
신고
크리에이티브 커먼즈 라이선스
Creative Commons License

'Math' 카테고리의 다른 글

8일간의 선형대수학 정오표  (0) 2017.03.11
Raymond Smullyan 교수 별세  (0) 2017.02.15
윤옥경 교수님 별세  (1) 2017.02.08
2017년 수학 달력  (0) 2016.10.21
한 면 안정 다면체와 거북이  (0) 2016.10.03
레카만 수열의 기묘한 성질  (2) 2016.09.09
Posted by puzzlist
2017.02.08 19:08

윤옥경 교수님 별세 Math2017.02.08 19:08

2016년 7월 7일 서울대 수학과 명예교수였던 윤옥경 교수님께서 돌아가셨다. 연구년으로 외국에 나가 있느라 귀국하고서야 뒤늦게 부고를 접했다. 향년 87세.


Calculo ergo sum(나는 계산한다. 고로 나는 존재한다)라는 말을 들을 만큼 계산이 빠르고 정확해서 전설적인 일화도 무척이나 많은 분이다. 고등학생들에게는 수학의 정석 머리말에 나오는 이름으로 더 잘 익숙할지도 모르겠다.


늦었지만 고인의 명복을 빌며, 서울대 수학과 뉴스레터에 실린 추모글을 첨부한다. Tistory의 버그로 파일 이름 앞에 공백이 하나 들어가 있다.


윤옥경_교수님을_추모하며.pdf


저작자 표시 비영리 변경 금지
신고
크리에이티브 커먼즈 라이선스
Creative Commons License

'Math' 카테고리의 다른 글

8일간의 선형대수학 정오표  (0) 2017.03.11
Raymond Smullyan 교수 별세  (0) 2017.02.15
윤옥경 교수님 별세  (1) 2017.02.08
2017년 수학 달력  (0) 2016.10.21
한 면 안정 다면체와 거북이  (0) 2016.10.03
레카만 수열의 기묘한 성질  (2) 2016.09.09
Posted by puzzlist
2016.10.21 10:48

2017년 수학 달력 Math2016.10.21 10:48

10월 20일부터 10월 23일까지 서울대에서 개최되는 대한수학회 창립 70주년 기념 국제학술대회에서 판매 중인 수학 달력입니다.


구매는 대한수학회(02-565-0361)에 문의하세요.



저작자 표시 비영리 변경 금지
신고
크리에이티브 커먼즈 라이선스
Creative Commons License

'Math' 카테고리의 다른 글

Raymond Smullyan 교수 별세  (0) 2017.02.15
윤옥경 교수님 별세  (1) 2017.02.08
2017년 수학 달력  (0) 2016.10.21
한 면 안정 다면체와 거북이  (0) 2016.10.03
레카만 수열의 기묘한 성질  (2) 2016.09.09
대학수학 맛보기 - 미분형식  (1) 2016.08.24
Posted by puzzlist
2016.10.03 09:02

한 면 안정 다면체와 거북이 Math2016.10.03 09:02

지난 9월 30일은 수학자 리처드 가이(Richard Guy)의 100번째 생일이었다.


수학도들에게는 아마 그의 책 Unsolved Problems in Number TheoryUnsolved Problems in Geometry로 익숙한 이름일 것 같다.


100년의 인생 동안 Guy는 수많은 수학적 업적을 이루었는데,  특히 유희수학(recreational mathematics) 분야에서 많은 공헌을 하여, 그 가운데 일반인이 이해하기 쉬운 재미있는 것들도 아주 많다. 예를 들어, 콘웨이(J. H. Conway)의 유명한 생명 게임(Game of Life)에서 무한히 반복되면서 이동하는 패턴인 글라이더(glider)를 처음 발견한 것도 Guy였다.



그가 발견한 것 가운데 unistable polyhedron(=monostable polyhedron)도 비교적 이해하기 쉽다. "한 면 안정 다면체" 정도로 번역할 수 있는 unistable polyhedron은 Conway와 Guy가 출제한 문제[각주:1]에서 비롯되었다. 이 문제는 다음 두 가지를 물었다.

  1. 임의의 균질한 사면체는 적어도 두 면 가운데 한 면을 바닥으로 하여 놓으면 안정됨을 보이시오.
  2. 바닥에 놓았을 때 안정되는 면이 꼭 하나인 균질 볼록 다면체의 예를 드시오.

여기서 다면체가 안정되게 놓인다는 것은 다면체를 놓아두면 어느 쪽으로도 기울지 않고 그대로 있다는 뜻이다. 다시 말해, 다면체의 무게중심이 바닥면을 벗어나지 않는다는 뜻이다. 1969년에 같은 저널에 실린 풀이[각주:2]에서 Guy는 19개의 면으로 이루어진 다면체를 제시하였다. 단면이 17각형인 각기둥 모양의 양쪽을 비스듬히 잘라낸 모양이었다. 이 19면체를 바닥에 어떻게 놓아도 가장 긴 면이 아래로 가게 구른 다음 안정된다. (관련 동영상 참고)


한 면 안정 19면체


이 다면체를 앞, 옆, 위에서 본 그림은 다음과 같다. 여력이 되는 사람은 3D 프린터로 하나쯤 만들어 봐도 재미있을 것 같다.


앞, 옆, 위에서 본 한 면 안정 19면체



Guy는 다음과 같은 방법으로 일반적인 unistable polyhedron을 구성하였다.

  1. 한 내각이 \(180/m\)인 닮은 직각삼각형을 그림과 같이 반복하여 붙여서 \((2m-1)\)각형을 만든다.
  2. 이 다각형을 단면으로 하는 각기둥을 만든 다음 양쪽을 비스듬히 잘라낸다.

Richard Guy의 unistable polyhedron 도면


Guy의 구성 방법으로는 \(m \ge 8\)인 경우, 즉 단면이 17각형 이상인 경우에 가장 긴 면을 바닥으로 하여 놓으면 다면체의 무게중심이 바닥면을 벗어나지 않는다. 구성 방법을 조금 바꾸면 면의 개수를 더 줄일 수 있을 것 같은데, 의외로 전혀 진전이 없다가, 2012년에 Andras Bezdek이 18면 다면체를 구성하였고, 2014년에 Alex Reshetov가 구성한 14면 다면체[각주:3]가 현재 최고 기록이다.


흥미롭게도 자연에서 unistable polyhedron과 비슷한 모양을 발견할 수 있다. 아래 사진의 거북은 인도 별 거북(Indian star tortoise)으로, 이 거북은 등딱지가 unistable polyhedron과 비슷하게 생겨서, 뒤집어지더라도 쉽게 자세를 바로잡을 수 있다고 한다. 이쯤 되면 조물주는 분명히 수학자라는 생각이 든다.



인도 별 거북 (출처: fr.wikipedia.org, Colin M.L. Burnett 제공)



  1. Conway, Guy, Problem 66-12, Stability of Polyhedra, SIAM Review, Vol. 8, No. 3, July, 1966, 381. [본문으로]
  2. Conway, Guy, Problem 66-12, SIAM Review Vol. 11 (1969), 78-82. [본문으로]
  3. A. Reshetov, A unistable polyhedron with 14 faces. Int. J. Comput. Geom. Appl. 24 (2014), 39-60. [본문으로]
저작자 표시 비영리 변경 금지
신고
크리에이티브 커먼즈 라이선스
Creative Commons License

'Math' 카테고리의 다른 글

윤옥경 교수님 별세  (1) 2017.02.08
2017년 수학 달력  (0) 2016.10.21
한 면 안정 다면체와 거북이  (0) 2016.10.03
레카만 수열의 기묘한 성질  (2) 2016.09.09
대학수학 맛보기 - 미분형식  (1) 2016.08.24
정다면체와 한 점  (5) 2016.07.09
Posted by puzzlist
2016.09.09 22:14

레카만 수열의 기묘한 성질 Math2016.09.09 22:14

수학의 세계에는 별별 희한한 수열들이 많다. 피보나치 수열이나 메르센 수처럼 이름 붙은 유명한 수열도 있지만, 해괴한 규칙에 따라 만들어지는 수열도 있고, 뭔가 다른 계산을 하다가 나왔는데 아직 그 정체가 밝혀지지 않은 수열도 있다. 이런 수열들 가운데 비교적 수학적 의미가 있다고 인정되는 것들을 모아놓은 웹사이트가 있다. 수학자 슬론(Neil James Alexander Sloane)이 만든 On-Line Encyclopedia of Integer Sequences, 줄여서 OEIS가 그것으로, 처음에는 슬론이 종이에 적어 가며 수집한 목록 정도였지만, 지금은 독립된 도메인으로, 내용도 체계적으로 정리되어 있으며, 항목 수만 25만 개가 넘는다. 현재는 OEIS Foundation에서 관리하고 있다.


슬론은 OEIS에 있는 수열 가운데 가장 좋아하는 것으로 레카만 수열(Recamán sequence)을 들고 있다. OEIS 분류 번호 A005132인 이 수열은 콜롬비아의 수학자 베르나르도 레카만 산토스(Bernardo Recamán Santos)가 제안한 것으로, 규칙이 좀 희한하다. 먼저 \(a_0=0\)으로 둔다. 그 다음부터는 \(a_n = a_{n-1}-n\)으로 계산하되, 만약 이 값이 양수가 아니거나, 양수이더라도 이전 항에 이미 나온 수라면 \(a_n = a_{n-1}+n\)으로 바꾸어 계산한다.


몇 개 항을 계산해 보면, \(n=1\)일 때, \(a_0-1 = -1\)은 양수가 아니므로, \(a_1 = a_0+1 = 1\)이 된다. 이어서, \(n=2\)일 때, \(a_1-2=-1\)이므로 \(a_2 = a_1+2=3\)이 된다. 같은 식으로, \(a_3 = a_2+3=6\)이다. \(n=4\)일 때, \(a_3-4=2\)인데, 이전 단계에서 \(2\)가 나타나지 않았으므로, \(a_4 = 2\)가 된다. 그 다음 항은 \(n\)을 더하여 \(a_5=a_4+5=7\), \(a_6=a_5+6=13\), \(a_7=a_6+7=20\)이고, 여덟 번째 항은 \(n=8\)을 빼서 \(a_8=a_7-8=12\)가 된다. 이런 식으로 70항까지 계산한 결과는 다음과 같다.


0,1,3,6,2,7,13,20,12,21,
11,22,10,23,9,24,8,25,43,62,
42,63,41,18,42,17,43,16,44,15,
45,14,46,79,113,78,114,77,39,78,
38,79,37,80,36,81,35,82,34,83,
33,84,32,85,31,86,30,87,29,88,
28,89,27,90,26,91,157,224,156,225,
155

Recamán 수열500항까지 구한 Recamán 수열



우선 생각해 볼 수 있는 질문이라면, 이 수열의 항이 모두 다를지 그렇지 않으면 같은 값이 나올 수 있을지일 것 같다. \(a_{n-1}-n\)이 이전 항에 나타나면 \(a_{n-1}+n\)을 계산하지만, \(a_{n-1}+n\)이 이전 항에 나타나는 경우에 대해서는 제한하지 않았기 때문이다. 이 질문은 간단히 답할 수 있다. 위에서 구한 항을 보면, \(a_{20}=a_{24}=42\)이므로 Recamán 수열에는 같은 값이 나올 수 있다. \(a_{18}=a_{26}=43\)도 위 표에서 찾을 수 있다.


이 수열에 중복되는 값이 나올 수는 있는 것은 쉽게 알 수 있겠는데, 이 수열이 모든 자연수를 만들어 낼 수는 있을까? 이 수열의 \(n\)번째 항은 앞 항과 \(n\) 차이가 나니까 그럴 것 같아 보이지는 않는다. 하지만 한편으로는 수열이 커졌다가 작아졌다가를 반복하는 형태여서 모든 자연수를 만들어 낼 수도 있을 것처럼 보인다. 어느 쪽이 참일까?


2001년에 AT&T의 앨런 윌크스(Allan Wilks)는 \(10^{15}\)번째 항까지 계산한 결과에 나타나지 않은 가장 작은 자연수가 \(852655 = 5 \times 31 \times 5501\)임을 발표하였다. 2010년에는 인텔의 컴퓨터 공학자인 벤자민 채핀(Benjamin Chaffin)이 \(10^{230}\)번째 항까지 계산해서, 여전히 \(852655\)가 나타나지 않음을 확인하였다. 과연 이 수는 Recamán 수열에 절대 나타나지 않는 수일까?

저작자 표시 비영리 변경 금지
신고
크리에이티브 커먼즈 라이선스
Creative Commons License

'Math' 카테고리의 다른 글

2017년 수학 달력  (0) 2016.10.21
한 면 안정 다면체와 거북이  (0) 2016.10.03
레카만 수열의 기묘한 성질  (2) 2016.09.09
대학수학 맛보기 - 미분형식  (1) 2016.08.24
정다면체와 한 점  (5) 2016.07.09
알파고 vs 이세돌  (2) 2016.03.13
Posted by puzzlist
2016.08.24 01:43

대학수학 맛보기 - 미분형식 Math2016.08.24 01:43

지난 번 “대학수학 맛보기”에서 적분 이야기를 했으니, 다음은 미분 이야기를 하면 적당할 것 같다. 뭔가 순서가 바뀐 것 같은 느낌이 든다면, 기분 탓이다. 고등학교에서 미분을 처음 배울 때, 함수 \(y=f(x)\)의 미분을 다음과 같이 정의한다.
\[\frac{dy}{dx} = \lim_{\Delta x \to 0} \frac{\Delta y}{\Delta x} = \lim_{\Delta x \to 0} \frac{f(x+\Delta x)-f(x)}{\Delta x}\]

그러고 \(dy/dx\)를 “미분계수(differential coefficient)”라고 부른다. 생각해 보면 참으로 기묘하고 마술 같은 식이다. 이름부터 이상하다. 저 값이 어딜 봐서 “계수”라는 말인가? 또, 순진하게(?) 생각하면 \(dx=\lim_{\Delta x \to 0}\Delta x\)처럼 보이는데, 그러면 분모가 \(0\)이 되어 버린다. 그러니까, \(dx\)는 \(\Delta x\)에 해당하는 값이면서 \(0\)은 아니어야 하는 이상한 일이 벌어진다. 아니, 애초에 \(dx\)니 \(dy\)니 하는 게 무엇인지부터 분명하지 않다. 수를 나타낸다고 하면 분모와 분자가 모두 \(0\)인 분수가 되어 말이 안 되고, 수가 아니라고 하면 \(dy\)를 \(dx\)로 나눈다는 게 말이 안 된다.

실제로 뉴턴과 라이프니츠가 미적분학을 개발했을 때 직면한 문제점이 바로 이것이었다. \(dx\)와 \(dy\)는 수도 아니고, 수가 아닌 것도 아닌 정체불명의 그 무엇이었다.

라이프니츠는 \(dx\)와 \(dy\)를 “미분(differential)”이라 부르고 무한소(infinitesimal)로 생각하였다. \(dy\)를 \(dx\)로 나누는 대신
\[dy=(?)dx\]
꼴로 생각하고 물음표에 해당하는 값을 “미분에 붙어있는 수”라는 뜻에서 “미분계수”라고 불렀다. 미분계수가 미분계수로 불리는 이유이다.

아마도 무한소를 생각하는 과정에서 라이프니츠 철학의 핵심 개념인 모나드(monad)를 착안하지 않았을까 싶은데, 무한소를 이용한 설명은 그럴 듯하기는 하지만, 무한소라는 개념 자체가 모호하여 논리적으로는 한계가 있었다. 라이프니츠는 “연산 규칙을 분명하게 정해 놓고 이 규칙들을 적절히 적용하기만 한다면, 그 개념이 다소 모호하다고 해도 합리적이고 올바른 결과를 얻게 된다.”라고 하였다. 어찌 보면 철학자답지 않은 발언 같기도 한데, 어쨌든 그의 통찰력만은 대단했다.

미분 개념의 모호함 때문에, 현행 고등학교 교육과정에서는 미분계수 \(dy/dx\)를 분수처럼 생각하지 않고, \(d/dx\)를 하나의 기호로 다루도록 하고 있다. 이런 이유로, 분수가 아니라는 뜻에서, \(dy/dx\)를 “디 와이 디 엑스”로 읽어야만 한다고 가르치는 경우도 있는데, 그건 좀 심한 것 같다. 어찌 됐든 저 모양은 분수꼴이므로 “디 엑스 분의 디 와이”라고 읽어서 안 될 이유는 없다. 무엇보다도 라이프니츠가 애초에 분수 모양을 의도하고 만든 기호이므로, 분수처럼 생긴 것을 분수처럼 부르지 못하면 억울하지 않은가. 홍길동도 아닌데.

라이프니츠의 착상(의 위력)을 가장 잘 보여주는 것은 아마도 다음 등식
\[\frac{dz}{dx} = \frac{dz}{dy}\times\frac{dy}{dx}\]
일 것 같다. 바로 연쇄 법칙(chain rule)이다. 모양만 놓고 보면 \(dy\)를 약분하면 등식이 성립한다. 실제로 이 증명도 \(dy\)를 약분하는 것과 별로 다르지 않다. 다만 \(dy\)가 \(0\)이 되는 경우, 즉 함수 \(y(x)\)의 증가량이 \(0\)인 경우를 따로 다루는 것이 조금 다를 뿐이다.


고등학교에서 \(dx\)와 \(dy\)를 분리해서 생각하지 않도록 한다지만, 사실 적분만 봐도 이런 원칙은 바로 이상해진다. 적분

\[\int f(x)\,dx\]

는 \(dx\)를 분리해서 표기하고 있으며, \(x=g(t)\)로 치환적분할 때

\[\int f(x)\,dx = \int f(g(t)) \frac{dx}{dt}\,dt\]

는 분모의 \(dt\)와 마지막 \(dt\)가 약분되는 형태를 드러내는 식이고, 무엇보다 저런 치환적분을 할 때 \(x=g(t)\)의 양변을 \(t\)로 미분한다면서

\[dx = g'(t)\,dt\]

라는 계산을 겁도 없이(?) 마구 한다는 점에서 \(dx\)니 \(dy\)니 하는 것을 분리해서 생각하고 있다. 정확히 말하면, 분리해서 생각해도 문제가 잘 풀리도록 기호가 설계되어 있다.


이런 엉성한(?) 개념으로 뉴턴, 라이프니츠는 물론, 오일러, 가우스, 코시 등등 수많은 천재 수학자들이 어마어마한 업적을 쌓아올렸다. 그러다 이 개념을 더 정교하게 다듬고 확장하는 과정에서 해석학이라는 분야로 크게 발전하였다. 어떤 면에서는, 미적분학은 좋은 함수가 가지고 있는 좋은 성질을 공부하는 과목이고, 해석학은 나쁜 함수가 가지고 있는 나쁜 성질을 공부하는 과목이라 할 수 있을지도.


고등학교에서 배우는 17세기 수학과는 달리 현대 수학에서는 벡터 개념을 이용하여 \(dx\)와 \(dy\)를 수학적으로 엄밀하게 잘 다룰 수 있다.


함수 \(y=f(x)\)의 그래프를 그렸다고 생각하자. 지금은 좋은 함수의 좋은 성질을 설명하는 것이므로, 이 함수는 미분 가능한 함수로 생각한다. 미분을 한다는 것은 함수에 대한 선형 근사를 찾는 것이라 할 수 있고, 함수의 그래프를 생각하면 각 점에서 접선을 구하는 것이라 할 수 있다. 접점은 주어져 있으므로, 접선의 기울기만 알면 접선을 그릴 수 있다.


이제 접점 \(\mathrm{P}\)를 시점으로 하고 접선의 한 점을 종점으로 하는 벡터를 그리면, 접벡터들의 집합 \(T_{\mathrm{P}}\)는 1차원 벡터 공간이 된다. 이 벡터 공간에서 벡터를 하나 골라 \(\mathbf{v}\)라 하자. 이때 \(dx\)와 \(dy\)는 \(\mathbf{v}\)에 실수를 대응시키는 함수로 생각한다. \(dx(\mathbf{v})\)는 \(x\)축 방향 변화량, \(dy(\mathbf{v})\)는 \(y\)축 방향 변화량을 뜻한다. 아래 그림에서 \(a=dx(\mathbf{v})\)이고 \(b=dy(\mathbf{v})\)이다.




벡터 \(\mathbf{v}\)가 접선에 놓여 있으므로, 두 실수 \(dx(\mathbf{v})\)와 \(dy(\mathbf{v})\)는 일정한 비를 이룬다. 즉,

\[dy(\mathbf{v}) = k \, dx(\mathbf{v})\]

가 되고, 접선의 기울기인 비례상수 \(k\)는 \(\mathbf{v}\)의 크기가 아무리 작아도 일정하다. 이 부분이 바로 무한소를 벡터 개념으로 대체한 것이다. 임의의 \(\mathbf{v}\)에 대하여 위의 등식이 성립하므로, 간단히

\[dy = k\,dx\]

라 둘 수 있다. 그러니까 위 등식은 두 함수 \(dx:T_{\mathrm{P}} \to \mathbb{R}\)와 \(dy:T_{\mathrm{P}} \to \mathbb{R}\)가 비례 관계임을 뜻한다. \(k\)의 값은 접점 \(\mathrm{P}\)의 좌표(의 \(x\)-성분)에 따라 결정되므로, \(x\)에 대한 함수로 생각할 수 있다. 원래 함수 \(y=f(x)\)로부터 유도되어 나오는 이 새로운 함수를 도함수(導函數, derivative)라 하고 \(f'(x)\)로 나타내면,

\[dy=f'(x)\,dx\]

라는 익숙한 등식이 된다. \(dx\)와 \(dy\)가 무엇인지, 분리해서 써도 되는지 고민할 필요가 없다!


함수 \(dx\)처럼 벡터에 실수를 대응시키는 함수를 특별히 미분형식(differential form)이라 부른다. 이제 같은 방식으로 생각하면, 적분이란 미분형식에 작용하는 연산자로 생각할 수 있다. 그러니까, 이런 관점에서는, 적분 \(\int_a^b f(x)\,dx\)에서 기호 \(\int_a^b\)가 적용되는 대상은 함수 \(f(x)\)가 아니라 미분형식 \(f(x)\,dx\)이고, 적분은 [벡터에 실수를 대응시키는 미분형식]에 [실수]를 대응시키는 특별한 연산자가 된다.


사실 이런 개념 없이도 미분계수를 정의하고, 주어진 함수를 미분하고 적분하는 것은 얼마든지 할 수 있다. 실제로 고등학교 수학 교과서에서 그렇게 하고 있으니까. 그럼에도 이런 복잡해 보이는 고생을 사서 하는 이유는, 이와 같이 한 개념을 엄밀하게 정의하면 그 개념을 확장하는 것이 매우 논리적이고 자연스러워지기 때문이다.


예를 들어, 2변수 함수 \(z=f(x,y)\)에서 “미분”을 어떻게 정의할 수 있을까? 이 경우는 변수가 두 개이므로, \(dz/dx\)나 \(dz/dy\) 하나만으로는 함수를 묘사하기가 어렵다. 이제 앞서 보았던 미분형식을 생각하면, 우리가 해야할 일은 \(dz(\mathbf{v})\)를 \(dx(\mathbf{v})\)와 \(dy(\mathbf{v})\)에 대한 식으로 나타내는 것임을 알 수 있다. 여기서 벡터 \(\mathbf{v}\)는 당연히 \(z=f(x,y)\)로 주어지는 곡면의 접평면에 속하는 벡터가 된다. 1변수 함수에서 접선에 속하는 접벡터를 생각했던 것처럼, 2변수 함수에서는 접평면에 속하는 접벡터를 생각하는 것이다.


벡터 \(\mathbf{v}\)가 점 \(\mathrm{P}\)에서 접하는 평면 위에 놓여 있다고 하면, 세 축 방향의 증가량들 사이의 관계식은

\[dz(\mathbf{v}) = (♠︎)\,dx(\mathbf{v}) + (♡)\,dy(\mathbf{v})\]

라는 일차식 형태로 표현되고, \(dy(\mathbf{v})=0\)인 벡터 \(\mathbf{v}\)에 대하여 생각하면 첫 번째 계수 (♠︎)는 \(y\)를 상수로 생각한 상태에서 \(f(x,y)\)를 \(x\)로 미분한 것과 같다. 이 미분계수를 \(\left.\frac{\partial{f}}{\partial{x}}\right|_{\mathrm{P}}\)로 나타낸다. 같은 식으로, \(dx(\mathbf{v})=0\)인 경우를 생각하면 두 번째 계수 (♡)는 \(x\)를 상수로 생각한 상태에서 \(f(x,y)\)를 \(y\)로 미분한 것과 같고, 이 미분계수는 \(\left.\frac{\partial{f}}{\partial{y}}\right|_{\mathrm{P}}\)로 나타낸다. 이제 전체 결과를 정리하면

\[dz = \left.\frac{\partial{f}}{\partial{x}}\right|_{\mathrm{P}}\,dx + \left.\frac{\partial{f}}{\partial{y}}\right|_{\mathrm{P}}\,dy\]

가 된다.


이로써 우리는 변수가 몇 개이든 함수가 하나 주어지면 그 미분을 같은 방식으로 정의할 수 있다. 이런 게 바로 일반화의 위력이고 수학의 위력이라 하겠다.


저작자 표시 비영리 변경 금지
신고
크리에이티브 커먼즈 라이선스
Creative Commons License

'Math' 카테고리의 다른 글

한 면 안정 다면체와 거북이  (0) 2016.10.03
레카만 수열의 기묘한 성질  (2) 2016.09.09
대학수학 맛보기 - 미분형식  (1) 2016.08.24
정다면체와 한 점  (5) 2016.07.09
알파고 vs 이세돌  (2) 2016.03.13
대학수학 맛보기 - 부정적분  (6) 2015.12.08
Posted by puzzlist
2016.07.09 07:34

정다면체와 한 점 Math2016.07.09 07:34

마틴 가드너(Martin Gardner)의 책 Mathematical Circus에 정삼각형이 대한 흥미로운 등식이 실려 있다. 한 변의 길이가 \(d\)인 정삼각형 ABC가 있고 한 점 P가 주어질 때, 점 P와 세 점 A, B, C 사이의 거리 \(a=\overline{\rm PA}, b=\overline{\rm PB}, c=\overline{\rm PC}\)에 대하여 다음과 같은 등식이 성립한다.

\[3(a^4+b^4+c^4+d^4) = (a^2+b^2+c^2+d^2)^2\]



네 문자에 대해 대칭을 이루고 있어서 무척 아름답게 느껴지는 등식이다. 이 결과를 다른 도형으로 일반화할 수 없을까?


1995년에 수학자 John Bentin은 정삼각형을 일반화하여 정사면체, 그리고 이를 \(n\)-차원에서 일반화한 \(n\)-정단체(regular simplex)에 대한 등식을 얻었다. \(n\)개의 꼭짓점을 갖는 \((n-1)\)-정단체의 한 모서리의 길이가 \(d_0\)이고, 한 점 P에서 각 꼭짓점에 이르는 거리가 \(d_1, d_2, \dots, d_n\)일 때,

\[n(d_0^4+d_1^4+\dots+d_n^4) = (d_0^2+d_1^2+\dots+d_n^2)^2\]

이 성립한다. \(n=3\)인 경우, 앞서 보았던 정삼각형에 대한 등식이 된다.

 

1997년에 Bentin은 이 결과를 정다각형으로도 일반화하였다. 반지름 \(r\)인 원에 내접하는 정\(n\)각형의 각 꼭짓점에서 한 점 P에 이르는 거리를 \(d_1, d_2, \dots, d_n\)이라 할 때, \(d_i^2\)들의 평균을 \(s^2\), \(d_i^4\)들의 평균을 \(q^4\)이라 하면

\[q^4 + 3r^4 = (s^2 + r^2)^2\]

이 성립한다.

정삼각형의 경우, 한 변의 길이가 \(d\)인 정삼각형의 외접원의 반지름이 \(d/\sqrt{3}\)이니까, 이 값을 위 등식의 \(r\)에 대입하면 처음 언급하였던 등식이 된다.


이제 당연한 질문은 이 결과를 다른 정다면체로 확장할 수 있느냐이다. 여기에 대한 연구는 거의 되어 있지 않았는데, 최근에 정육면체와 이를 고차원으로 일반화한 초입방체(hypercube), 그리고 정팔면체와 이를 고차원으로 일반화한 정축체(orthoplex)에 대해서도 비슷한 등식이 성립함이 밝혀졌다.


\(n\)-차원 초입방체는 \(2^n\)개의 꼭짓점을 가지고 있다. 각 꼭짓점에서 한 점 P에 이르는 거리들을 \(d_1, d_2, \dots, d_{2^n}\)이라 하고, \(d_i^2\)들의 평균을 \(s^2\), \(d_i^4\)들의 평균을 \(q^4\)이라 하면,

\[q^4 + \frac{4(n+1)}{n^2}r^4 = \left( s^2 + \frac{2}{n}r^2 \right)^2\]

이 성립한다.


\(2n\)개의 꼭짓점을 가지는 \(n\)-차원 정축체(orthoplex)에서도 마찬가지로, 각 꼭짓점에서 한 점 P에 이르는 거리들을 \(d_1, d_2, \dots, d_{2n}\)이라 하고, \(d_i^2\)들의 평균을 \(s^2\), \(d_i^4\)들의 평균을 \(q^4\)이라 하면,

\[q^4 + \frac{4(n+1)}{n^2}r^4 = \left( s^2 + \frac{2}{n}r^2 \right)^2\]

이 성립한다.


신기하게도(?) 전혀 다른 두 정다면체에 대한 등식이 똑같이 생겼다. 뿐만 아니라, \(n\)-정단체(regular simplex)에 대한 등식도 \(s^2\)과 \(q^4\)을 이용하여 다시 쓰면 또다시 똑같은 등식 

\[q^4 + \frac{4(n+1)}{n^2}r^4 = \left( s^2 + \frac{2}{n}r^2 \right)^2\]

이 된다. 이것은 우연의 일치일까? 세 종류의 정다면체에 대한 증명은 완전히 별개이지만, 등식 자체가 똑같이 생겼다는 점에서 무언가 통일성 있는 설명이 가능하지 않을까? 어쩌면 정단체는 자기 자신과, 초입방체와 정축체(orthoplex)는 서로 쌍대(dual)라는 사실로 무언가를 설명할 수 있을지도 모르겠다.


다른 정다면체에 대해서는 어떨까? 정십이면체와 정이십면체에 대해 비슷한 결과를 얻을 수 있을까? 그리고 4차원에서는 정단체(4-regular simplex), 초입방체(4-hypercube), 정축체(4-orthoplex) 외에 세 개의 4차원 정다면체가 더 존재한다. 이 도형들에 대해서도 비슷한 결과를 얻을 수 있을까?


요약:

1. 정\(n\)각형에 대해 \[q^4 + 3r^4 = (s^2 + r^2)^2\]이라는 등식이 성립한다.

2. \(n\)차원 정단체(regular simplex), 초입방체(hypercube), 정축체(orthoplex)에 대하여 \[q^4 + \frac{4(n+1)}{n^2}r^4 = \left( s^2 + \frac{2}{n}r^2 \right)^2\]이라는 등식이 성립한다.

3. 위 등식에 대한 통일성 있는 설명을 할 수 있을까?

4. 다른 정다면체에 대해서도 비슷한 등식이 성립할까?

저작자 표시 비영리 변경 금지
신고
크리에이티브 커먼즈 라이선스
Creative Commons License

'Math' 카테고리의 다른 글

레카만 수열의 기묘한 성질  (2) 2016.09.09
대학수학 맛보기 - 미분형식  (1) 2016.08.24
정다면체와 한 점  (5) 2016.07.09
알파고 vs 이세돌  (2) 2016.03.13
대학수학 맛보기 - 부정적분  (6) 2015.12.08
수학자 Max Zorn  (0) 2015.11.11
Posted by puzzlist
2016.03.13 23:15

알파고 vs 이세돌 Math2016.03.13 23:15

알파고 로고



(이 글은 알파고의 기본적인 원리를 일부 설명하고 있으나, 알파고의 정확한 작동 원리를 다루는 글은 아닙니다.)


구글(Google)의 자회사인 딥마인드(DeepMind)에서 개발한 바둑 프로그램인 알파고(AlphaGo)와 이세돌 9단의 5번기가 진행 중이다. 지금까지 컴퓨터 바둑의 수준이 최정상급 프로 기사에게는 한참 모자랐기에 이번 대결은 당연히 이세돌 9단이 손쉽게 승리할 것이라는 예상이 많았다. 날로 먹는 우승 상금 11억원! 심지어 5:0으로 완승할 것이라는 예상도 많았고, 알파고가 어느 정도까지 그럴 듯하게 바둑을 둘 수 있는지 정도가 관심사였다.


5개월 전에 알파고가 유럽 챔피언이었던 판후이(Fan Hui, 樊麾) 2단을 5:0으로 이기기는 했지만, 그 실력은 아마 정상급 정도여서 그 동안 실력이 늘어봐야 이세돌 9단에게는 정선(덤 없이 흑으로 두는 것)도 힘들 것이라는 평가가 대부분이었다. 그런데! 뚜껑을 열어 보니 예상과 전혀 다른 결과가 나왔다. 3월 9일의 제1국, 3월 10일의 제2국을 알파고가 이기더니, 하루 쉬고 진행된 3월 12일의 제3국마저 이겨서 5번기의 승부가 이미 결정되어 버렸다. 날로 먹는 우승 상금이 날아갔다.


꽤나 충격적인 결과여서, 이러다 이세돌 9단이 5:0으로 이기기는커녕 0:5로 지는 게 아닌가 싶었으나, 3월 13일 원기옥을 모아 제4국을 처절하게 두어서 승리를 거두었다. 처음에는 인공지능 따위가 인간을 이길 수 없다고 자신만만해 하던 사람들이, 알파고가 예상 밖으로 막강한 실력을 갖추고 있음이 알려지자 이번에는 이번 대결이 불공정하다느니 구글이 부정하다느니 하는 온갖 헛소리를 쏟아내기도 하였다. 사실 알파고의 원리, 대회의 취지 등을 생각하면 말도 안 되는 멍청하기 짝이 없는 소리들인데도 이런 헛소리가 떠도는 걸 보면 한심할 지경이다.


대국장에 입장하는 이세돌 9단


백만년전쯤에 나온 컴퓨터 바둑은 그 수준이 정말 한심해서, 18급도 조금만 연습하면 만방으로 이길 수 있는 수준이었다. 그럴 수밖에 없는 것이, 바둑은 각 단계에 둘 수 있는 경우의 수가 너무 많아서 곧이곧대로 프로그래밍하는 방식으로는 절대 해결할 수 없어서 컴퓨터 바둑의 수읽기 능력이 매우 제한적이었기 때문이다. 예를 들어, 첫 수를 인간이 우상귀 화점에 두었다면, 컴퓨터가 다음에 둘 자리는 360(=19x19-1) 군데가 된다. 그런데 이 가운데 어느 자리에 두는 것이 적당할지를 알아내려면, 다음에 사람이 둘 자리를 예측해서 우열을 평가해야 한다. 이렇게 되면 360x359 가지 경우에 대해 판단해야 한다. 꼴랑 두 수만 가지고 국면을 평가한다는 것은 말이 안 되니 세 수 정도 둬 본다고 생각하면 360x359x358=46267920이 된다. 그러니까 두 번째 수를 두는 것만으로도 4600만 가지 경우를 다루어야 한다는 것이다. 그것도 고작 세 수(컴퓨터-사람-컴퓨터) 생각해 보는 수준이면서.


컴퓨터에 대해 잘 모르는 사람 가운데는 바둑의 각 단계를 모두 따져 보고 다음 수를 결정하는 줄로 아는 사람도 있던데, 이런 건 당연히 불가능하다. 순진하게 생각해도 이러려면 361!=361x360x...x3x2x1 가지 경우가 필요하고, 이 값이 1 뒤에 0이 768개 붙는 수보다 크니까, 전세계 모든 컴퓨터를 다 긁어 모은다고 해도 이런 일은 불가능하다. 이런 방식을, 마구잡이로 밀어붙인다는 뜻에서 브루트 포스(brute force) 방식이라고 한다. 그러니까 컴퓨터 바둑 프로그램에 대해 이야기하면서 브루트 포스 방식으로 진행된다고 말하는 사람은 그냥 무식한 걸로 생각하면 된다. 게다가 용감하기까지...


이런 식이다 보니, 선사시대의 컴퓨터 바둑은, 주변이 부분적으로 이런 모양이면 다음 수를 이렇게 둔다는 식으로 규칙을 정해 두고 진행하는 것이 기본 원리였다. 당연히 수읽기가 매우 제한적이고, 무엇보다 그 규칙에 따라 진행된 결과가 유리한지 불리한지 판단하기가 매우 어려웠다. 그래서 예전 컴퓨터 바둑은 포석과 정석은 그럴 듯한데, 중반전쯤 되면 온갖 떡수를 늘어놓다가 자멸하는 것이 보통이었다. 정석에 없는 수를 두면 처음부터 헤매기 일쑤였고, 매번 망하면서도 똑같은 수로 응수하는 바보였다.


초창기 컴퓨터 바둑 프로그램 가운데 하나인 네메시스


컴퓨터가 인간 최고수를 꺾었던 체스와 달리 바둑에서는 컴퓨터가 10급 수준에 도달하는 것도 쉽지 않은 일이었다. 이런 상황은 몬테카를로 트리 탐색(Monte Carlo Tree Search, MCTS)이라는 기법이 등장하면서 완전히 바뀌었다. 몬테카를로 트리 탐색은 다음과 같이 진행된다. 편의상 컴퓨터가 흑, 사람이 백이라 하자. 컴퓨터가 둘 차례가 되면 컴퓨터는 현재 상황의 바둑판 아무 곳에나 흑을 둔다. 그리고 이어서 아무 곳에나 백을 둔다. 이 과정을 컴퓨터 혼자서 반복해서 최종 단계에 이르러 집을 세어 승패를 판단한다.


예를 들어, 흑 A라는 수를 둔 상태에서 수만 판 무작위로 진행했더니 승률이 70%쯤 되고, 흑 B라는 수를 둔 상태에서 수만 판 무작위로 진행했더니 승률이 40%쯤 되었다면 컴퓨터는 A에 흑을 두는 것으로 결정한다. 아무렇게나 두어서 승패를 판단하는 게 무슨 의미가 있을까 싶은데, 이런 과정을 수백, 수천, 수만 번 반복하면 얘기가 조금 달라진다. 진행할 수 있는 모든 수를 브루트 포스로 다 조사하는 것은 절대로 불가능하지만, 무작위로 수만 번, 수백만 번 진행하여 승패를 조사하면 통계적으로 모든 경우의 승패 비율과 비슷해지는 것이다. 이와 같이 무작위로 진행된 많은 양의 데이터로 전체의 양상을 추정하는 방식을 몬테카를로 기법(Monte Carlo method)이라 한다. 몬테카를로는 모나코의 도박장 이름으로, 이 기법이 확률에 기반하고 있어서 이런 이름이 붙여졌다.


MCTS가 등장하면서 컴퓨터 바둑은 실력이 엄청나게 늘었다. 겨우 몇 수, 그것도 부분적으로 유불리를 평가하던 단계에서, 통계적인 근사이기는 하지만 승리할 확률을 높이는 수를 두는 것만으로도 이전 시대와는 비교할 수 없이 실력이 늘었다. 예컨대 MCTS를 이용하는 Zen, Crazy Stone, 돌바람 같은 프로그램은 아마추어 상급 수준에 가까우니, 컴퓨터가 10급 수준에 도달하는 데도 몇 십년은 걸릴 것이라고 생각했던 데 비하면 어마어마한 발전이었다.


몇년 전에 컴퓨터가 프로 기사를 상대로 접바둑(흑돌 몇 개를 미리 두고 진행하는 핸디캡 게임)을 이겼다는 소식이 화제가 되었는데, 이 프로그램들이 MCTS를 이용한 것들이었다. 당연한 일이지만 MCTS는 무작위로 진행하는 게임의 양이 많을수록 더 정밀해지므로, 이런 이벤트에서는 PC용 상용 프로그램과는 달리 CPU를 훨씬 많이 장착한 컴퓨터에서 전용 프로그램으로 진행된다. 그러나 MCTS도 만능은 아니다. 무엇보다 정밀한 결과를 얻으려면 데이터가 많아야 하는데, 무한정 시간을 들일 수는 없기 때문이다. 효율적인 진행을 위해서는 불필요한 단계를 걸러내야 하는데 이 부분이 컴퓨터 바둑의 실력을 늘이는 핵심적인 부분이었다. 그러니까, 우하귀에서 수읽기를 시작한다면, 다음 단계에서 좌상귀 1의1 자리 같은 곳을 배제하기만 해도 효율이 올라가는 것이다.


컴퓨터 바둑 프로그램 Zen과 대국 중인 다케미야 9단


프로 기사들에게 물어보면, MCTS를 기반으로 하는 기존 프로그램은 일곱 점까지도 접어줄 수 있다고 한다. 컴퓨터가 미리 일곱 점을 두고 시작하여도 프로가 잘 지지 않는다는 뜻이다. 아마추어로서 제법 잘 둬도 프로에게는 넘사벽이다. 특히 MCTS의 특성상 완전히 엉뚱해 보이는 수를 두는 경우가 꽤 있어서, 이런 허점을 파고 들면 컴퓨터의 대마 몰살하기 같은 황당한 일도 가능하다고 한다. 수읽기 자체는 MCTS로 흉내낼 수 있지만, 제한된 시간 안에 바둑판 전체를 대상으로 하여 MCTS를 진행하는 것은 한계가 분명하였다. 인간은 현재 상황과 무관한 곳을 직관적으로 무시하고 수읽기를 진행할 수 있지만, 컴퓨터는 이런 직관을 갖고 있지 않다는 것이 문제였다. 현재 상황에서 "둘 만한 곳"을 추려내는 것은 MCTS와는 다른 새로운 기법이 필요하였다. 딥마인드의 알파고가 획기적인 발전을 이룬 부분이 바로 여기였다.


알파고가 "둘 만한 후보지"를 찾는 방식은 사람과 비슷하다. 사람은 경험을 통해, 대략 이런 배치면 이런 정도에 두는 것이 좋다는 것을 학습한다. 가능한 모든 배치를 저장해 둔다는 것은 불가능하므로, 후보지를 고르는 데는 비슷한 상황을 분류할 수 있는 획기적인 알고리듬이 필수적이다. 이것을 일일이 데이터베이스화하는 것은 너무나 어려운 일인데, 딥마인드에서는 최근 각광을 받고 있는 딥러닝(Deep Learning)을 이용하여 해결하였다.


아마도 이 내용은 생물학의 최근 성과와 비교하면 이해하기 쉬울 것 같다. 2014년 생물학에서 획기적인 일이 있었다. 예쁜꼬마선충(Caenorhabditis elegans)의 움직임을 흉내낸 로봇을 만들었는데, 그 움직임을 일일이 프로그램으로 작성한 것이 아니라, 예쁜꼬마선충의 뉴런 상태를 구현하고 연결된 뉴런이 작동하는 방식만 지정하는 식으로 만들어진 것이었다. 그러니까 A 뉴런에 입력이 들어오면, 여기에 연결된 B 뉴런에 신호를 전달하고, 다시 여기에 연결된 C 뉴런에 신호를 전달하고, ... 이런 식으로 연결 상태(connectome)를 구현한 것만으로 로봇이 예쁜꼬마선충처럼 움직이는 것이다. ☞ 네이버 블로그: 인간이 만든 인공생명체


이런 장면을 보면 "과연 생명이란 무엇인가?"라는 의문이 든다. 동물의 행동이 뉴런의 연결 상태만으로 구현된다는 것은, 인간의 사고 또한 단순히 뉴런의 연결 상태로 구현할 수 있을 것이라는 추측을 가능하게 한다. 물론 겨우 302개의 뉴런으로 구성된 예쁜꼬마선충의 움직임과 100억개가 넘는 뉴런으로 구성된 인간의 뇌를 비교하기는 어렵겠지만.


딥마인드에서는 바둑에서 착수 후보지를 고르기 위하여 뉴런의 연결 상태를 구현하는 것과 비슷한 방법을 사용하였다. 바둑판의 현재 상황을 입력하면 착수 후보지를 출력하는 기계를 뉴런의 연결 상태로 구현한 셈이라고 할 수 있다. 물론 100억개의 요소로 이런 연결 상태를 구현하는 것은 불가능하므로, 적당한 개수의 변수에 적당한 입출력량을 정하여야 한다. 처음에는 이러한 신경망의 기본적인 연결 상태를 구현하기 위하여 좋은 데이터를 입력하여야 한다. 이를 위해 인터넷 바둑에서 고수들의 기보 16만개를 입력하여 "이런 국면에서는 이런 수"가 나오도록 알파고에게 "공부"를 시킨다.


이 과정을 오해하여, 알파고는 기보 수만 개를 소장하고 있다가 상대가 두는 수를 그 기보에서 찾아보고 다음 수를 둔다고 생각하는 사람도 있는데, 당연히 말도 안되는 소리이다. 기보는 알파고가 바둑에 대해 알도록 처음에 가르칠 때만 쓰이는 셈이다. 애초에 기보를 검색해서 대응수를 찾는다는 것도 말이 안 된다. 경우의 수를 생각하면 현재 상황과 같은 기보가 존재할 가능성이 거의 0이니까. 또, 이세돌 9단과 대국한 결과를 입력해서 성능이 업그레이드 될 테니 반칙이라고 주장하는 사람도 있던데, 고수들의 기보는 신경망을 처음 구축할 때 쓰이는 것이지 데이터베이스를 만들어 놓고 훔쳐 보려고 쓰는 게 아니다. 어차피 16만개의 기보에 한 두 개 더 보탠다고 신경망 구성이 획기적으로 변하는 것도 아니고.


처음에 알파고가 신경망을 구축하는 것은 바둑의 기본기를 가르치는 것과 비슷하다. 인간은 기본기를 배운 다음 수많은 실전 대국을 통하여 기력을 향상시키는데, 알파고도 마찬가지로 대국을 통해 실력을 키운다. 다만, 그 대국이 자기 자신과 두는 것이고, 먹지도 않고 쉬지도 않고 매일매일 수십 판씩 바둑을 둔다는 점이 다르다. 학습한 기본기를 바탕으로, MCTS를 적용할 범위를 축소하여 효율적인 수읽기를 하면 점점 더 좋은 대국이 가능하므로 시간이 지날수록 실력이 점점 더 늘게 된다.


알파고가 자기 차례에 착수를 결정하는 방법을 정리하면 이렇다.


1. 먼저 현재 국면에서 둘 만한 자리를 몇 군데 고른다.

2. 각 수에 대해 MCTS로 수읽기를 진행하여 이길 확률이 높은 수를 고른다.

3. MCTS를 진행할 때 바둑판 전체에서 무작위로 고르는 대신 "현재 국면에서 둘 만한 자리"를 골라 탐색 범위를 줄인다.


이로부터 컴퓨터 바둑의 기본 원리는 MCTS이지만, MCTS의 효율을 높이는 데는 "현재 국면에서 둘 만한 자리"를 고르는 방법이 결정적인 역할을 함을 알 수 있다. Zen이나 Crazy Stone과 바둑을 둬 보면, 가끔 바둑판 중앙 가까이에 모호한 수를 두는 경우가 있어서 사람이 두는 바둑과는 전혀 다른 위화감을 주는데, 알파고는 상대적으로 그런 일이 덜해서 사람과 두는 느낌을 준다. 이 또한 신경망으로 MCTS의 탐색 범위를 사람이 둘 만한 범위로 축소하기 때문에 가능한 일이다.


MCTS의 한계를 뛰어넘었다는 점에서 알파고는 인공지능 분야에서 대단한 성취라 할 수 있다. 그러나 MCTS가 확률에 기반한 수읽기이며 신경망으로 걸러내는 수가 얼마나 효율적일지는 파악하기가 쉽지 않다는 문제가 있다. 하나의 함수로 이루어져서 입력에 대해 명확하게 출력이 하나로 정해진다면 원리를 파악하기 쉽겠지만, 여러 변수들이 복합적으로 작용하는 신경망은 입출력 원리를 파악하기가 쉽지 않기 때문이다.


비유하자면, 계산기와 인간의 두뇌가 덧셈을 하는 방식을 비교해 볼 수 있겠다. 우리는 계산기의 작동 원리를 알기에 계산기는 덧셈을 잘 한다는 것을 확신한다. 그러나 인간의 두뇌가 어떻게 작동하는지는 아직 잘 모르기 때문에, 덧셈을 막 배운 아이가 덧셈을 잘 하는지는 문제를 여러 개 풀려서 확인하는 수밖에 없다. 그러니 알파고의 성능을 파악하기 위해서는 알파고에 버금가는 상대와 실제로 대국을 해 보는 것이 최선이다. 그 상대가 판후이 2단이었고 그 다음이 이세돌 9단이었던 것이다. 구글의 딥마인드로서야 100억원이 아깝지 않은 일이었다. 게다가 덤으로 홍보 효과까지.


인터넷에는 구글이 이세돌 9단에게 이기려고 부정한 짓이라도 한 줄로 아는 사람들이 있었지만, 당연히 말도 안 되는 헛소리이다. 애초에 알파고가 얼마나 잘 작동하는지 알아보려는 것이므로 최고 사양에 최고의 기술로 성능을 극대화하는 것이 당연하다. 이상한 주장을 하는 사람들은 이세돌 9단이 저사양으로 돌아가는 알파고를 상대로 이기기를 바라기라도 하는 걸까. 최고의 성능으로 작동하는 알파고를 상대로 승리를 거두는 쪽이 훨씬 더 자랑스러운 일일 텐데. 구글이 환호한 것은 이세돌 9단을 이겨서 상금을 안 줘도 되니까가 아니라 자신들이 만든 프로그램이 이세돌 9단에게 승리를 거둘 정도로 잘 작동한다는 사실을 확인했기 때문이다.


딥마인드 CEO인 데미스 허사비스의 트윗


알파고에 대한 정보가 부족하다고 부당하다고 주장하는 사람도 있었지만, 이것도 말이 안 된다. 알파고에 대한 정보라면 당연히 기보를 뜻하는데, 기보란 상대가 있어야 하며 알파고의 실력을 제대로 알 수 있는 기보는 알파고를 능가할 수 있는 상대와 맞붙어 봐야 나오는 것이다. 그러니 딥마인드에서 이세돌 9단에게 도전을 한 것이 바로 알파고에 대한 정보를 알아내기 위한 것이다.


알파고의 바둑을 보면서, 알파고가 매번 일정한 수를 두는 줄로 아는 사람도 있었다. 컴퓨터라는 물건이 정해진 입력에 대해 정해진 출력을 내놓는 정확한 기계여서 이런 인식이 많은 것 같은데, 알파고가 수읽기를 하는 방식은 브루트 포스로 모든 경우를 다 따져 보고 그 가운데 가장 좋은 수를 두는 것이 아니라, MCTS로 찾은 확률적인 결과물이다. 따라서 같은 응수에 대해서 판마다 승리 확률이 다르게 나올 수도 있다. 승리 확률이 비슷하면서 높은 수가 여러 개라면 그 가운데 하나를 무작위로 고를 수도 있다. 그러니 같은 수에 대해서 다르게 응수하는 일이 충분히 가능하다. 그런 뜻에서 알파고가 두는 수는 "정수"라기보다는 "정수에 가까울 확률이 큰 수"라 할 수 있다.


알파고의 바둑, 특히 제4국을 보면 후반부에 알파고의 떡수가 난무하는 것을 볼 수 있다. 이것은 MCTS를 이용한 기존 바둑 프로그램에서도 볼 수 있는 현상인데, 컴퓨터가 지고 있다고 판단하면 이상한 수를 두기 시작한다. 아마도 이것은 MCTS의 근본적인 문제점 같다. 이기기 어려운 상황이 되면 사람은 응수하기 까다로운 수를 두어 속칭 "흔들기"를 시도하는 것이 보통인데, 컴퓨터에게는 "응수하기에 더 까다로운 수"라는 개념이 없어서 이런 일이 생긴다. 바둑 프로그램은 어느 경우에도 상대가 최선의 응수를 할 것이라는 가정 아래 작동하기 때문이다. 그러다 보니 안 받으면 가장 이득이 큰 수를 두는 경향이 있고, 이런 수들이 대부분 응수가 눈에 뻔히 보이는 수여서 떡수 소리를 듣게 된다. 마치 천재 기사가 하수에게 "이 수는 이렇게 응수할 것 같아서 안 뒀습니다."라고 하는 느낌이랄까. 그 응수가 대단한 묘수인데도.


컴퓨터 바둑 프로그램이 발전하면서 MCTS의 한계를 극복하기 위한 다양한 노력이 진행되고 있었기에 조만간 상당한 수준에 이른, 사람처럼 두는 프로그램이 개발되리라 생각했다. 그러나 이처럼 빨리 최정상 프로급에 도달한 프로그램이 개발되리라고는 전혀 생각하지 못하였다.


알파고는 어디까지 발전할 수 있을까? 프로도 생각 못한 새로운 수를 제시하여 프로들에게 연구거리를 제공할 수도 있겠다. 응수하기 까다로운 정도를 평가하는 기능을 추가한다면 알파고가 더 인간에 가까운 느낌을 줄 것 같다. 알파고와 다른 스타일의 프로그램을 개발하는 것도 재미있을 것 같다. 지금처럼 MCTS를 이용하여 이길 확률이 높은 수를 고르는 방식으로 진행하면, 확실한 승리를 위해 대마 안 잡고 살려주던 전성기 이창호 9단 바둑과 비슷해질 수밖에 없다. 이길 확률이 조금 떨어지더라도 집 차이를 크게 하는 수를 선호하도록 신경망을 구현하고 공부시킨 프로그램이라면 아마도 엄청나게 전투 지향적인 컴퓨터 바둑이 되지 않을까? 이름은 준키고(JoonkiGo)


그러나 무엇보다도 알파고에서 구현된 기술을 다른 분야에 적용한다면 정말 무궁무진한 가능성이 펼쳐질 것 같다. 딥마인드에서 언급하였던 의료 분야도 그 한 예이다. 정말로 그런 시대가 온다면 인류 역사상 상상력이, 아마도 상상력만이 가장 중요한 시대가 될 것 같다.



저작자 표시 비영리 변경 금지
신고
크리에이티브 커먼즈 라이선스
Creative Commons License

'Math' 카테고리의 다른 글

대학수학 맛보기 - 미분형식  (1) 2016.08.24
정다면체와 한 점  (5) 2016.07.09
알파고 vs 이세돌  (2) 2016.03.13
대학수학 맛보기 - 부정적분  (6) 2015.12.08
수학자 Max Zorn  (0) 2015.11.11
2016년 수학 달력  (11) 2015.11.05
Posted by puzzlist
2015.12.08 20:34

대학수학 맛보기 - 부정적분 Math2015.12.08 20:34

모처에 "대학수학 맛보기"라는 제목으로 실었던 글.


꼬꼬마 시절, 미분과 적분은 마술과 같은 환상적인 세계였다. 특히, 주어진 함수의 부정적분을 온갖 예술적인 기교로 구하는 것은 정말로 매혹적이었다. 아름다운 미술 작품을 감상하는 것이나 다를 바 없었다. 치환적분, 부분적분, 부분분수 등등 적분 기교 하나하나가 다 멋있었고, 이런 기교들로 만들어낸 결과는 아름다운 조각품이었다.


적당한 함수를 하나 만들고, 요리조리 궁리하여 그 부정적분을 구해내는 것은 흥미로운 놀이였다. 그러나 아무리 노력해도 부정적분을 구하지 못해 애태운 함수들이 있었다. 대표적인 예가 \(y=e^{-x^2}\)과 같은 함수. 정규분포의 확률밀도 함수를 구성하는 이 함수는 무슨 짓을 해도 부정적분을 구하기가 어려웠다. 연속함수이니 부정적분이 존재하는 것이야 당연하지만, 도무지 그 모양을 알 수가 없었다. 요즘 같으면 인터넷으로 뒤져 보면 1초만에 알 수 있겠지만, 저 시대에는 인터넷도 없었고, 수학 관련 책도 많지 않았다.


부정적분을 구하기 어려웠던 또 하나의 함수는 \(y=x^x\)이었다. 이 함수는 도함수를 구할 때 로그 미분을 이용해서 흥미로웠는데, 이런 기교도 부정적분을 구하는 데는 아무 도움이 안 되었다. 사실 \(e^{-x^2}\)의 부정적분이 하나의 식으로 표현되기 어려울 것이라는 점은 충분히 짐작할 수 있었다. 이런 게 가능했다면, 정규분포표 같은 걸 만들 필요가 없었을 테니. 정규분포를 이용하여 확률을 계산한 결과를 표로 만들었고, 그 표에 적분 기호 없이 부정적분이 적혀 있지 않다는 것은 부정적분이 간단히 표현될 리가 없다는 뜻이었다. 나중에 알고 보니 1835년에 리우빌(J. Liouville)이 이 사실을 증명하였다. 그렇다면 \(x^x\)은?


짧은 지식으로는 도저히 \(\int x^x dx\)를 구할 수 없었다. 아마 수학과를 가야 이런 부정적분을 구할 수 있겠거니 생각하였다. 반은 맞고 반은 틀렸다. 이런 부정적분에 대해 이해하려면 수학을 전공해야 했다는 점에서 반이 맞았지만, 이런 부정적분을 다항식, 분수식, 지수함수, 로그함수, 삼각함수, 역삼각함수 등등을 조합하여 나타내는 것이 불가능하다는 점에서는 반이 틀린 셈이었다.

논의를 간단히 하기 위해 모든 함수는 복소수에서 정의되는 복소함수로 생각하자. 이렇게 하면

\[\cos x = \frac{e^{ix}+e^{-ix}}{2}, \qquad \sin x = \frac{e^{ix}-e^{-ix}}{2}\] 이 되어, 삼각함수와 역삼각함수를 지수함수와 로그함수를 이용하여 나타낼 수 있으므로 편리하다. 이제 지수함수와 로그함수에 사칙계산과 거듭제곱근을 적용하여 표현되는 함수를 “초등함수”라 부르자. 그러면 문제는 \(e^{-x^2}\)이나 \(x^x\)의 부정적분을 초등함수로 나타낼 수 있느냐 없느냐가 된다.

아무리 복잡한 초등함수라도 미분하는 것은 어렵지 않다. 함수들의 집합 \(S\)에 속하는 원소 \(f(x)\)가 \(S\)의 원소들을 더하고 빼고 곱하고 나누어서 표현된다면 그 도함수 \(f'(x)\)도 \(S\)의 원소들을 더하고 빼고 곱하고 나누어서 표현된다. 예를 들어, 유리식 전체의 집합을 생각하면, 이 집합은 사칙계산에 대해 닫혀 있고, 각 원소의 도함수들도 원소로 가지고 있다. 사칙계산에 대해 닫혀 있는 집합을 체(field)라 부른다. 유리식 전체의 집합은 미분에 대해 닫혀 있는 체라 할 수 있다. 이것을 일반화하여 “미분체(differential field)”를 다음과 같이 정의하자.


정의. (미분체) 체 \(F\)가 단항연산 \(':F \to F, (a+b)' = a'+b', (ab)' = a'b + ab'\)을 가지고 있을 때, 체 \(F\)를 미분체(differential field)라 부른다.


물론 단항연산 \('\)은 우리가 잘 아는 미분을 뜻하지만, 극한을 이용하여 구체적으로 미분을 정의하는 대신 미분이 가지는 성질인 선형성(linearity)과 라이프니츠 규칙(Leibniz' rule)만을 가정하면 미분체들의 대수적 구조를 파악하기에 편리하다.


미분체의 예로는 유리식의 집합 \(\mathbb{C}(x)\)를 들 수 있다. 유리식은 사칙계산에 대해 닫혀 있고, 유리식을 미분한 결과 역시 유리식이기 때문이다. 유리식의 집합만이 미분체인 것은 아니다. 무리함수 \(y=\sqrt{x}\)는 유리식이 아니므로, 유리식과 \(y=\sqrt{x}\)에 사칙계산을 적용하여 만들 수 있는 모든 함수들의 집합은 유리식의 집합보다 더 큰 미분체가 된다. 여기서, 유리식의 집합에 문자 \(t\)를 추가하여 보통의 문자처럼 다루되, \(t^2\)이 나타나면 \(x\)로 바꾼다고 규칙을 정하면 \(y=\sqrt{x}\)를 직접 다루지 않고 대수적인 표현으로 미분체를 확대할 수 있다. 이것은 마치 실수를 복소수로 확장할 때, \(i\)를 문자처럼 다루되 \(i^2\)이 나타나면 \(-1\)로 바꾼다는 것과 비슷하다.


유리식에 \(y=\sqrt{x}\)과 같은 무리함수를 추가하여 확대된 미분체는 대수적 확대체(algebraic extension field)로 불린다. 추가되는 요소가 다항방정식의 해에 해당하기 때문이다. 대수적 확대체를 이런 식으로 확대한 확대체 또한 대수적 확대체이다.


유리식이나 무리함수로 표현되지 않는 초등함수로 \(y=\ln x\)를 생각할 수 있다. 이런 함수를 추가하여 미분체 \(F\)를 확대하려면, \(F\)에 문자 \(t\)를 추가하고, 적당한 \(s \in F\)에 대해 \(t' = \frac{s'}{s}\)이 성립한다고 생각하면 된다. 이렇게 확대한 체를 로그 확대체(logarithmic extension field)라 부른다. 또, 지수함수 \(y=e^x\)를 추가하여 미분체를 확대하려면, 적당한 \(s \in F\)에 대해 \(t' = ts\)가 되는 \(t\)를 추가하였다고 생각하면 된다. 이렇게 확대한 체는 지수함수 확대체(exponential extension field)라 부른다.


이런 식으로 확대체를 구성한다고 생각하면, 함수 \(f(x)\)의 부정적분을 초등함수로 나타낸다는 것은, 복소수체 \(\mathbb{C}\)에서 출발하여 유리식체를 만들고, 적당한 로그함수와 지수함수를 추가하여 확대체를 만드는 과정을 \(f(x)\)가 원소로 나타낼 때까지 반복하는 것이라 할 수 있다.


어떤 대상이 가지는 성질을 규명하기 위하여 그 대상을 원소로 가지는 확대체를 구성하는 착상은 갈루아(Évariste Galois)가 다항방정식의 근을 대수적으로 구할 수 있는지 판정하기 위해 사용한 것이 시초였다. 함수의 부정적분이 초등함수로 표현되는지 판정하기 위해 확대체를 구성하는 착상은 갈루아 이론을 미분방정식에 적용한 것이라 할 수 있다. 이런 분야를 미분 갈루아 이론(differential Galois theory)이라 부른다. 아래 그림에서 왼쪽은 \(x^{16}=1\)의 해를 찾는 과정에 해당하고, 오른쪽은 \(y=e^{\sqrt{x^2-2}}\)의 도함수를 찾는 과정이라 할 수 있다. 초등함수로 표현되는 부정적분을 추가하여 만들어지는 확대체를 특별히 초등 미분 확대체(elementary differential extension field)라 하자.



이제 어떤 함수의 부정적분을 초등함수로 나타낼 수 있다면, 다음 정리에서처럼 특별한 조건을 만족해야 한다. 이것은 로젠릭트(M. Rosenlicht)의 논문 Liouville's Theorem on Functions with Elementary integral. Pacific Journal of Mathematics 24 (1): 153-161. 1968.에 실린 결과이다.


정리. 미분체 \(F\)와 \(G\)에 대하여, \(y \in G\)의 도함수 \(\alpha = y'\)이 \(F\)의 원소이며, \(G\)가 초등 미분 확대체라면, 적당한 상수 \(c_1, c_2, \dots, c_n \in \mathbb{C}\)와 함수 \(u_1, u_2, \dots, u_n, v \in F\)에 대하여

\[\alpha =c_1 \frac{u_1'}{u_1} + c_2 \frac{u_2'}{u_2} + \dots + c_n \frac{u_n'}{u_n} + v'\]

이 성립한다.


증명. 이 코너에 할당된 공간이 부족하여 생략.


이 정리로부터 다음과 같이 사용하기 쉬운 판정법을 얻을 수 있다. 만약 \(f(x)\)와 \(g(x)\)가 미분체 \(F\)의 원소이고 함수 \(f(x)e^{g(x)}\)의 부정적분을 초등함수로 나타낼 수 있다면, 적당한 \(w(x) \in F\)가 있어서

\[f(x) = w(x) + w'(x)g'(x)\]

가 성립해야 한다.


정규분포에 나타나는 함수 \(e^{-x^2}\)의 경우, \(f(x)=1\)이고 \(g(x)=-x^2\)이므로

\[1 = w'(x)-2xw(x)\]

를 만족하는 유리식 \(w(x)\)가 존재하는지 확인하면 된다. 위 미분방정식의 해를 구하면 \(w(x)\)는 다시 \(e^{-x^2}\)의 부정적분이 된다. 명백히 \(w(x)\)는 유리식이 아니므로, \(\int e^{-x^2} dx\)는 초등함수로 나타낼 수 없다.


함수 \(x^x\)도 마찬가지이다. 이 경우 \(x^x = 1 \times e^{x \ln x}\)이므로 \(f(x)=1\)이고 \(g(x)=x\ln x\)이다. 따라서

\[1 = w'(x) + w(x)(\ln x+1)\]을 만족하는 \(w(x)\)가 \(\mathbb{C}(x,\ln x)\)에 존재하는지 확인해야 한다. \(x\)와 \(\ln x\)에 대한 두 다항식 \(P = P(x,\ln x)\)와 \(Q=Q(x,\ln x)\)에 대하여 \(w(x) = P/Q\)라 하면, 위의 미분방정식은

\[\begin{align*}1&=\frac{P'Q-PQ'}{Q^2} + \frac{P}{Q}(\ln x+1) \\ Q^2 &= P'Q - PQ' + PQ(\ln x+1)\end{align*}\]

이 되므로 \(Q\)가 \(Q'\)을 나누려면 \(Q\)는 상수일 수밖에 없다. \(Q(x)=1\)로 두어도 되므로, 결국\[1 = P' + P(\ln x+1)\]

을 만족하는 다항식 \(P\)가 존재하는지 확인하여야 한다. \(P = \sum_{i=0}^n P_i(x)(\ln x)^i\)이고 \(P_i(x) \in \mathbb{C}[x]\)라 하면, 위 미분방정식에서 \(P_n(x)(\ln x)^{n+1}\)이 소거되지 않고 남으므로 미분방정식을 만족하는 \(P\)가 존재할 수 없다. 따라서 \(\int x^x dx\)는 초등함수로 나타낼 수 없다.


수학을 공부하면서, 수학자들의 놀라운 착상에 감탄하는 일이 많은데, 미분 갈루아 이론도 그 가운데 하나가 아닐까 싶다. 다항방정식과 미분방정식은 전혀 다른 연구 대상인데도 공통된 특성을 파악하여 비슷한 도구를 만들어내다니, 역시 수학자들의 통찰력은 대단하다.

저작자 표시 비영리 변경 금지
신고
크리에이티브 커먼즈 라이선스
Creative Commons License

'Math' 카테고리의 다른 글

정다면체와 한 점  (5) 2016.07.09
알파고 vs 이세돌  (2) 2016.03.13
대학수학 맛보기 - 부정적분  (6) 2015.12.08
수학자 Max Zorn  (0) 2015.11.11
2016년 수학 달력  (11) 2015.11.05
셰릴의 생일과 수학 공부  (4) 2015.07.05
Posted by puzzlist


티스토리 툴바