1. 선형 변환

선형성 linearity

수학에서 선형성은 두 가지로 정의된다.
- Additivity : $f(a + b$ = f $a$ + f $b$ )
- Homogeneity : $f(c a$ = f $a$ ) $(c$ 는 상수)
기억하기 위해서 $f(c_1a + c_2b$ = c_1f $a$ + c_2f $b$ )를 만족하면 선형의 두 조건을 만족하는 셈이다. 앞으로 이 식으로 선형성을 확인하겠다.

선형 함수 linear function

단일 변수 일차 함수

"선형"이라는 말 때문에 선형 함수를 1차 함수로 오해할 수 있다.
일반적인 단일 변수 일차 함수는 $f (x) = m x + n f (x) = m x + n <math xmlns="http://www.w3.org/1998/Math/MathML"><mi>f</mi><mo stretchy="false">(</mo><mi>x</mi><mo stretchy="false">)</mo><mo>=</mo><mi>m</mi><mi>x</mi><mo>+</mo><mi>n</mi></math>$ 로 표현할 수 있다.

$f (c 1 a + c 2 b) = m (c 1 a + c 2 b) + n = m c 1 a + m c 2 b + n \dots (1) c 1 f (a) + c 2 f (b) = m c 1 a + m c 2 b + 2 n \dots (2) f (c_{1} a + c_{2} b) = m (c_{1} a + c_{2} b) + n = m c_{1} a + m c_{2} b + n \dots (1) c_{1} f (a) + c_{2} f (b) = m c_{1} a + m c_{2} b + 2 n \dots (2) <math xmlns="http://www.w3.org/1998/Math/MathML" display="block"><mi>f</mi><mo stretchy="false">(</mo><msub><mi>c</mi><mn>1</mn></msub><mi>a</mi><mo>+</mo><msub><mi>c</mi><mn>2</mn></msub><mi>b</mi><mo stretchy="false">)</mo><mo>=</mo><mi>m</mi><mo stretchy="false">(</mo><msub><mi>c</mi><mn>1</mn></msub><mi>a</mi><mo>+</mo><msub><mi>c</mi><mn>2</mn></msub><mi>b</mi><mo stretchy="false">)</mo><mo>+</mo><mi>n</mi><mo>=</mo><mi>m</mi><msub><mi>c</mi><mn>1</mn></msub><mi>a</mi><mo>+</mo><mi>m</mi><msub><mi>c</mi><mn>2</mn></msub><mi>b</mi><mo>+</mo><mi>n</mi><mo>\dots</mo><mo stretchy="false">(</mo><mn>1</mn><mo stretchy="false">)</mo><mtext> </mtext><msub><mi>c</mi><mn>1</mn></msub><mi>f</mi><mo stretchy="false">(</mo><mi>a</mi><mo stretchy="false">)</mo><mo>+</mo><msub><mi>c</mi><mn>2</mn></msub><mi>f</mi><mo stretchy="false">(</mo><mi>b</mi><mo stretchy="false">)</mo><mo>=</mo><mi>m</mi><msub><mi>c</mi><mn>1</mn></msub><mi>a</mi><mo>+</mo><mi>m</mi><msub><mi>c</mi><mn>2</mn></msub><mi>b</mi><mo>+</mo><mn>2</mn><mi>n</mi><mo>\dots</mo><mo stretchy="false">(</mo><mn>2</mn><mo stretchy="false">)</mo></math>$

$1$ 과 $2$ 가 다르기 때문에 일반적인 일차 함수는 선형함수가 아니다.
일차 함수 중 y절편이 0인 경우에만 선형 함수다.

다변수 일차 함수

다변수 일차 함수는 $f (\to x) = f (x 1, x 2, \dots, x n) = m 1 x 1 + m 2 x 2 + \dots + m n x n + n f (\to x) = f (x_{1}, x_{2}, \dots, x_{n}) = m_{1} x_{1} + m_{2} x_{2} + \dots + m_{n} x_{n} + n <math xmlns="http://www.w3.org/1998/Math/MathML"><mi>f</mi><mo stretchy="false">(</mo><mrow data-mjx-texclass="ORD"><mover><mi>x</mi><mo stretchy="false">\to</mo></mover></mrow><mo stretchy="false">)</mo><mo>=</mo><mi>f</mi><mo stretchy="false">(</mo><msub><mi>x</mi><mn>1</mn></msub><mo>,</mo><msub><mi>x</mi><mn>2</mn></msub><mo>,</mo><mo>\dots</mo><mo>,</mo><msub><mi>x</mi><mi>n</mi></msub><mo stretchy="false">)</mo><mo>=</mo><msub><mi>m</mi><mn>1</mn></msub><msub><mi>x</mi><mn>1</mn></msub><mo>+</mo><msub><mi>m</mi><mn>2</mn></msub><msub><mi>x</mi><mn>2</mn></msub><mo>+</mo><mo>\dots</mo><mo>+</mo><msub><mi>m</mi><mi>n</mi></msub><msub><mi>x</mi><mi>n</mi></msub><mo>+</mo><mi>n</mi></math>$ 로 표현할 수 있는데 마찬가지로 이 중 $n n <math xmlns="http://www.w3.org/1998/Math/MathML"><mi>n</mi></math>$ 이 0인 경우에만 선형 함수라고 할 수 있다.
아래의 $f f <math xmlns="http://www.w3.org/1998/Math/MathML"><mi>f</mi></math>$ 는 선형이 아니지만, $g g <math xmlns="http://www.w3.org/1998/Math/MathML"><mi>g</mi></math>$ 는 선형이다.

$f (x 1, x 2) = 2 x 1 + 3 x 2 + 1,,,,, g (x 1, x 2) = 2 x 1 + 3 x 2 f (x_{1}, x_{2}) = 2 x_{1} + 3 x_{2} + 1,,,,, g (x_{1}, x_{2}) = 2 x_{1} + 3 x_{2} <math xmlns="http://www.w3.org/1998/Math/MathML" display="block"><mi>f</mi><mo stretchy="false">(</mo><msub><mi>x</mi><mn>1</mn></msub><mo>,</mo><msub><mi>x</mi><mn>2</mn></msub><mo stretchy="false">)</mo><mo>=</mo><mn>2</mn><msub><mi>x</mi><mn>1</mn></msub><mo>+</mo><mn>3</mn><msub><mi>x</mi><mn>2</mn></msub><mo>+</mo><mn>1</mn><mo>,</mo><mo>,</mo><mo>,</mo><mo>,</mo><mo>,</mo><mi>g</mi><mo stretchy="false">(</mo><msub><mi>x</mi><mn>1</mn></msub><mo>,</mo><msub><mi>x</mi><mn>2</mn></msub><mo stretchy="false">)</mo><mo>=</mo><mn>2</mn><msub><mi>x</mi><mn>1</mn></msub><mo>+</mo><mn>3</mn><msub><mi>x</mi><mn>2</mn></msub></math>$

선형 변환 linear transformation

/ $\vec{y} = f( \vec{x}$ /) 처럼 독립 변수 뿐만 아니라 종속변수도 vector인 경우도 가능하다. 이 경우에 독립 변수에 대해 1차 함수라면 벡터와 행렬의 곱셈으로 표현할 수 있다.
앞서 설명한 선형성 판정과 비슷한 방식으로 $\vec{y} = \mathbf{A}\vec{x}$ 는 선형변환이지만 $\vec{y} = \mathbf{A}\vec{x} +\vec{b}/$ 는 선형변환이 아니다.

2. Affine 변환

Affine 변환은 점은 점으로, 선은 선으로, 면은 면으로 유지하는 변환인데, $\vec{y} = \mathbf{A}\vec{x} +\vec{b}$ 처럼 선형 변환 + 평행 이동이라고 생각하면 된다.
위의 식에서 $\vec{b}$ 를 더하는 과정을 행렬과 벡터의 곱 계산 안으로 넣을 수 있다.
A 행렬의 마지막 열에 $\vec{b}$ 를 포함시키고, $\vec{x}$ 의 마지막 요소에 1을 추가해 다음과 같이 만들면 $\vec{y} = \mathbf{A}\vec{x} +\vec{b} = \mathbf{A'}\vec{x'}$ 로 만들 수 있다.

이러한 방식으로 Affine 변환도 행렬과 벡터의 곱으로 표현할 수 있다.

Neural Network

Neural network의 layer는 입력 feature들의 linear transformation에 bias를 더하는 affine transformation 후 activation function에 통과시켜 비선형 변환을 하는 역할을 한다.
이 과정은 다음과 같은 수식으로 표현되고, 이를 도식화하면 그 아래의 그림과 같이 표현할 수 있다. $\mathbf{W}$ 는 weight matrix이고, $\vec{b}$ 는 bias이다.

$Extra close brace or missing open brace Extra close brace or missing open brace <math xmlns="http://www.w3.org/1998/Math/MathML" display="block"><merror data-mjx-error="Extra close brace or missing open brace"><mtext>Extra close brace or missing open brace</mtext></merror></math>$

위의 식을 앞에서 했던 방식처럼 하나의 matrix와 vector의 곱으로 바꿔 $\to y = W' \to x' <math xmlns="http://www.w3.org/1998/Math/MathML"><mrow data-mjx-texclass="ORD"><mover><mi>y</mi><mo stretchy="false">\to</mo></mover></mrow><mo>=</mo><mrow data-mjx-texclass="ORD"><msup><mi mathvariant="bold">W</mi><mo data-mjx-alternate="1">'</mo></msup></mrow><mrow data-mjx-texclass="ORD"><mover><msup><mi>x</mi><mo data-mjx-alternate="1">'</mo></msup><mo stretchy="false">\to</mo></mover></mrow></math>$ 표현하면 bias가 weight matrix 안으로 들어가는 셈이 되고, 그래프는 다음과 같이 다시 그릴 수 있다.

Affine transformation의 다른 의미는 2를 참고

마무리

처음 공부할 때 Linear transformation과 Affine transformation 모두 행렬의 곱으로 표현해 혼란스러웠던 기억이 있어 지금까지 공부하며 이해한 내용을 정리를 해봤다.

Reference

[1] wiki - linearity
[2] youtube - 홍정모님 Affine transformation
[3] coursera - Andrew Ng 교수님의 Machine Learning 강의

신뢰성 공학 기초 $0$	2023.10.04
모델과 지도학습 $0$	2023.08.30
인공지능과 수학 $4$	2023.08.06
최적화와 머신러닝 $0$	2022.07.24
클래스 불균형 다루기 $0$	2022.07.20

일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 $권한 있는 경우$	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

시간 날 때, 끄적끄적

Affine 변환

1. 선형 변환

선형성 linearity

선형 함수 linear function

단일 변수 일차 함수

다변수 일차 함수

선형 변환 linear transformation

2. Affine 변환

Neural Network

마무리

Reference

'Data science' 카테고리의 다른 글

'Data science'의 다른글

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역

Affine 변환

1. 선형 변환

선형성 linearity

선형 함수 linear function

단일 변수 일차 함수

다변수 일차 함수

선형 변환 linear transformation

2. Affine 변환

Neural Network

마무리

Reference

'Data science' 카테고리의 다른 글

'Data science'의 다른글

관련글

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역