전체 글 62

최적화와 머신러닝

최적화는 여러 공학 분야에서, 일상에서도 많이 쓰이지만 명확하게 의미를 파악하는 것이 어려웠습니다. 지금까지 공부를 하며 제가 이해한 최적화라는 개념의 의미와 기계학습 분야에서 최적화의 의미를 설명하는 포스팅을 남깁니다. Optimization수치해석 교과서1에서 optimization은 특성을 나타내는 함수의 최대값이나 최소값을 만드는 입력을 찾는 것이라고 설명하고 이 값을 optimal value라고 설명합니다. optimal value라고 하면 가능한 조건(domain)에서 가장 좋은 최적의 값이라고 생각할 수 있다. 최적화를 활용해 설계를 하고자 하면 최적 설계, 제어를 하고자한다면 최적 제어가 된다. 이렇게 공학적인 내용 뿐만아니라 물자 조달과 같은 실생활에 밀접한 문제도 최적화를 통해 해결을 ..

Data science 2022.07.24

클래스 불균형 다루기

이 포스팅은 다음 블로그를 주로 참고해 작성됐습니다. 데이터 imbalance는 실제 데이터에서 매우 흔히 발견될 수 있는 문제 class imbalance에 대해 설명하고 해결 방법을 소개 Class imbalance 특정 클래스의 수가 다른 클래스의 데이터의 수에 비해 꽤 적을 때를 의미함 아래와 같은 상황이 데이터 불균형이 존재하는 상황 데이콘 운동 동작 분류 대회에서 데이터 불균형이 존재하는 데이터 접근 가능 Non-Exercise는 1500개가 넘는 데이터가 존재하지만 그 외의 데이터는 200개 이하의 데이터를 갖습니다. Class imbalace가 왜 문제가 되는지 대부분의 머신러닝 모델은 class간의 데이터의 비율이 비슷하다는 가정에서 성립됨 training을 할 때 imbalance가 크..

Data science 2022.07.20