2025. 3. 21. 17:29ㆍUNLV
하계 빅데이터 해외 연구 프로그램
in University of Nevada, Las Vegas (UNLV)
I


지도 학습
- KNN(K-Nearest Neighbor, K 최근접 이웃)
KNN은 회귀 또는 분류 문제에 사용될 수 있는 알고리즘으로서, 기준값을 정하고 해당 기준값과 근접한 K개의 이웃값이 무엇인지에 따라 결과값이 도출된다.
- Linear Models(선형 모델)
Linear Models은 머신러닝 공식에서 계수들이 선형 관계에 있는 모델으로서, 독립 변수 x와 종속 변수 y와의 관계가 일차식, 그래프로선 직선으로 표현되는 것이다.
- Logistic Regression(로지스틱 회귀)
Logistic Regression은 흔히 사용되는 데이터 분석 기법으로서, 두 데이터 요인 간의 관계를 찾는 데이터 분석 기법이다. 독립 변수 데이터 집합을 기반으로 특정 이벤트의 발생 여부 등의 확률을 추정한다.
- NN(Neural Network, 신경망)
Neural Network는 머신러닝 모델 중 하나로, 두뇌의 신경망, 신경 세포인 뉴런이 연결되어있는 형태를 따라해 제작되는 모델이다. 데이터에서 복잡한 패턴 또는 관계를 학습하고 이를 응용, 분석 등을 진행하기 용이하다.
- CNN(Convolution Neural Network, 합성곱 신경망)
CNN은 Covolution(합성곱)이라는 전처리 작업이 추가되는 Neural Network 모델이다. 입력 데이터를 날 것 그대로 받아들이며 본래의 정보를 유지한 채 특성을 찾아낸다.
- SVM(Support Vector Machine, 서포트 벡터 머신)
SVM은 1차원 또는 다차원 공간에서 패턴인식, 자료분석 등을 위한 머신러닝 알고리즘이다. 클래스 분류를 위한 기준 선을 정의하는 모델로서 사용된다.
- LDA(Linear Discriminant Analysis, 선형 판별 분석)
LDA는 문서 집합으로부터 존재하는 토픽을 알아내기 위한 머신러닝 알고리즘이다. 다중 클래스 분류(Multi-class classification) 해결을 위한 접근 방식으로 주로 사용된다.

비지도 학습
- Principal Component Analysis
PCA는 머신러닝에서의 성분 추출 기법으로서, 차원 축소에 주로 사용된다. 머신 러닝 외에도 데이터 마이닝, 통계 분석, 노이즈 제거 등에 사용된다.
- K-means Clustering(K평균 클러스터링)
K-means Clustering은 머신러닝 군집화 알고리즘 중 하나로, 주어진 데이터를 여러 기준을 통해 K개의 클러스터(군집)으로 클러스터링(군집화)하는 일을 수행한다.
앙상블 학습(Ensemble Learning)
앙상블 학습이란 두 명 이상의 학습자(모델)를 세는 머신러닝 기법으로, 여러 개의 개별 모델을 생성하여 최적화 모델로 일반화하는 학습 방법이다.