본문 바로가기

재융

Notice

Recent Posts

Popular Posts

Recent Comments

Link

Calendar

Tags

더보기

Archives

Visits

Today

Yesterday

개발 공부방

Data/Data Science

[ML] bf16, fp16, fp32의 차이점

Data/Data Science 2023. 5. 13. [ML] bf16, fp16, fp32의 차이점 업무를 진행하면서 bf16, fp16, fp32에 대한 정보를 알게되었는데. 왜 사용하는지 그리고 언제 사용하는지에 대해서 좀 정리해보려고한다. https://arxiv.org/abs/1905.12322 -> 관련논문 A Study of BFLOAT16 for Deep Learning Training This paper presents the first comprehensive empirical study demonstrating the efficacy of the Brain Floating Point (BFLOAT16) half-precision format for Deep Learning training across image classification, speech recognition, langu..

[EECS 498-007, Lecture5] Activation Function이 필요한 이유

Data/Data Science 2021. 5. 20. [EECS 498-007, Lecture5] Activation Function이 필요한 이유 https://www.youtube.com/watch?v=g6InpdhUblE&list=PL5-TkQAfAZFbzxjBHtzdVCWE0Zbhomg7r&index=5 강의를 보는중 다음과 같은 내용이 나오는데 Activation Function이 없다면 결국엔 Linear Classifier라는 뜻인데. 여기서 "수학적으로 본다면"에서 약간 갸우뚱 거렸다. 그래서 검색을 하는과정에 다음과 같은 이미지를 찾게되었는데 직관적으로도 이해가 되겠지만. 부연설명을 하자면 MLP에서 두드러지게 효과가 나타난다고 한다. 즉, 만약에 Activation function이 없다면 Z(x) = (-5x - 7.7) + (-1.2x - 1.3) + (1.2x + 1) + (1.2x - 0.2) + (2x - 1.1) + (5..

[Pytorch] torch.nn layer 함수 정리 (추가정리중)

Data/Data Science 2021. 5. 3. [Pytorch] torch.nn layer 함수 정리 (추가정리중) 눈으로만 봐서는 도저히 머리에 안들어와서 블로그에 쓰면서 정리함 pytorch.org/docs/stable/nn.html torch.nn — PyTorch 1.8.1 documentation Shortcuts pytorch.org torch.nn.Linear - 함수 선언시 두개의 인자값이 들어가게되고, 첫번째 인자값은 input size, 두번째 인자값은 output size이다 - 실제로 데이터가 거치는 forward()부분에선 두번째 인자값없이 첫번째 인자값만 넘겨주면된다. return되는 tensor의 크기가 output size가 된다 # Linear layer 선언 linear_1 = torch.nn.Linear(input_size, output_size) # forward 부분 (실제로 데이..

[ML] Clustering 정리 및 DBSCAN

Data/Data Science 2021. 4. 22. [ML] Clustering 정리 및 DBSCAN Clustering 비지도학습 머신러닝 기법중 하나 클러스터링 종류 Hard Clustering - 한 개체가 여러 군집에 속할수 없는 군집화 방법 Soft Clustering - 한 개체가 여러 군집에 속할수 있는 군집화 방법 Partitional Clustering - 전체 데이터의 영역을 특정 기준에 의해 동시에 구분하는 군집화 방법. 각 개체들은 사전에 정의된 개수의 군집 가운데 하나에 속하게 됨 대표적으로 K-Mean 군집화 Hierarchical Clustering - 개체들을 가까운 집단부터 차근차근 묶어나가는 군집화 방법. *덴드로그램을 생성함 덴드로그램 → 계층적 군집에서 클러스터의 개수를 지정해주지 않아도 학습을 수행할 수 있는 것은 개체들이 결합되는 순서를 나타내는 트리 형태의 구조 ..

Data/Data Science 2021. 2. 14. [ML] 짜투리정리 Convex, non-Convex Cost Function의 그래프가 Local minimun이 있는지 없는지 여부 Optimization Algorithm Gradient Descent만 있는줄알았는데, 다른 최적화 알고리즘이 있다고하여, 기록차 적음 장점 - 우리가 흔히알고있는 Learning Rate를 따로 지정해줄필요없음 - 때때론 Gradient Descent보다 빠른성능을 자랑 단점 - 계산량이 많음(GD보다) Pytorch 라이브러리(pytorch.org/docs/stable/optim.html) torch.optim.LBFGS(params, lr=1, max_iter=20, max_eval=None, tolerance_grad=1e-07, tolerance_change=1e-09, hist..

[머신러닝] LGBM, XGBoost, GBM

Data/Data Science 2021. 2. 3. [머신러닝] LGBM, XGBoost, GBM LGBM(Light GBM) 데이터셋 작으면 과적합하기 쉽다. 문서상 10,000개 데이터 이상인 데이터셋에 적합 하지만 많은 데이터셋에서는 XGBoost보다 빠른 학습속도, 적은 메모리사용량 카테고리형 데이터에 대해서 원핫인코딩이 필요없이 알아서 인식 기존 GBM과 다른점은 GBM은 균형 트리분할(Level Wise) 방식, LGBM은 리프중심 트리분할(Leaf Wise) 방식 균형 트리분할 : 최대한 균형 잡힌 트리를 유지하며 분할하여 트리의 깊이를 최소화하여 오버피팅에 강한구조이지만 균형을 맞추기 위한 시간이 필요 리프중심 트리분할 : 최대 손실 값을 가지는 리프노드를 지속적으로 분할하면서 트리가 깊어지고 비대칭적으로 생성하며 이로써 예측 오류 손실을 최소화. XGBoost(eXtra Gradien..

[Gradient Descent] 경사하강법

Data/Data Science 2021. 1. 13. [Gradient Descent] 경사하강법 경사하강법 사용 이유 - 함수(딥러닝에서는 Cost Function)의 최소값을 찾는 문제에서 이용 바로 미분 계수가 0인 지점을 찾으면 되지않을까? - 함수가 닫힌 형태가 아닌 경우 - 함수가 너무 복잡해서 미분 계수가 어려운경우엔 경사하강법이 구하기가 더쉬울떄가 있음 - 데이터 양이 너무 많은 경우 효율적으로 계산하기 위해 * 닫힌 형태(closed form)란 방정식(equation)의 해(solution)를 해석적(analytic)으로 표현할 수 있는 종류의 문제를 말한다. 닫힌 형태(closed form)의 반대 개념으로 열린 형태(open form)라는 것도 있다. 열린 형태란 유한 개(finite)의 수학적 표현을 사용해서 정확하게 해를 표현할 수 없는 문제를 말한다. 정리하면 닫힌 형태의 ..

[Pytorch] Autoencoder Base code

Data/Data Science 2020. 11. 29. [Pytorch] Autoencoder Base code import torch import torchvision import torch.nn.functional as F from torch import nn, optim from torchvision import transforms, datasets class Autoencoder(nn.Module): def __init__(self): super(Autoencoder, self).__init__() self.encoder = nn.Sequential( nn.Linear(28*28, 128), nn.ReLU(), nn.Linear(128, 64), nn.ReLU(), nn.Linear(64, 12), nn.ReLU(), nn.Linear(12, 3), ) self.decoder = nn.Sequential( ..

[Pytorch] Basic Neural Network

Data/Data Science 2020. 11. 23. [Pytorch] Basic Neural Network Neural Network 기본틀 저장 import torch import torch.nn.functional as F # 모델선언 class NeuralNet(torch.nn.Module): def __init__(self, input_size, hidden_size): super(NeuralNet, self).__init__() self.input_size = input_size self.hidden_size = hidden_size self.linear_1 = torch.nn.Linear(self.input_size, self.hidden_size) self.linear_2 = torch.nn.Linear(self.hidden_size, 1) def forward(self, input_tensor)..

Normalization, Regularization, Standardization

Data/Data Science 2020. 11. 14. Normalization, Regularization, Standardization Normalization(정규화), Standardization(표준화), Regularization모두 다 머신러닝 또는 딥러닝에 학습에 효율적 또는 Overfitting을 피하기 위해서 나온 기법들이다. Normalization, Standardization은 모델에서 특정 Feature가 값이 큰경우 해당 feature가 큰영향을 끼치는것을 방지하기위해서 적용하는 기법이다. Normalization 값의 범위를 0~1사이의 값으로 바꾸는 것 방법은 다양함 MinMaxScaler - 최대 최소값을 이용한 방법 Standard Score Student's t-statistic Studentized residual Standardized moment Coefficient of variation en.wi..

[Kaggle] Kaggle에 pyspark 설치하기

Data/Data Science 2020. 11. 4. [Kaggle] Kaggle에 pyspark 설치하기 다음 명령어를 복붙하면된다! !pip install pyspark from pyspark import SparkContext, SparkConf from pyspark.sql import SparkSession sc = SparkContext.getOrCreate(SparkConf().setMaster("local[*]")) spark = SparkSession.builder.getOrCreate() 실행시키면 다음과같은 출력이나오고. 정상적으로 spark 명령어가 듣는걸 볼수가있다

[deeplearning.ai] Sequence Models

Data/Data Science 2020. 10. 30. [deeplearning.ai] Sequence Models Recurrent Neural Network(RNN) Model 왜 RNN을 사용해야하는건지? - Inputs, Outputs can be different lengths in different examples. (데이터의 고정적이지않은 길이에도 학습이 가능함) - Doesn't share features learned across different positions of text. (특정위치에 특징점을 잡지않고 유동적이게 특징점을 잡아줌. 이건 CNN에도 동일하다) Forward Propagation forward propagation의 과정은 위와같고, 공식은 아래와같다. 기본적으로 제일처음의 activation함수값(a)은 0으로 설정한다고한다. 그럼 들어있는 파라미터는 Wa,, ba, by인것같다..

[deeplearning.ai] Convolution Neural Network

Data/Data Science 2020. 9. 18. [deeplearning.ai] Convolution Neural Network deeplearning.ai 코스의 네번째 수업 Convolution Neural Network(이하 CNN)이다. 컴퓨터 비전과 관련없는 일을 하고있지만 모르는것보단 낫지않은가..! 이참에 공부를해봐야겠다! Padding 패딩을 안하고 컨볼루션을 진행할경우, 코너나 모서리에 있는 정보들이 유실되는 현상이 발생하여 패딩작업을 먼저 진행함 패딩 공식은 N - 인풋이미지 크기 F - 컨볼루션 커널 크기 기존 아웃풋 이미지 크기 공식 (N-F+1) * (N-F+1) 아웃풋 이미지가 인풋 이미지와 같은 크기가 나오게끔 패딩을 한다면, (N+2P-F+1) * (N+2P-F+1) 에 공식에서 P값을 구하면 얼마나 패딩을 해야하는지 계산이됨. 즉, N=6, F=3일때, 6+2P-3 + 1 = 6(인풋이미지 크기) 가..

[deeplearning.ai] Structuring Machine Learning Projects

Data/Data Science 2020. 9. 6. [deeplearning.ai] Structuring Machine Learning Projects Deeplearning.ai 코스 세번째 강의 시작... 이번엔 ML프로젝트에 필요한 지식들을 배운다고한다. TP&TN&FN&FP True Positive(TP) - 양성인데, 양성으로 제대로 검출된것 True Negative(TN) - 음성인데 음성으로 제대로 검출된것 False Positive(FP) - 음성인데 양성으로 잘못 검출된것 False Negative(FN) - 양성인데 음성으로 잘못 검출된것 Accuracy & Error Rate & Precision & Recall & ROC Accuracy = (TP + TN) / 전체 데이터 수 (정확도) Error Rate = (FP + FN) / 전체 데이터 수 (오류도) Precision = TP / (TP + FP) (정밀성, Positive..

[HMM] Hidden Markov Models

Data/Data Science 2020. 8. 28. [HMM] Hidden Markov Models [참조1]: https://www.youtube.com/watch?v=HB9Nb0odPRs [참조2]: https://www.youtube.com/watch?v=P02Lws57gqM Three problems of hidden Markov model HMM에서 풀수있는 문제들 나열 lambda = (A, B, pai) *O 는 Observations Given HMM(lambda) and O, find the probability of O > Evaluation problem Given HMM(lambda) and O, find the optimal hidden state sequence (S) > Decoding problem HMM의 핵심 Given X = {O1, ... , On}, find the..

[deeplearning.ai] Coursera 필기정리 4

Data/Data Science 2020. 8. 27. [deeplearning.ai] Coursera 필기정리 4 Hyperparameter 여태까지 배운내용을 종합하여 다양한 하이퍼파라미터가 있다는걸 보았다. 정리해보자면 Alpha - learning rate Beta - Momentum 관련 Layers - 얼마나 깊은 네트워크를 만들것인지 Hidden Units - Hidden layers에 얼마만큼의 Unit을 넣을것인지 Learning rate decay mini-batch size 앤드류쌤은 빨간색 > 노랑색 > 보라색 순으로 중요한 하이퍼파라미터라고 말함 (뭐... 물론 다른사람도 있겠지만!) 또한 하이퍼파라미터 값은 격자형태(Grid, 왼쪽 네모칸)의 값을 선택하는것이 아닌 오른쪽 칸처럼 무작위로 선택하는걸 추천, 이유는 어느 하이퍼 파라미터가 중요한지는 누구도 모르기때문.

이전 1 2 3 다음

티스토리툴바