본문 바로가기

728x90

분류 전체보기

(81)
Transforms.Normalize()의 역할 파이썬에서 tensor로 이미지를 처리할 때 주로 transform.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))로 처리를 한다고 한다. 이는 이미지의 경우 픽셀 값 하나 하나가 0 ~ 255 값을 갖는데, tensor로 타입 변환 시 0 ~ 1 사이의 값으로 바뀌게 된다. 이를 -1 ~ 1 사이의 값으로 normalized 시켜서 이미지를 동일한 환경으로 어느정도 맞춰주어 학습을 진행하기 위해 사용하는 것이라고 한다! transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5)) 이렇게 한 번 Normalize 시켜주었던 이미지를 다시 복구시켜 확인하고 싶으면 아래처럼 값을 조정해주어야 한다. plt.imshow(transforms.T..
[PyTorch] DataLoader의 역할 및 사용법 DataLoader는 데이터를 미니 배치 단위로 나누어서 제공해주는 역할을 합니다. 학습을 하기 위해서 데이터를 읽어올 때 사용하게 됩니다. dataset 인자에는 pytorch Dataset 객체를 넣어주면 됩니다. DataLoader(dataset, batch_size=1, shuffle=False, sampler=None, batch_sampler=None, num_workers=0, collate_fn=None, pin_memory=False, drop_last=False, timeout=0, worker_init_fn=None, *, prefetch_factor=2, persistent_workers=False) 인자를 하나씩 살펴보겠습니다. - batch_size : 말 그대로 batch_si..
[PyTorch] Dataset Types 정리 (Map-style datasets, Iterable-style datasets) 파이토치에서는 크게 두 가지 타입의 데이터셋을 지원해줍니다. 1) Map-style datasets map-style datasets은 __getitem__()과 __len()__을 구현하는 데이터셋으로 index(key)를 통해 데이터에 접근할 수 있는 경우를 의미합니다. dataset[index]를 통해 데이터셋의 특정 데이터에 접근할 수 있는 형태입니다. from torch.utils.data import Dataset class MyMapDataset(Dataset): def __init__(self, data): self.data = data def __len__(self): return len(self.data) def __getitem__(self, index): return self.dat..
모델 큐레이션 사이트 모음 (모델 트렌드) 전반적인 모델의 트렌드를 파악하기 위한 모델 큐레이션 사이트 모음입니다. 새로운 분야를 공부하기 전 참고하면 좋을 것 같습니다. Papers with Code - The latest in Machine Learning Papers With Code highlights trending Machine Learning research and the code to implement it. paperswithcode.com Awesome Projects Deep Learning and deep reinforcement learning research papers and some codes endymecy.github.io
[논문] CoRGi : Content-Rich Graph Neural networks with Attention 본 글은 논문을 읽고 공부를 하는 과정에서 이해한 바를 번역 / 설명 해둔 글입니다. 혹시 동일 논문을 읽는 다른 분들께 도움이 되었으면 하여 정리해두나 잘못된 부분이나 부족한 부분이 있을 수 있습니다. 따라서 잘못된 부분 / 궁금한 부분이 있으면 언제든지 댓글 환영합니다.😄 Recsys 2021 온라인 학회에서 본 논문을 알게 되었다. GNN을 활용한 추천 시스템에 막 관심이 생길 무렵 학회를 듣게 되었고, 그래서 해당 논문이 눈에 띄었다. 특히 모델 이름이 "코기"라는 점이 참 귀여워서 더 궁금해지는 논문이었다. 🐶 CoRGi: Content-Rich Graph Neural Networks with Attention Graph representations of a target domain often ..
모수적 방법론, 비모수적 방법론, 모수 추정 모수적(parametric) 방법론이란? 데이터가 특정한 확률분포(ex. 정규분포, 이항분포)를 따른다고 전제한 후, 그 분포의 모수에 대한 검정을 실시하는 방법 비모수적(nonparametric) 방법론이란? 데이터가 특정한 확률분포를 따른다고 전제할 수 없거나 모집단에 대한 정보가 전혀 없을 때 실시하는 방법 특정 확률분포를 가정하지 않고, 데이터에 따라 모델의 구조 및 모수의 개수가 유연하게 바뀜 * 기계학습의 많은 방법론은 비모수 방법론에 속함 데이터로 모수를 추정해보자! 데이터의 확률분포를 가정했으면 모수를 추정해볼 수가 있음 잘 알고있는 정규분ㅍ의 경우 모수의 평균과 분산 추정량은 다음과 같음 $$\bar{X} = \frac{1}{N}\sum_{i=1}^{N}{X_i} $$ $$S^2 = \f..
몬테카를로 샘플링 (Monte Carlo) 실제로 기계학습에 데이터를 적용할 때에는 확률분포를 알 수 없는 경우가 대부분이다. 이 때 가지고 있는 데이터를 이용하여 기대값을 알아내기 위해 몬테카를로 샘플링 방법을 사용할 수 있다. 몬테카를로 샘플링이란? 반복된 무작위 추출을 이용하여 함수의 값을 근사하는 알고리즘을 의미한다. ex) 표본 공간의 확률분포에서 임의로 표본을 뽑아서 표본에 대한 계산 수행 - 정사각형내에 내접하는 원의 넓이를 구할 때, - 정사각형 내에 1만 개의 난수 순서쌍이 존재한다고 가정 - (x, y) 좌표를 무작위로 추출한 뒤, 원의 범위에 포함된 비율을 계산하여 원의 넓이를 근사할 수 있음
조건부확률과 기댓값 조건부확률이란? 어떠한 사건 A가 일어났을 때 사건 B가 일어날 확률을 의미 1) 분류 문제 (이산형) - softmax(W*x + b)를 통해 P(y|x)를 구함 즉, x가 주어졌을 때의 y(정답)값을 찾는 것 2) 회귀 문제 (연속형) - 조건부 기대값을 추정함 - E[y|x] - 확률 변수 x가 주어졌을 때 y의 기대값 기댓값이란? 각 사건이 일어났을 때의 값과 그 사건이 벌어질 확률을 곱한 것 이는 확률적으로 어떤 사건이 일어났을 때 얻을 수 있는 값의 평균같은 의미 - 이산확률분포의 경우에는 확률 * 해당 값을 더해줌 - 연속활류분포의 경우에는 적분 해줌 기계학습에서는 데이터에서 추출된 패턴을 기반으로 확률을 해석하는 데에 조건부확률을 사용함!

728x90