diff --git a/beginner_source/data_loading_tutorial.py b/beginner_source/data_loading_tutorial.py index 9571226c3..d08bff6aa 100644 --- a/beginner_source/data_loading_tutorial.py +++ b/beginner_source/data_loading_tutorial.py @@ -8,7 +8,7 @@ **번역** : `정윤성 `__, `박정환 `__ 머신러닝 문제를 푸는 과정에서 데이터를 준비하는데 많은 노력이 필요합니다. -PyTorch는 데이터를 불러오는 과정을 쉽게해주고, 또 잘 사용한다면 코드의 가독성도 보다 높여줄 수 있는 도구들을 +PyTorch는 데이터를 불러오는 과정을 쉽게 해주고, 또 잘 사용한다면 코드의 가독성도 보다 높여줄 수 있는 도구들을 제공합니다. 이 튜토리얼에서 일반적이지 않은 데이터셋으로부터 데이터를 읽어오고 전처리하고 증가하는 방법을 알아보겠습니다. @@ -62,7 +62,7 @@ # 1084239450_e76e00b7e7.jpg,70,236,71,257, ... ,128,312 # # 이제 CSV에서 이미지 이름과 그에 해당하는 데이터(annotation)을 가져와 보겠습니다. 예시로 person-7.jpg가 있는 -# 65번째 줄(row index number)을 가져오겠습니다.이미지 이름을 읽어 ``img_name`` 에 저장하고, 데이터는 (L, 2) +# 65번째 줄(row index number)을 가져오겠습니다. 이미지 이름을 읽어 ``img_name`` 에 저장하고, 데이터는 (L, 2) # 배열인 ``landmarks`` 에 저장합니다. 이 때 L은 해당 행의 랜드마크의 개수입니다. landmarks_frame = pd.read_csv('data/faces/face_landmarks.csv') @@ -109,7 +109,7 @@ def show_landmarks(image, landmarks): # 이제 데이터셋 클래스를 만들어보도록 하겠습니다. # ``__init__`` 을 사용해서 CSV 파일 안에 있는 데이터를 읽지만, # ``__getitem__`` 을 이용해서 이미지의 판독을 합니다. -# 이 방법은 모든 이미지를 메모리에 저장하지 않고 필요할때마다 읽기 때문에 +# 이 방법은 모든 이미지를 메모리에 저장하지 않고 필요할 때마다 읽기 때문에 # 메모리를 효율적으로 사용합니다. # # 데이터셋의 샘플은 ``{'image': image, 'landmarks': landmarks}`` 의 사전 형태를 갖습니다. @@ -153,7 +153,7 @@ def __getitem__(self, idx): ###################################################################### # 클래스를 인스턴스화 하고 데이터 샘플을 통해서 반복해봅시다. -# 첫번째 4개의 샘플의 크기를 출력 하고, 샘플들의 랜드마크(landmarks)를 보여줄 것 입니다. +# 처음 4개의 샘플의 크기를 출력 하고, 샘플들의 랜드마크(landmarks)를 보여줄 것입니다. # face_dataset = FaceLandmarksDataset(csv_file='data/faces/face_landmarks.csv', @@ -183,7 +183,7 @@ def __getitem__(self, idx): # 대부분의 신경망(neural networks)은 고정된 크기의 이미지를 입력으로 받는 것을 가정하고 있습니다. # 그러므로 몇 가지 전처리 코드를 작성하도록 하겠습니다. # -# 다음의 3가지의 변형(transforms)을 만들어 보겠습니다: +# 다음 3가지의 변형(transforms)을 만들어 보겠습니다: # # - ``Rescale``: 이미지의 크기를 조절합니다. # - ``RandomCrop``: 이미지를 무작위로 자릅니다. @@ -368,7 +368,7 @@ def __call__(self, sample): # # ``torch.utils.data.DataLoder`` 는 위와 같은 기능을 모두 제공해주는 반복자(iterator)입니다. # 여기에 사용되는 매개변수(parameter)들은 명확해야 합니다. -# 관심있게 살펴볼 매개변수 중 하나느 ``collate_fn`` 입니다. +# 관심있게 살펴볼 매개변수 중 하나는 ``collate_fn`` 입니다. # ``collate_fn`` 을 사용하여 샘플들을 어떻게 일괄적으로 처리해야 하는지를 지정할 수 있습니다. # 하지만 대부분의 경우에는 기본 함수가 잘 동작합니다.