From 659bc24ebcd906441fe113cd692c0eabb0e76901 Mon Sep 17 00:00:00 2001 From: jykimai Date: Sun, 3 May 2026 00:14:55 +0900 Subject: [PATCH 1/5] =?UTF-8?q?=EC=98=A4=ED=83=88=EC=9E=90=20=EC=88=98?= =?UTF-8?q?=EC=A0=95beginner=5Fsource/data=5Floading=5Ftutorial.py?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- beginner_source/data_loading_tutorial.py | 6 +++--- 1 file changed, 3 insertions(+), 3 deletions(-) diff --git a/beginner_source/data_loading_tutorial.py b/beginner_source/data_loading_tutorial.py index 9571226c3..43ee97c49 100644 --- a/beginner_source/data_loading_tutorial.py +++ b/beginner_source/data_loading_tutorial.py @@ -8,7 +8,7 @@ **번역** : `정윤성 `__, `박정환 `__ 머신러닝 문제를 푸는 과정에서 데이터를 준비하는데 많은 노력이 필요합니다. -PyTorch는 데이터를 불러오는 과정을 쉽게해주고, 또 잘 사용한다면 코드의 가독성도 보다 높여줄 수 있는 도구들을 +PyTorch는 데이터를 불러오는 과정을 쉽게 해주고, 또 잘 사용한다면 코드의 가독성도 보다 높여줄 수 있는 도구들을 제공합니다. 이 튜토리얼에서 일반적이지 않은 데이터셋으로부터 데이터를 읽어오고 전처리하고 증가하는 방법을 알아보겠습니다. @@ -109,7 +109,7 @@ def show_landmarks(image, landmarks): # 이제 데이터셋 클래스를 만들어보도록 하겠습니다. # ``__init__`` 을 사용해서 CSV 파일 안에 있는 데이터를 읽지만, # ``__getitem__`` 을 이용해서 이미지의 판독을 합니다. -# 이 방법은 모든 이미지를 메모리에 저장하지 않고 필요할때마다 읽기 때문에 +# 이 방법은 모든 이미지를 메모리에 저장하지 않고 필요할 때마다 읽기 때문에 # 메모리를 효율적으로 사용합니다. # # 데이터셋의 샘플은 ``{'image': image, 'landmarks': landmarks}`` 의 사전 형태를 갖습니다. @@ -368,7 +368,7 @@ def __call__(self, sample): # # ``torch.utils.data.DataLoder`` 는 위와 같은 기능을 모두 제공해주는 반복자(iterator)입니다. # 여기에 사용되는 매개변수(parameter)들은 명확해야 합니다. -# 관심있게 살펴볼 매개변수 중 하나느 ``collate_fn`` 입니다. +# 관심있게 살펴볼 매개변수 중 하나는 ``collate_fn`` 입니다. # ``collate_fn`` 을 사용하여 샘플들을 어떻게 일괄적으로 처리해야 하는지를 지정할 수 있습니다. # 하지만 대부분의 경우에는 기본 함수가 잘 동작합니다. From c329f105d2c63bc91c35089dbbc90255c0ddd814 Mon Sep 17 00:00:00 2001 From: jykimai Date: Sun, 3 May 2026 00:55:11 +0900 Subject: [PATCH 2/5] =?UTF-8?q?=EC=9A=A9=EC=96=B4=20=EC=82=AC=EC=A0=84=20?= =?UTF-8?q?=EC=B6=94=EA=B0=80(landmark)?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- TRANSLATION_GUIDE.md | 1 + 1 file changed, 1 insertion(+) diff --git a/TRANSLATION_GUIDE.md b/TRANSLATION_GUIDE.md index d10cb1107..0ae90a78d 100644 --- a/TRANSLATION_GUIDE.md +++ b/TRANSLATION_GUIDE.md @@ -81,6 +81,7 @@ |instance|인스턴스|박정환|음차 표기| |instantiate|생성하다|박정환|| |interpreter|인터프리터|이종법|음차 표기| +|landmark|랜드마크|김정연|음차 표기| |Layer|계층|박정환|| |learning rate, lr|학습률|박정환|| |loss|손실|박정환|| From 3738bfc2211cd9ce883b67ef973c33db0c956ced Mon Sep 17 00:00:00 2001 From: jykimai Date: Sun, 3 May 2026 20:29:53 +0900 Subject: [PATCH 3/5] Delete TRANSLATION_GUIDE.md --- TRANSLATION_GUIDE.md | 124 ------------------------------------------- 1 file changed, 124 deletions(-) delete mode 100644 TRANSLATION_GUIDE.md diff --git a/TRANSLATION_GUIDE.md b/TRANSLATION_GUIDE.md deleted file mode 100644 index 0ae90a78d..000000000 --- a/TRANSLATION_GUIDE.md +++ /dev/null @@ -1,124 +0,0 @@ -# 일반 규칙 - -* 번역된 문서만으로도 내용을 이해할 수 있도록 문서를 번역해야 합니다. - * 기계적인 번역이나 피상적인 리뷰는 지양해주세요. - * 일반 명사와 Class 이름은 구분하여 번역을 하거나 원문을 표기합니다. (예. 데이터셋과 Dataset) - -* 반드시 1:1로 번역하지 않아도 됩니다. - * 이해를 돕기 위한 (약간의) 의역이나 설명을 추가해도 좋습니다. - * 단, 원문의 의미가 다르게 해석될 여지가 있는 경우에는 자제해주세요. - * 문장 단위는 쉬운 유지보수를 위해 가급적 지켜주시기를 요청드립니다. - * 하지만 문장이 여러 줄에 걸쳐 조각나 있는 경우 등에는 한 줄에 하나의 문장으로 모아주셔도 됩니다. - -* 의미없는 주어는 생략해주세요. - * 예를 들어, `we`는 강조의 의미가 있지 않는 이상 번역하지 않고 생략합니다. - -* 기본적인 reStructuredText 문법은 숙지해주세요. - * [Quick reStructredText](https://docutils.sourceforge.io/docs/user/rst/quickref.html) 등의 문서를 참고하여 문법을 익혀주세요. - * 이미 번역된 문서들을 참고하셔도 좋습니다. (예. \` 뒤에 한글 작성 시 공백 또는 \\이 필요합니다.) - * 번역 후에는 `make html-noplot` 등의 명령어로 문법 오류를 확인해주세요. - * 번역 결과물에 \`, * 또는 _ 등의 기호를 검색하면 자주 실수하는 문법 오류를 쉽게 찾을 수 있습니다. - -* 번역된 문장만으로 의미를 전달하기 어려울 때에는 `한글(영어)`와 같이 작성합니다. - * 제목과 본문에 각각 사용되는 경우 첫번째로 해당 용어가 출현하였을 때 매번 함께 작성합니다. - * 예. including transposing, indexing, ... => 전치(transposing), 인덱싱(indexing), ... - * 가급적 한 번씩만 함께 작성하는 것을 원칙으로 하지만 번역자가 임의로 여러번 함께 작성할 수 있습니다. - * 예. 직렬화(Serialize) - -* 소스 코드, 논문 제목, 출력 결과 등은 가급적 번역하지 않습니다. - * 단, 소스 코드에 포함된 주석은 가급적 번역합니다. - * 원문을 함께 찾아볼 필요가 있는 논문 제목 등은 번역 시 전체 원문을 함께 작성합니다. - * 명령어의 출력 결과, 로그(log) 등은 결과 비교를 위해 번역하지 않습니다. - -* 줄바꿈 및 공백은 가급적 원문과 동일하게 유지합니다. - * 이후 원본 문서에 추가적인 변경이 발생할 때 유지보수를 돕습니다. - * 너무 긴 문장은 reStructuredText 문법을 지키는 선에서 줄바꿈을 추가해도 좋습니다. - -# 용어 사용 규칙 - -1. 아래 용어가 적절하면 가급적 아래 표의 용어를 사용합니다. -1. 지정된 용어가 없다면 아래 사이트를 참고하여 사용합니다. - * http://www.ktword.co.kr/ - * https://github.com/keunwoochoi/machine_learning_eng2kor/blob/master/dictionary.md -1. 적절한 용어가 없으면 적절한 단어를 새로 사용하고, 아래 목록에 내용을 추가합니다. - -|영문|한글|작성자|추가 설명| -|---|---|:---:|---| -|Acknowledgements|감사의 말|박정환|| -|activation|활성화|조형서|| -|API endpoint|API 엔드포인트|박정환|음차 표기| -|argument|인자|박정환|| -|attribution|속성|정휘수|| -|Audio|오디오|박정환|ToC의 분류명입니다.| -|augmentation|증강|이재복|| -|autograd|Autograd|황성수|번역안함| -|Batch Normalization|배치 정규화|박정환|| -|bias|편향|이하람|| -|CUDA|CUDA|박지은|번역안함| -|confusion matrix|혼동 행렬|김민엽|| -|convolution|합성곱|김현길|| -|Dropout|드롭아웃|김태형|음차 표기| -|dataset|데이터셋|박정환|음차 표기| -|deep neural network|심층 신경망|박정환|| -|derivative|도함수|박정환|| -|Drop-out|Drop-out|황성수|번역안함| -|embedding|임베딩|하동훈|음차 표기| -|epoch|에폭|박정환|음차 표기| -|evaluation mode|평가 모드|박정환|| -|Fine-tuning|미세 조정|오왕택|| -|feature|특징|백선희|| -|feed data through model|데이터를 모델에 제공||| -|Feed-forward network|순전파 신경망|박정환|| -|freezing|동결|김지호|| -|Generative|생성 모델|박정환|ToC의 분류명입니다.| -|Getting Started tutorial|시작하기 튜토리얼|박정환|ToC의 Getting Started를 뜻합니다.| -|gradient|변화도|박정환|| -|Hyperparameter|하이퍼파라미터|김태영|음차 표기| -|inference|추론|박지은|| -|Image|이미지|박정환|ToC의 분류명입니다.| -|in-place|제자리|허남규|| -|initialization|초기화|김지호|| -|instance|인스턴스|박정환|음차 표기| -|instantiate|생성하다|박정환|| -|interpreter|인터프리터|이종법|음차 표기| -|landmark|랜드마크|김정연|음차 표기| -|Layer|계층|박정환|| -|learning rate, lr|학습률|박정환|| -|loss|손실|박정환|| -|matrix|행렬|박정환|| -|mean-squared error|평균제곱오차|허남규|| -|MelScale|MelScale||| -|memory footprint|메모리 전체 사용량|최흥준| -|method|메소드|장효영|[음차 표기](https://terms.tta.or.kr/dictionary/dictionaryView.do?word_seq=090780-1)| -|mini-batch|미니 배치|박정환|음차 표기| -|momentum|모멘텀|박정환|음차 표기| -|normalize|정규화|허남규|| -|NumPy|NumPy|박정환|번역하지 않음| -|One-Hot|One-Hot|황성수|번역안함| -|Optimizer|옵티마이저|박정환|음차 표기| -|output|출력|박정환|| -|over-fitting|과적합|황성수|| -|parameter|매개변수|박정환|| -|placeholder|플레이스홀더|박정환|음차 표기| -|plotting|도식화|황성수|| -|Production (environment, use)|Production|허남규|번역하지 않음| -|pruning|가지치기|김지호|| -|rank 0|0-순위|박정환|| -|Read later|더 읽을거리|박정환|| -|recap|요약|박정환|| -|recipe|레시피|이현준|음차 표기| -|resample|리샘플||| -|resizing|크기 변경|박정환|| -|requirements|요구 사항|장보윤|| -|sampling rate|샘플링 레이트||| -|scenario|시나리오|박정환|음차 표기| -|shading|샤딩|오수연|음차 표기| -|shape|shape|허남규|번역하지 않음| -|size|크기|박정환|| -|Tensor / Tensors|Tensor|박정환|번역하지 않음| -|Text|텍스트|박정환|ToC의 분류명입니다.| -|track (computation) history|연산 기록을 추적하다|박정환|| -|training|학습|이하람|| -|warmstart|빠르게 시작하기|박정환|Warmstarting Model = 빠르게 모델 시작하기| -|weight|가중치|박정환|| -|wrapper|래퍼|박정환|음차 표기| From c266ceb45dc2645cb63f2562c8d4556ebd56a9aa Mon Sep 17 00:00:00 2001 From: jykimai Date: Sun, 3 May 2026 20:47:25 +0900 Subject: [PATCH 4/5] Restore translation guide --- TRANSLATION_GUIDE.md | 123 +++++++++++++++++++++++++++++++++++++++++++ 1 file changed, 123 insertions(+) create mode 100644 TRANSLATION_GUIDE.md diff --git a/TRANSLATION_GUIDE.md b/TRANSLATION_GUIDE.md new file mode 100644 index 000000000..d10cb1107 --- /dev/null +++ b/TRANSLATION_GUIDE.md @@ -0,0 +1,123 @@ +# 일반 규칙 + +* 번역된 문서만으로도 내용을 이해할 수 있도록 문서를 번역해야 합니다. + * 기계적인 번역이나 피상적인 리뷰는 지양해주세요. + * 일반 명사와 Class 이름은 구분하여 번역을 하거나 원문을 표기합니다. (예. 데이터셋과 Dataset) + +* 반드시 1:1로 번역하지 않아도 됩니다. + * 이해를 돕기 위한 (약간의) 의역이나 설명을 추가해도 좋습니다. + * 단, 원문의 의미가 다르게 해석될 여지가 있는 경우에는 자제해주세요. + * 문장 단위는 쉬운 유지보수를 위해 가급적 지켜주시기를 요청드립니다. + * 하지만 문장이 여러 줄에 걸쳐 조각나 있는 경우 등에는 한 줄에 하나의 문장으로 모아주셔도 됩니다. + +* 의미없는 주어는 생략해주세요. + * 예를 들어, `we`는 강조의 의미가 있지 않는 이상 번역하지 않고 생략합니다. + +* 기본적인 reStructuredText 문법은 숙지해주세요. + * [Quick reStructredText](https://docutils.sourceforge.io/docs/user/rst/quickref.html) 등의 문서를 참고하여 문법을 익혀주세요. + * 이미 번역된 문서들을 참고하셔도 좋습니다. (예. \` 뒤에 한글 작성 시 공백 또는 \\이 필요합니다.) + * 번역 후에는 `make html-noplot` 등의 명령어로 문법 오류를 확인해주세요. + * 번역 결과물에 \`, * 또는 _ 등의 기호를 검색하면 자주 실수하는 문법 오류를 쉽게 찾을 수 있습니다. + +* 번역된 문장만으로 의미를 전달하기 어려울 때에는 `한글(영어)`와 같이 작성합니다. + * 제목과 본문에 각각 사용되는 경우 첫번째로 해당 용어가 출현하였을 때 매번 함께 작성합니다. + * 예. including transposing, indexing, ... => 전치(transposing), 인덱싱(indexing), ... + * 가급적 한 번씩만 함께 작성하는 것을 원칙으로 하지만 번역자가 임의로 여러번 함께 작성할 수 있습니다. + * 예. 직렬화(Serialize) + +* 소스 코드, 논문 제목, 출력 결과 등은 가급적 번역하지 않습니다. + * 단, 소스 코드에 포함된 주석은 가급적 번역합니다. + * 원문을 함께 찾아볼 필요가 있는 논문 제목 등은 번역 시 전체 원문을 함께 작성합니다. + * 명령어의 출력 결과, 로그(log) 등은 결과 비교를 위해 번역하지 않습니다. + +* 줄바꿈 및 공백은 가급적 원문과 동일하게 유지합니다. + * 이후 원본 문서에 추가적인 변경이 발생할 때 유지보수를 돕습니다. + * 너무 긴 문장은 reStructuredText 문법을 지키는 선에서 줄바꿈을 추가해도 좋습니다. + +# 용어 사용 규칙 + +1. 아래 용어가 적절하면 가급적 아래 표의 용어를 사용합니다. +1. 지정된 용어가 없다면 아래 사이트를 참고하여 사용합니다. + * http://www.ktword.co.kr/ + * https://github.com/keunwoochoi/machine_learning_eng2kor/blob/master/dictionary.md +1. 적절한 용어가 없으면 적절한 단어를 새로 사용하고, 아래 목록에 내용을 추가합니다. + +|영문|한글|작성자|추가 설명| +|---|---|:---:|---| +|Acknowledgements|감사의 말|박정환|| +|activation|활성화|조형서|| +|API endpoint|API 엔드포인트|박정환|음차 표기| +|argument|인자|박정환|| +|attribution|속성|정휘수|| +|Audio|오디오|박정환|ToC의 분류명입니다.| +|augmentation|증강|이재복|| +|autograd|Autograd|황성수|번역안함| +|Batch Normalization|배치 정규화|박정환|| +|bias|편향|이하람|| +|CUDA|CUDA|박지은|번역안함| +|confusion matrix|혼동 행렬|김민엽|| +|convolution|합성곱|김현길|| +|Dropout|드롭아웃|김태형|음차 표기| +|dataset|데이터셋|박정환|음차 표기| +|deep neural network|심층 신경망|박정환|| +|derivative|도함수|박정환|| +|Drop-out|Drop-out|황성수|번역안함| +|embedding|임베딩|하동훈|음차 표기| +|epoch|에폭|박정환|음차 표기| +|evaluation mode|평가 모드|박정환|| +|Fine-tuning|미세 조정|오왕택|| +|feature|특징|백선희|| +|feed data through model|데이터를 모델에 제공||| +|Feed-forward network|순전파 신경망|박정환|| +|freezing|동결|김지호|| +|Generative|생성 모델|박정환|ToC의 분류명입니다.| +|Getting Started tutorial|시작하기 튜토리얼|박정환|ToC의 Getting Started를 뜻합니다.| +|gradient|변화도|박정환|| +|Hyperparameter|하이퍼파라미터|김태영|음차 표기| +|inference|추론|박지은|| +|Image|이미지|박정환|ToC의 분류명입니다.| +|in-place|제자리|허남규|| +|initialization|초기화|김지호|| +|instance|인스턴스|박정환|음차 표기| +|instantiate|생성하다|박정환|| +|interpreter|인터프리터|이종법|음차 표기| +|Layer|계층|박정환|| +|learning rate, lr|학습률|박정환|| +|loss|손실|박정환|| +|matrix|행렬|박정환|| +|mean-squared error|평균제곱오차|허남규|| +|MelScale|MelScale||| +|memory footprint|메모리 전체 사용량|최흥준| +|method|메소드|장효영|[음차 표기](https://terms.tta.or.kr/dictionary/dictionaryView.do?word_seq=090780-1)| +|mini-batch|미니 배치|박정환|음차 표기| +|momentum|모멘텀|박정환|음차 표기| +|normalize|정규화|허남규|| +|NumPy|NumPy|박정환|번역하지 않음| +|One-Hot|One-Hot|황성수|번역안함| +|Optimizer|옵티마이저|박정환|음차 표기| +|output|출력|박정환|| +|over-fitting|과적합|황성수|| +|parameter|매개변수|박정환|| +|placeholder|플레이스홀더|박정환|음차 표기| +|plotting|도식화|황성수|| +|Production (environment, use)|Production|허남규|번역하지 않음| +|pruning|가지치기|김지호|| +|rank 0|0-순위|박정환|| +|Read later|더 읽을거리|박정환|| +|recap|요약|박정환|| +|recipe|레시피|이현준|음차 표기| +|resample|리샘플||| +|resizing|크기 변경|박정환|| +|requirements|요구 사항|장보윤|| +|sampling rate|샘플링 레이트||| +|scenario|시나리오|박정환|음차 표기| +|shading|샤딩|오수연|음차 표기| +|shape|shape|허남규|번역하지 않음| +|size|크기|박정환|| +|Tensor / Tensors|Tensor|박정환|번역하지 않음| +|Text|텍스트|박정환|ToC의 분류명입니다.| +|track (computation) history|연산 기록을 추적하다|박정환|| +|training|학습|이하람|| +|warmstart|빠르게 시작하기|박정환|Warmstarting Model = 빠르게 모델 시작하기| +|weight|가중치|박정환|| +|wrapper|래퍼|박정환|음차 표기| From a5e24dfc393e6f137a86cb4b290713fa4e04e8ce Mon Sep 17 00:00:00 2001 From: jykimai Date: Sun, 3 May 2026 21:06:56 +0900 Subject: [PATCH 5/5] =?UTF-8?q?fix:=20=EB=A6=AC=EB=B7=B0=20=EB=B0=98?= =?UTF-8?q?=EC=98=81=20(=EB=9D=84=EC=96=B4=EC=93=B0=EA=B8=B0=20=EB=B0=8F?= =?UTF-8?q?=20=ED=91=9C=ED=98=84=20=EC=88=98=EC=A0=95)?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- beginner_source/data_loading_tutorial.py | 6 +++--- 1 file changed, 3 insertions(+), 3 deletions(-) diff --git a/beginner_source/data_loading_tutorial.py b/beginner_source/data_loading_tutorial.py index 43ee97c49..d08bff6aa 100644 --- a/beginner_source/data_loading_tutorial.py +++ b/beginner_source/data_loading_tutorial.py @@ -62,7 +62,7 @@ # 1084239450_e76e00b7e7.jpg,70,236,71,257, ... ,128,312 # # 이제 CSV에서 이미지 이름과 그에 해당하는 데이터(annotation)을 가져와 보겠습니다. 예시로 person-7.jpg가 있는 -# 65번째 줄(row index number)을 가져오겠습니다.이미지 이름을 읽어 ``img_name`` 에 저장하고, 데이터는 (L, 2) +# 65번째 줄(row index number)을 가져오겠습니다. 이미지 이름을 읽어 ``img_name`` 에 저장하고, 데이터는 (L, 2) # 배열인 ``landmarks`` 에 저장합니다. 이 때 L은 해당 행의 랜드마크의 개수입니다. landmarks_frame = pd.read_csv('data/faces/face_landmarks.csv') @@ -153,7 +153,7 @@ def __getitem__(self, idx): ###################################################################### # 클래스를 인스턴스화 하고 데이터 샘플을 통해서 반복해봅시다. -# 첫번째 4개의 샘플의 크기를 출력 하고, 샘플들의 랜드마크(landmarks)를 보여줄 것 입니다. +# 처음 4개의 샘플의 크기를 출력 하고, 샘플들의 랜드마크(landmarks)를 보여줄 것입니다. # face_dataset = FaceLandmarksDataset(csv_file='data/faces/face_landmarks.csv', @@ -183,7 +183,7 @@ def __getitem__(self, idx): # 대부분의 신경망(neural networks)은 고정된 크기의 이미지를 입력으로 받는 것을 가정하고 있습니다. # 그러므로 몇 가지 전처리 코드를 작성하도록 하겠습니다. # -# 다음의 3가지의 변형(transforms)을 만들어 보겠습니다: +# 다음 3가지의 변형(transforms)을 만들어 보겠습니다: # # - ``Rescale``: 이미지의 크기를 조절합니다. # - ``RandomCrop``: 이미지를 무작위로 자릅니다.