전체 글

Developer's Delight

    [Poetry] requirements.txt 파일로 Poetry에 import 하기

    먼저, 파이썬 프로젝트 관리를 위해 Poetry를 사용하는 분들이 많습니다. 이 글을 읽으시는 분들은 Poetry를 처음 활용하여 기존의 requirements.txt를 이용한 환경을 변환하기 위한 분일 것이라 생각합니다. Poetry는 훌륭한 선택이며, Poetry가 표준으로 자리 잡기를 희망합니다.이제 더 이상 간소한 requirements.txt 파일을 사용하지 않고 의존성을 Poetry로 옮기고, 올바른 버전 추적을 포함한 모든 것을 처리하게 할 차례입니다.이미 Poetry 프로젝트를 초기화하고 프로젝트 루트에 pyproject.yml 파일이 있는 것으로 가정합니다. 그렇지 않은 경우 다음 명령을 실행하여 Poetry를 사용하여 파이썬 프로젝트를 초기화합니다:poetry init이제 require..

    Time Series Data Augmentation for Deep Learning: A Survey

    Time Series Data Augmentation for Deep Learning: A Survey

    "Time Series Data Augmentation for Deep Learning: A Survey"는 딥러닝에서 시계열 데이터 증강에 대한 연구 동향과 적용 가능한 기법들을 상세히 조사한 논문입니다. 아래는 논문 내용의 상세한 설명입니다.1. Introduction1) paper Information30th International Joint Conference on Artifical Intelligence(IJCAI 2021) Accepted PaperDeep Learning 시계열 데이터 분석 전반에 사용될 수 있는 Data Augmentation 기법들을 정리한 논문글 작성 시점 (2024. 05. 06) 기준으로 681회 인용된 논문2) Backgrounds딥러닝은 컴퓨터 비전, 자연어 처..

    학습률 웜업(Learning Rate WarmUp)에 대한 이해

    학습률 웜업(Learning Rate WarmUp)에 대한 이해

    소개딥러닝 모델을 효과적으로 학습시키기 위해서는 적절한 학습률(learning rate)을 설정하는 것이 매우 중요합니다. 학습률은 모델이 가중치를 업데이트하는 속도를 조절하는 매개변수로, 너무 높거나 낮으면 학습이 제대로 이루어지지 않을 수 있습니다. 이 중에서도 학습률을 초기에 적절히 설정하는 것이 중요한데, 이를 위해 사용되는 기법 중 하나가 학습률 웜업(Learning Rate WarmUp)입니다.학습률 웜업이란?학습률 웜업은 딥러닝 모델의 초기 학습 단계에서 학습률을 서서히 증가시키는 기법입니다. 이는 모델이 초기에는 불안정하고 예측이 부정확할 수 있으며, 학습률을 너무 높게 설정하면 그러한 불안정성이 더욱 심해질 수 있기 때문에 사용됩니다. 학습률 웜업을 통해 모델이 초기에 안정성을 유지하면서..

    [REVIEW] 사랑은 내 시간을 기꺼이 건네주는 것이다, 이기주

    [REVIEW] 사랑은 내 시간을 기꺼이 건네주는 것이다, 이기주

    해외로 여행을 떠나기 전의 관문인 인천공항에 도착하면 항상 공항서점에 들른다. 비행기에서 읽을 책을 가방에 두둑이 챙겨왔음에도 서점을 그냥 지나치지 못한다.점원분들이 신경써서 나열한 책들을 천천히 살펴보고 있으면 요즘 트렌드 파악과 공통적인 관심사가 무엇인지 알 수 있어서 좋다. 20살때 부터 서점을 찾아가 무턱대고 앉아 책을 읽던 시기부터 느껴온 것은 변함없이 사랑받는 책은 사랑과 자기발전에 관한 책들일 것이다. 물론, 나도 그 분야의 책들을 좋아한다.이번 로마로의 여행길에 오르기 전 내 눈에 띄인건 이기주 작가님의 '사랑은 내 시간을 기꺼이 건네주는 것이다' 란 제목의 책이다."사랑은 내 시간을 기꺼이 건네주는 것이다." 이 문구는 사랑에 대한 아름다운 해석을 담고 있다. 사랑은 우리가 소중히 여기는..

    [Tensorflow/keras] Tensorflow용 DataLoader 만들기

    딥러닝 모델을 훈련시키기 위해서는 종종 대규모 데이터셋이 필요합니다. 그러나 모든 데이터를 메모리에 로드하고 유지하는 것은 실용적이지 않을 수 있습니다. 이런 경우에는 데이터를 실시간으로 생성하여 모델에 제공할 수 있는 데이터 생성기를 사용하는 것이 좋습니다.PyTorch의 DataLoader는 데이터셋을 미니 배치로 나누어 모델에 공급하는 역할을 합니다. 이는 데이터를 반복하고 전처리하는 작업을 추상화하여 사용자가 모델 학습에 집중할 수 있도록 합니다.Keras에서 데이터 생성기를 사용하는 방법은 메모리에 맞지 않는 대규모 데이터셋을 효율적으로 처리하는 강력한 방법입니다. Keras는 사용자 정의 데이터 생성기를 만들기 위한 기반 클래스로 Sequence 클래스를 제공합니다.단계 1: 사용자 정의 데이..

    [PyTorch] DataLoader 멀티프로세싱하기

    PyTorch의 DataLoader는 데이터셋을 미니 배치로 나누어 모델에 공급하는 역할을 합니다. 이는 데이터를 반복하고 전처리하는 작업을 추상화하여 사용자가 모델 학습에 집중할 수 있도록 합니다.DataLoader의 주요 기능미니 배치 처리: DataLoader는 데이터셋을 지정된 배치 크기로 나누어 모델에 제공합니다. 이는 GPU와 같은 가속기를 통해 병렬 처리를 가능하게 합니다.데이터 셔플링: 학습 데이터의 순서를 무작위로 섞음으로써 모델의 일반화 성능을 향상시킵니다.병렬 처리: DataLoader는 여러 작업자(worker)를 사용하여 데이터를 병렬로 로드할 수 있습니다. 이를 통해 데이터 로딩 과정을 가속화할 수 있습니다.데이터 변환(Transform): DataLoader는 데이터를 로드하기..