전체 글
-
시계열 이미지 처리 Baseline(RNN + CNN)딥러닝/딥러닝 Baseline 2024. 6. 27. 15:09
오랜만에 피드를 올린다.시계열 이미지 처리의 Baseline에 대해 설명 및 코드 구현을 하고자 한다. 시계열 이미지는 쉽게 말해 비디오라고 보면 된다. 비디오는 연속적인 이미지프레임을 겹쳐놓은 포맷이다.따라서 fps (frame per second) 값에 비디오의 자연스러움이 달라지는것을 같은 맥락으로 이해할 수 있다. ex) fps = 60 이면 1초에 60장 이미지 시계열 이미지를 처리하는 예는 일반적으로 1) CCTV 영상의 이상 감지2) 식물이 자라나는 이미지를 통해 성장 속도 및 생육 환경 예측3) 동작 / 패턴 분석 정도로 볼 수 있다, 기술적으로 우선 이미지이므로 CNN 구조가 필요하다. 그리고 직전 이미지들이 직후 이미지에 영향을 주는 즉, Recurrent한 데이터 구조이므로 RNN ..
-
Honey Tip 주요 개념 정리카테고리 없음 2023. 7. 12. 13:02
1) gray scale 이미지 차원 확장을 통해 input tensor input image = np.stack((tr_image[0],) , axis = -1) # image.shape = (28,28) gray scale 일 경우 위와 같이 np.stack을 통해서 차원확장하여 # input tensor에 입력한다 . 2) rnn sling window ### slicing window size 결정하는 문제또는 해당 슬라이싱을 유도하는 문제 def slicing_windows(df , timesteps): values = df.values datas = [] for i in range((len(df)- timesteps) + 1): datas.append(values[i:i+timestep]) r..
-
-
-
-
Colab을 활용해서 정형데이터 딥러닝으로 예측모델 만들기딥러닝/Colab을 활용한 정형데이터 & 딥러닝 2023. 4. 13. 14:53
Colab에 접속하여 Google drive mount 한다. 파일 -> 새노트 하기의 구글드라이브 마운트 버튼을 클릭하여 구글드라이브 마운팅한다. sample_data 폴더 상위에 drive가 하나 더 생성된것을 알 수 있다. MyDrive는 이제 내 로컬 또는 클라우드의 구글드라이브의 위치이니 해당위치에 csv파일 등 필요한 데이터를 옮겨서 사용하면 된다. 이때 딥러닝을 사용하고자 하니 GPU로 연산방법 변경이 필요하다. 위와 같이 런타임 -> 런타임 유형 변경에서 하드웨어 가속기 - GPU 변경 후 저장(클라우드에서 GPU를 사용하는것이므로 내컴퓨터 사양과는 무관하다) from google.colab import drive drive.mount('/content/drive/') # google dr..
-
평가 산식 (metrics) , 데이터 타입에 대한 대응머신러닝/FAQ 2023. 4. 13. 12:18
평가 산식은 일반적으로 예측 결과를 제출한 후에 right answer 와 prediction(예측값)의 차이에 대한 성능 지표이다. 위의 언급한 내용과 같이 평가에 대한 내용이라서 예측을 하는 참여자 입장에서 평가산식의 중요도는 최초에는 크지 않다. 다만 평가산식이 중요시하는 가치에 따라서 예측결과의 편향성을 고려해야하는 전제로 본다면 중요할 수 있는데 최초의 baseline의 제출에 있어서는 크게 중요시하지 않는다. 평가산식을 활용할 경우는 분류 문제에서 precision , recall 등의 편향성을 띈 산식을 사용하는 경우 ex) precision이면 predict probability를 아주 높게 하면 됨 , recall이면 모두 positive로 예측하면 됨 또는 , cross validati..
-
PCA를 활용한 차원 축소 방법머신러닝/FAQ 2023. 4. 13. 10:18
오랜만에 포스팅을 올립니다. PCA를 활용한 차원 축소는 일반적으로 정형데이터 feature(columns) 갯수가 많아 overfitting될 가능성이 있는 경우 해당 차원(일반적으로 feature 갯수 = 차원 갯수)에 대한 정보는 소실되지 않으면서 차원을 줄일 수 있는 방법이다. (자세한것은 구글에 PCA를 검색하면 쉽게 개념에 대해 접할 수 있음) 이번에는 아주 간략하게 PCA를 구현하는 파이썬 코드를 통해 만들어보고자 한다. 데이터는 데이콘의 전복나이예측경진대회의 데이터를 활용하였고, 방법은 어느 데이터든 동일하다. 참고로 featrue갯수가 많다는것은 보통 50개 이상 정도의 정형데이터의 차원에서 한번 try 해보는것을 추천한다. import pandas as pd import numpy as..