본문 바로가기

Project

(6)
[Deep Learning] Gerhard Richter 소개하기 (자연어 처리, GAN) 프로젝트 명 : 게르하르트 리히터 전 - 우연성의 흐릿한 이미지 프로젝트 기간 : 2022.07.22. ~ 2022.07.27. 프로젝트 내용 : 게르하르트 리히터에 대한 소개와 이미지 처리가 있는 가상의 전시 구성해 보기 사용 데이터 : GOPRO 사진 데이터, Gerhard Richter 그림 이미지, Gerhard Richter에 대한 문서들 사용 방법 : 자연어 처리, Knowledge Graph, BERT Summerizer, GAN 주제 의식 예전에 미디어 전시 프로그램에 연구 보조원으로 참여한 적이 있습니다. 거기서 제가 맡은 업무는 인상파나 간송 등 다양한 주제로 구성된 미디어 아트 전시를 찾은 관람객들의 설문 내용을 분석하는 일이었습니다. 분석을 하면서 생각보다 원본 전시와 미디어 아트 ..
[Machine Learning & Data Engineering] 시집 데이터를 분류해 추천하는 서비스를 웹으로 구현해보기 - 후기 프로젝트 개요 프로젝트 명 : 시를 잊은 그대에게 - 취향에 맞는 시집을 분류해 추천드립니다 프로젝트 기간 : 2022년 6월 22 ~ 2022년 6월 27일 사용 데이터 : 알라딘, DBPia에서 파싱한 데이터 사용 모델 : K-means Clustering 웹 : Flask, Google Data Studio 이전부터 한 번은 해보고 싶었던 출판-문학을 주제로 프로젝트를 진행할 수 있어 하는 동안 즐거웠습니다. 웹상에서 BeautifulSoup이나 Selenium을 활용해서 필요한 데이터를 직접 구축하고, 배포까지는 안 했지만 배포할 수 있는 웹 서비스의 형태로 구성하는 과정이 특히 흥미로웠습니다. 항상 느끼는 거지만 문화 영역은 대부분이 수치화하기 힘든 질적 데이터로 구성되어 있어 접근하는 것이 어..
[Machine Learning & Data Engineering] 시집 데이터를 분류해 추천하는 서비스를 웹으로 구현해보기 - 2 프로젝트 개요 프로젝트 명 : 시를 잊은 그대에게 - 취향에 맞는 시집을 분류해 추천드립니다 프로젝트 기간 : 2022년 6월 22 ~ 2022년 6월 27일 사용 데이터 : 알라딘, DBPia에서 파싱한 데이터 사용 모델 : K-means Clustering 웹 : Flask, Google Data Studio 데이터 전처리 및 특성 공학 이전 장에서 알라딘과 DBPia를 통해 SQLite db에 저장한 파일들을 하나로 통합한 후, 분석에 사용하기 위해 전처리 및 특성 공학을 수행하였습니다. 1) DBPia 검색 결과로 만든 특성의 'None'을 '0'으로 변경 2) 출판사를 분석에 사용하기 위해 메이저 출판사(1: 창비, 문학과지성사, 문학동네, 민음사)와 기타 출판사(0)로 분류. - 시집 출판 기..
[Machine Learning & Data Engineering] 시집 데이터를 분류해 추천하는 서비스를 웹으로 구현해보기 - 1 프로젝트 개요 프로젝트 명 : 시를 잊은 그대에게 - 취향에 맞는 시집을 분류해 추천드립니다 프로젝트 기간 : 2022년 6월 22 ~ 2022년 6월 27일 사용 데이터 : 알라딘, DBPia에서 파싱한 데이터 사용 모델 : K-means Clustering 웹 : Flask, Google Data Studio 문제의식 이 프로젝트는 알라딘에 있는 시집 데이터를 활용해 시집을 분류하고, 분류된 데이터를 바탕으로 좋아하는 시집의 제목을 입력하면 같은 카테고리에 있는 시집을 추천하는 서비스를 제작하는 것을 목표로 시작하였습니다. 1. 영화는 있는데...!! : 잘 나가는 영화 추천 서비스 사실 어떤 컨텐츠를 추천하는 서비스는 AI/빅데이터 분야에서는 전혀 새로운 것이 아닙니다. 대표적인 것이 영화가 있죠...
[Machine Learning] 무엇이 미량영양소의 결핍을 야기하는가? (RandomForestClassifier) -2 지난 글에서 이어집니다. ([Machine Learning] 무엇이 미량영양소의 결핍을 야기하는가? - 1) 프로젝트 개요 프로젝트 명 : 무엇이 미량 영양소(micro-nutritient)의 결핍을 야기하는가? : 미량영양소 섭취와 연관이 있는 특성 분석 프로젝트 진행 기간 : 2022년 5월 19 ~ 2022년 5월 24일 사용 데이터 : NHANES(The National Health and Nutrition Examination Survey) datasets from 2013 ~ 2014. 사용 모델 : Random Forest Classifier, XGBClassifier 분석 모델 설정 이렇게 정리한 데이터를 활용하여 분석 모델을 만들었습니다. 기준 모델 타깃 변수인 미량영양소 섭취 상태의 분..
[Machine Learning] 무엇이 미량영양소의 결핍을 야기하는가? - 1 프로젝트 개요 프로젝트 명 : 무엇이 미량 영양소(micro-nutritient)의 결핍을 야기하는가? : 미량영양소 섭취와 연관이 있는 특성 분석 프로젝트 진행 기간 : 2022년 5월 19 ~ 2022년 5월 24일 사용 데이터 : NHANES(The National Health and Nutrition Examination Survey) datasets from 2013 ~ 2014. 사용 모델 : Random Forest Classifier, XGBClassifier 문제 의식 이 프로젝트는 미국의 보건 통계 자료를 통해 미량 영양소 섭취 상태에 영향을 미치는 요인들을 탐색하는 것을 목표로 진행하였습니다. 그런데 본격적인 분석에 앞서, 이러한 주제로 프로젝트를 진행한 이유를 먼저 이야기할 필요가 ..