Repository contained portfolio of data anlaysis, machine learning & deep learning project and others.
- AI Researcher@BigValue : 2021. 06 - 현재
- DataAnalyst@KyungnamUniv. BigData center : 2019. 9 - 2021. 06
- Intern@서울시 빅데이터 캠퍼스 : 2018. 7 - 2018. 8, 2019. 1 - 2019. 2
- Intern@ACORN MARKETING & RESEARCH CONSULTANTS(HK) LIMITED, KOREA BRANCH : 2018. 1-2018. 2
- Intern@서울 혁신센터 사회혁신 리서치랩 : 2017. 7 - 2017. 8
Statistics
, SNA(Social Network Analysis)
, Graph Neural Networks
, NLP (Natural Language Processing)
, Geospatial AI
공간 데이터 기반 LLM 연구 및 구축
BigValue
- 기간 - 2024. 06 ~
Graph base vehicle control
BigValue
- 기간 - 2024. 01 ~ 2024. 06
- 목적 - GPS 정보 기반 차량 이동 관제
- 사용 기술
- GAT, GraphML, GraphDB, vehicle GPS
- 수행 업무
- Graph Embedding 등록 차량 이동 관제
- GAT, GraphML algorithm 기반 차량 이동 맥락(context) embedding
- Graph statistics 추정
- 성과
- 농림축산검역본부 - 축산 차량 이동에 따른 질병 전파 데이터 분석 모델 연구
Geo-AI 고도화 연구/개발
BigValue
- 기간 - 2023. 02 ~ 2023. 12
- 목적 - Geo-AI 알고리즘 고도화
- 사용 기술
- Attention, GNN, reconstruction learning, pytorch, geopandas
- 수행 업무
- Graph Embedding 기반 잠재 출점지 탐색 algorithm 연구
- Grid2Vec algorithm 기반 유사 부지 탐색
- LLM 기반 주소 매칭 알고리즘 연구
- 성과
- [특허출원] 자연어 기반의 주소 정제 시스템 및 방법
- [특허출원] GEO 인공지능 공간 분석 방법
Geo-AI 기반 매출 예측 및 가맹 점주권역 생성 모델 연구/개발
BigValue
- 기간 - 2021. 10 ~ 2023. 02
- 목적 - Geo-AI 기반 점포 매출 예측 및 점주권 생성 모형 연구/개발
- 사용 기술
- H-DNN, pytorch, geopandas
- 수행 업무
- 신규 점포 입점시 잠재시장 예측 및 잠재 점주권역 생성
- 자연적/사회적 인구 변화를 반영한 미래시점 잠재시장, 잠재 점주권역 생성
- 경쟁업종 유/출입 등 환경 변화에 따른 점주권 변화 시뮬레이션
- AI 기반 신설/이전, 통/폐합 시뮬레이션
- 성과 -
LOTTE LPOINT(POC)
,NH상호금융
,MG새마을금고
,IBK기업은행(POC)
,NIA - 빅데이터플랫폼기반분석서비스
Text summarization
Kyungnam Univ. BigData Center
- 기간 - 2020. 10 ~ 2021. 06
- 목적 - 회의 등에서 발생하는 음성데이터 문서 생성 및 추출요약/생성요약
- 사용 기술
- Python, Tensorflow, Keras
- NLP(Natural Language Processing), NLU(Natural Language Understanding), NLG(Natural Language Generation), PLM base summarization
- 수행 업무
- PM(Project Manger) & TM(Techincal Manager)
- Word Embedding, NLG & NLU modeling
- Git-hub
소상공인을 위한 생활밀착형 챗봇 개발
Kyungnam Univ. BigData center
- 기간 - 2020. 08 ~ 2020. 12.
- 목적 - 사회적 경제 순환 시스템 지원을 위한 커뮤니티 플랫폼 챗봇개발 및 커뮤니티 데이터를 통한 갈등 분석
- 사용 기술
- Python, R, Tensorflow, Keras, Pytorch, PLM
- 수행 업무
- PLM base sentiment classification model build
- Intent classification model build
- NER tagging model build
- PLM base generation (answer) model build
Game Behavior Data Analysis
DACON
- 기간 - 2020. 03 - 2020. 04
- 목적 - 게임 플레이어의 행동 패턴 파악 및 분석을 통한 승자 예측 모델링
- 사용 기술
- R, Python, Tensorflow, Keras
- Permutation Importance, Bayesian Optimization, LightGBM
- 수행 업무
- PM(project manager) & TM(techincal manager)
- EDA(exploratory data analysis)를 통한 파생변수 인사이트 도출, Feature Engineering
- Permutation Importance 활용한 중요변수 추정
- 승자 에측 모델링 (LightGBM algorithm model) 및 모델성능 최적화(Bayesian Optimization algorithm)
- 최종등수 : 30/667
(상위 4.4%)
, AUC = 0.66702
- Git-hub, DACON
원산지 종합 분석 및 단속추천 선제대응 서비스 개발
국립농산물품질관리원
- 기간 - 2019. 9 - 2019. 12
- 목적 - 데이터분석을 통해 위반 단속 패턴 도출, 향후
원산지 단속추천 시스템
개발을 위한 사전기반 구축 목표 - 사용 기술
- R, Python, Tensorflow, Keras, QGIS
- Data Crawling, Machine Learning, Deep Learnin, Kernel Density Estimation
- 수행 업무
- 조사정보의 시계열 자료와 지역 데이터를 기반으로 지역 정보 분석, 통계분석, Machine Learning, Deep learning 등 심층분석 실시
- 범법자의 유형 및 위반이 발생하는 지역적 요인 도출
- 지역, 환경, 업주, 업체특성, 외부요인 변수 등 55개 변수를 사용하여 잠재 위반가능성이 높은 업체, 지역 분석
- Git-hub
시각장애인들을 위한 Smart Glasses 'Eye-B Project'
인공지능 데이터셋 경진대회 (주관 : NIA, SELECTSTAR)
- 기간 - 2020. 1 - 2020. 2
- 목적 - Smart Glasses를 활용하여 거리의 위험요소를 인지, 시각장애인이 스스로 위험요소를 감지 할 수 있도록 도움
- 사용 기술
- R, OpenCV, Tensorflow, Keras
- Deep Learning, Object Detection, YOLO, Data Crawling
- 수행 업무
- R, OpenCV tool을 활용한 Object Detection model 구현
- Train Image Crawling (Bollard, 점자블록, 거시 시설물, 길거리 이미지 등)
- Object Detection Accuracy 향상을 위해 Google ImageDataset API의 이미지를 model에 학습하는 작업 수행
- Git-hub
AI 텍스트 마이닝 감성분석을 통한 채용박람회 활성화 방안
금융산업공익재단 공모전
- 기간 - 2019. 11 - 2019. 12
- 목적 - 채용박람회 단점을 해결, 단순 채용정보 획득을 넘은 개인의 특성을 반영한 맞춤형 온라인 채용박람회 제안
- 사용 기술
- R
- Data Crawling, Machine Learning, NLP
- 수행 업무
- 구직자 분석을 위한 Data Crawling, Data pre-processing
- Natural Language Processing을 통한 Sentiment Analysis
- Git-hub
딥러닝을 이용한 학생 중도탈락 예측
경남대학교
- 기간 - 2019. 7 - 2019. 8
- 목적 - 매년 증가하는 중도탈락율 낮추기 위해 예측에 기초한 선제 관리를 목적으로 함
- 사용 기술
- R, Tensorflow, Keras
- Data Crawling, Machine Learning, Deep Learning, NLP
- 수행 업무
- NLP(Natural Language Processing) 기술을 활용한 단어 관계 도출 (Word2Vec)
- Structured Data + Text Data 를 결합한 Prediction Model
-
- Text Data(학생 상담 내역 기록 등) 기반의 Prediction Modeling (Convolutional Neural Network)
-
- Structured Data(학생정보, 자기평가 지표, 이수내역 등)를 기반한 Prediction Modeling
- Git-hub
사회적 갈들 완화를 위한 최적 흡연시설 입지 선정
서울시 빅데이터 캠퍼스
- 기간 - 2019. 1 - 2019. 2
- 목적 - 유동인구 데이터를 활용한 최적 흡연시설 입지 도출하여 흡연 비흡연 인구간의 갈등을 완화를 목적으로 함
- 사용 기술
- R, QGIS, Hadoop(Distributed Computing)
- Kernel Density Estimation
- 수행 업무
- Distributed Computing System(Hadoop)을 활용한 Data pre-processing (서울시 유동인구 Data 2018. 10 - 2018. 12 (Obs. : 3억건)
- Kernel Density Estimation modeling
- 최적입지 분석
- 성과 -
서울시의회의 흡연시설 설치 관련 법안
의 기초자료로 활용 - Git-hub
여성 소비자연합 C2C 민원 데이터 분석
서울시 빅데이터 캠퍼스, 여성소비자 연합
- 기간 - 2018. 7 - 2018. 8
- 목적 - 민원 분석을 통한 Classification-logic modeling
- 사용 기술
- R
- NPL, Topic modeling
- 수행 업무
- LDA algorithm 을 활용한 주요 Topic 파악
- 의미연결 분석으로 주요 민원 내용의 관계 파악
- Topic model과 의미연결 분석에 기초한 민원 Classification-logic modeling
- 성과 - 서울시 빅데이터 캠퍼스, 한국소비자원의
Mahcine Learning을 활용한 민원분류 모델
의 기초자료 - 서울시 빅데이터 캠퍼스
- 대학교
- 사회학도에서 AI연구원까지 생존일기 : 'ERROR 코드가 강점이 됩니다' Kyungnam University sociology (2023. 06. 07)
- 시각화, 데이터로 이야기하는 법 - Kyungnam University sociology (2021. 06. 03)
- R for DataAnalysis - Kyungnam University sociology (2019 04 ~ 06)
- How to tidying Data with R - Kyungnam University sociology (2019. 12. 5)
- How to Data Crawling with R Selenium - Kyungnam University sociology (2019. 11. 27)
-
사회조사 분석사 2급
-
Google
-
POSTECH
-
etc.
- Changwon Data Analysis Study Group
- Changwon_DataAnalysis_Study_Group 2
- Kaggle Korea Changwon study Group
- OpenCV Study Group
- Kaggle Study
- Book
능숙하게 다룰 수 있는 언어 |
---|