Skip to content

Latest commit

 

History

History
239 lines (202 loc) · 13.4 KB

README.md

File metadata and controls

239 lines (202 loc) · 13.4 KB

Jiseong

Portfolio

Repository contained portfolio of data anlaysis, machine learning & deep learning project and others.

Careers

  • AI Researcher@BigValue : 2021. 06 - 현재
  • DataAnalyst@KyungnamUniv. BigData center : 2019. 9 - 2021. 06
  • Intern@서울시 빅데이터 캠퍼스 : 2018. 7 - 2018. 8, 2019. 1 - 2019. 2
  • Intern@ACORN MARKETING & RESEARCH CONSULTANTS(HK) LIMITED, KOREA BRANCH : 2018. 1-2018. 2
  • Intern@서울 혁신센터 사회혁신 리서치랩 : 2017. 7 - 2017. 8

Interests

Statistics, SNA(Social Network Analysis), Graph Neural Networks, NLP (Natural Language Processing), Geospatial AI


Research Projects

공간 데이터 기반 LLM 연구 및 구축
BigValue

  1. 기간 - 2024. 06 ~

Graph base vehicle control
BigValue

  1. 기간 - 2024. 01 ~ 2024. 06
  2. 목적 - GPS 정보 기반 차량 이동 관제
  3. 사용 기술
    • GAT, GraphML, GraphDB, vehicle GPS
  4. 수행 업무
    • Graph Embedding 등록 차량 이동 관제
    • GAT, GraphML algorithm 기반 차량 이동 맥락(context) embedding
    • Graph statistics 추정
  5. 성과
    • 농림축산검역본부 - 축산 차량 이동에 따른 질병 전파 데이터 분석 모델 연구

Geo-AI 고도화 연구/개발
BigValue

  1. 기간 - 2023. 02 ~ 2023. 12
  2. 목적 - Geo-AI 알고리즘 고도화
  3. 사용 기술
    • Attention, GNN, reconstruction learning, pytorch, geopandas
  4. 수행 업무
    • Graph Embedding 기반 잠재 출점지 탐색 algorithm 연구
    • Grid2Vec algorithm 기반 유사 부지 탐색
    • LLM 기반 주소 매칭 알고리즘 연구
  5. 성과
    • [특허출원] 자연어 기반의 주소 정제 시스템 및 방법
    • [특허출원] GEO 인공지능 공간 분석 방법

Geo-AI 기반 매출 예측 및 가맹 점주권역 생성 모델 연구/개발
BigValue

  1. 기간 - 2021. 10 ~ 2023. 02
  2. 목적 - Geo-AI 기반 점포 매출 예측 및 점주권 생성 모형 연구/개발
  3. 사용 기술
    • H-DNN, pytorch, geopandas
  4. 수행 업무
    • 신규 점포 입점시 잠재시장 예측 및 잠재 점주권역 생성
    • 자연적/사회적 인구 변화를 반영한 미래시점 잠재시장, 잠재 점주권역 생성
    • 경쟁업종 유/출입 등 환경 변화에 따른 점주권 변화 시뮬레이션
    • AI 기반 신설/이전, 통/폐합 시뮬레이션
  5. 성과 - LOTTE LPOINT(POC), NH상호금융, MG새마을금고, IBK기업은행(POC), NIA - 빅데이터플랫폼기반분석서비스

Text summarization
Kyungnam Univ. BigData Center

  1. 기간 - 2020. 10 ~ 2021. 06
  2. 목적 - 회의 등에서 발생하는 음성데이터 문서 생성 및 추출요약/생성요약
  3. 사용 기술
    • Python, Tensorflow, Keras
    • NLP(Natural Language Processing), NLU(Natural Language Understanding), NLG(Natural Language Generation), PLM base summarization
  4. 수행 업무
    • PM(Project Manger) & TM(Techincal Manager)
    • Word Embedding, NLG & NLU modeling
  5. Git-hub

소상공인을 위한 생활밀착형 챗봇 개발
Kyungnam Univ. BigData center

  1. 기간 - 2020. 08 ~ 2020. 12.
  2. 목적 - 사회적 경제 순환 시스템 지원을 위한 커뮤니티 플랫폼 챗봇개발 및 커뮤니티 데이터를 통한 갈등 분석
  3. 사용 기술
    • Python, R, Tensorflow, Keras, Pytorch, PLM
  4. 수행 업무
    • PLM base sentiment classification model build
    • Intent classification model build
    • NER tagging model build
    • PLM base generation (answer) model build

Game Behavior Data Analysis
DACON

  1. 기간 - 2020. 03 - 2020. 04
  2. 목적 - 게임 플레이어의 행동 패턴 파악 및 분석을 통한 승자 예측 모델링
  3. 사용 기술
    • R, Python, Tensorflow, Keras
    • Permutation Importance, Bayesian Optimization, LightGBM
  4. 수행 업무
    • PM(project manager) & TM(techincal manager)
    • EDA(exploratory data analysis)를 통한 파생변수 인사이트 도출, Feature Engineering
    • Permutation Importance 활용한 중요변수 추정
    • 승자 에측 모델링 (LightGBM algorithm model) 및 모델성능 최적화(Bayesian Optimization algorithm)
    • 최종등수 : 30/667 (상위 4.4%), AUC = 0.66702
  5. Git-hub, DACON

원산지 종합 분석 및 단속추천 선제대응 서비스 개발
국립농산물품질관리원

  1. 기간 - 2019. 9 - 2019. 12
  2. 목적 - 데이터분석을 통해 위반 단속 패턴 도출, 향후 원산지 단속추천 시스템 개발을 위한 사전기반 구축 목표
  3. 사용 기술
    • R, Python, Tensorflow, Keras, QGIS
    • Data Crawling, Machine Learning, Deep Learnin, Kernel Density Estimation
  4. 수행 업무
    • 조사정보의 시계열 자료와 지역 데이터를 기반으로 지역 정보 분석, 통계분석, Machine Learning, Deep learning 등 심층분석 실시
    • 범법자의 유형 및 위반이 발생하는 지역적 요인 도출
    • 지역, 환경, 업주, 업체특성, 외부요인 변수 등 55개 변수를 사용하여 잠재 위반가능성이 높은 업체, 지역 분석
  5. Git-hub

시각장애인들을 위한 Smart Glasses 'Eye-B Project'
인공지능 데이터셋 경진대회 (주관 : NIA, SELECTSTAR)

  1. 기간 - 2020. 1 - 2020. 2
  2. 목적 - Smart Glasses를 활용하여 거리의 위험요소를 인지, 시각장애인이 스스로 위험요소를 감지 할 수 있도록 도움
  3. 사용 기술
    • R, OpenCV, Tensorflow, Keras
    • Deep Learning, Object Detection, YOLO, Data Crawling
  4. 수행 업무
    • R, OpenCV tool을 활용한 Object Detection model 구현
    • Train Image Crawling (Bollard, 점자블록, 거시 시설물, 길거리 이미지 등)
    • Object Detection Accuracy 향상을 위해 Google ImageDataset API의 이미지를 model에 학습하는 작업 수행
  5. Git-hub

AI 텍스트 마이닝 감성분석을 통한 채용박람회 활성화 방안
금융산업공익재단 공모전

  1. 기간 - 2019. 11 - 2019. 12
  2. 목적 - 채용박람회 단점을 해결, 단순 채용정보 획득을 넘은 개인의 특성을 반영한 맞춤형 온라인 채용박람회 제안
  3. 사용 기술
    • R
    • Data Crawling, Machine Learning, NLP
  4. 수행 업무
    • 구직자 분석을 위한 Data Crawling, Data pre-processing
    • Natural Language Processing을 통한 Sentiment Analysis
  5. Git-hub

딥러닝을 이용한 학생 중도탈락 예측
경남대학교

  1. 기간 - 2019. 7 - 2019. 8
  2. 목적 - 매년 증가하는 중도탈락율 낮추기 위해 예측에 기초한 선제 관리를 목적으로 함
  3. 사용 기술
    • R, Tensorflow, Keras
    • Data Crawling, Machine Learning, Deep Learning, NLP
  4. 수행 업무
    • NLP(Natural Language Processing) 기술을 활용한 단어 관계 도출 (Word2Vec)
    • Structured Data + Text Data 를 결합한 Prediction Model
      • Text Data(학생 상담 내역 기록 등) 기반의 Prediction Modeling (Convolutional Neural Network)
      • Structured Data(학생정보, 자기평가 지표, 이수내역 등)를 기반한 Prediction Modeling
  5. Git-hub

사회적 갈들 완화를 위한 최적 흡연시설 입지 선정
서울시 빅데이터 캠퍼스

  1. 기간 - 2019. 1 - 2019. 2
  2. 목적 - 유동인구 데이터를 활용한 최적 흡연시설 입지 도출하여 흡연 비흡연 인구간의 갈등을 완화를 목적으로 함
  3. 사용 기술
    • R, QGIS, Hadoop(Distributed Computing)
    • Kernel Density Estimation
  4. 수행 업무
    • Distributed Computing System(Hadoop)을 활용한 Data pre-processing (서울시 유동인구 Data 2018. 10 - 2018. 12 (Obs. : 3억건)
    • Kernel Density Estimation modeling
    • 최적입지 분석
  5. 성과 - 서울시의회의 흡연시설 설치 관련 법안의 기초자료로 활용
  6. Git-hub

여성 소비자연합 C2C 민원 데이터 분석
서울시 빅데이터 캠퍼스, 여성소비자 연합

  1. 기간 - 2018. 7 - 2018. 8
  2. 목적 - 민원 분석을 통한 Classification-logic modeling
  3. 사용 기술
    • R
    • NPL, Topic modeling
  4. 수행 업무
    • LDA algorithm 을 활용한 주요 Topic 파악
    • 의미연결 분석으로 주요 민원 내용의 관계 파악
    • Topic model과 의미연결 분석에 기초한 민원 Classification-logic modeling
  5. 성과 - 서울시 빅데이터 캠퍼스, 한국소비자원의 Mahcine Learning을 활용한 민원분류 모델의 기초자료
  6. 서울시 빅데이터 캠퍼스

Lectures


Certification


Activity


Programming Languages

능숙하게 다룰 수 있는 언어