본 경진대회에 참여하는 아라서 팀의 팀원은 다음과 같다. (가나다 순으로 나열)
- 이형석
- 이혜정
- 정중팀
- 최강해 (팀장)
주제: 치매 예방을 위한 라이프로그 치매 분류 모델
본 애플리케이션이 구현되는 모든 과정에서 Python을 주요 프로그래밍 언어로 사용한다.
본 애플리케이션은 주최 측에서 규정한대로 Python 3.6.10 버전을 사용한다.
본 애플리케이션을 구현하는 과정에서 활용 가능한 외부 라이브러리는 제한없이 사용하는 것을 원칙으로 한다.
본 애플리케이션의 소스코드 내에서 활용한 모든 외부 라이브러리는 requirements_***.txt
에 해당 라이브러리 리스트를 저장하여 팀원들에게 공유하여야 한다.
$ pip freeze > requirements_cpu.txt // CPU 전용 컴퓨터
$ pip freeze > requirements_cuda11.txt // CUDA Toolkit 11 버전이 설치된 컴퓨터
requirements_***.txt
에 저장된 외부 라이브러리를 다운로드 받는 명령어는 다음과 같다.
$ pip install -r requirements_cpu.txt // CPU 전용 컴퓨터
$ pip install -r requirements_cuda11.txt // CUDA Toolkit 11 버전이 설치된 컴퓨터
$ python app.py [모델] [훈련/검증]
- Anaconda: Anaconda Inc.에서 개발한 데이터과학용 Python 가상환경 프로그램
- Miniconda: Anaconda Inc.에서 개발한 데이터과학용 Python 가상환경 프로그램 (Anaconda의 최소 설치 버전)
- pyenv (+ pyenv-virtualenv): UNIX 기반의 Python 버전 관리 및 가상환경 구현용 프로그램
Anaconda | Miniconda | pyenv | |
---|---|---|---|
사용자 인터페이스 | --- | --- | --- |
GUI | O | O | O |
Bash | O | O | |
Zsh | O | O | |
운영체제 | --- | --- | --- |
Windows | O | O | |
WSL | O | O | |
MacOS | O | O | O |
Linux | O | O | O |
분류모델의 성능평가는 Macro F1 Score를 사용하여 분류성능을 평가한다.
- True Positive (TP): 실제 참인 값을 참으로 예측한 결과의 집합
- True Negative (TN): 실제 거짓인 값을 거짓으로 예측한 결과의 집합
- False Positive (FP): 실제 거짓인 값을 참으로 예측한 결과의 집합
- False Negative (FN): 실제 참인 값을 거짓으로 예측한 결과의 집합
실제 참 | 실제 거짓 | |
---|---|---|
예측 참 | TP | FP |
예측 거짓 | FN | FP |
정밀도 (Precision)
- 정의
- Precision = TP / (TP + FP)
재현율 (Recall)
- 정의
- Recall = TP / (TP + TN)
Macro F1 Score
- 정의
- F1 score = 2 x (precision x recall) / (precision + recall)
.gitignore
- Git 관련 환경변수 파일
requirements.txt
- 파이썬 라이브러리 종속성 파일