CourseScope

Topic modelling for university courses using clustering techniques, with the intent of providing intuitive analytics of course schedules. This NLP model groups courses into similar areas of interests based on significant keywords extracted using TF-IDF vectors.

The sample dataset present was scrapped from Stanford's CS courses using Beautiful Soup, and is used for non-commercial purposes. (https://explorecourses.stanford.edu/search?page=0&catalog=&q=CS&view=catalog&filter-catalognumber-CS=on)

After removing common stop words from the course descriptions, Sklearn is mainly used to vectorize the text inputs, and then clustered based on cosine distances.

Name		Name	Last commit message	Last commit date
Latest commit History 20 Commits
data		data
main		main
.gitignore		.gitignore
README.md		README.md
requirements.txt		requirements.txt
tree_graph.png		tree_graph.png

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

CourseScope

About

Releases

Packages

Languages

shendrew/CourseScope

Folders and files

Latest commit

History

Repository files navigation

CourseScope

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages