Skip to content

利用python爬虫从日本雅虎网站获取新闻(政治,经济,体育等类别),对新闻文本做相似度计算,训练新闻分类模型

Notifications You must be signed in to change notification settings

kongliang2015/YahooNews_Classification

Repository files navigation

YahooNews Classification

##(1)利用python爬虫从日本雅虎网站获取新闻(政治,经济,体育等类别),使用Mecab做日文分词。

##(2)对分词结果用机器学习包sklearn(SVM等分类器),深度学习工具Keras(tensorflow)的CNN,训练分类模型。

##(3)使用自然语言处理工具Gensim,训练Word2Vec,实现新闻相似度计算和词汇相似度计算

About

利用python爬虫从日本雅虎网站获取新闻(政治,经济,体育等类别),对新闻文本做相似度计算,训练新闻分类模型

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published